F5 E NVIDIA Avançam A Economia Da AI Factory Com Novas Capacidades Para Inferência De IA Acelerada

(MENAFN- Asdaf News) ** Dubai – Asdaf News:**

F5 (NASDAQ: FFIV), líder global na entrega e segurança de todas as aplicações e APIs, anunciou hoje capacidades expandidas na sua colaboração contínua.

A integração expandida combina o F5 BIG-IP Next para Kubernetes.

Nos sistemas de IA, tokens representam a unidade mensurável de output de IA — as palavras, símbolos ou fragmentos de dados gerados e processados durante a inferência. O volume e a velocidade de produção de tokens determinam, em última análise, a experiência do utilizador, a eficiência da infraestrutura e a receita por acelerador.

À medida que empresas e fornecedores de GPUaaS correm para monetizar a IA e passar de experimentação para serviços geradores de receita, a eficiência da infraestrutura tornou-se uma métrica fundamental. O sucesso é cada vez mais medido não apenas pela capacidade de GPU implantada, mas pela economia de tokens, throughput sustentado, tempo até ao primeiro token (TTFT), custo por token e receita por GPU acelerador. A solução conjunta da F5 e NVIDIA foi desenhada para abordar diretamente estas métricas.

** Otimização da tokenómica através de infraestrutura de IA inteligente**

A mudança de inferência centrada na aplicação para fluxos de trabalho de IA orientados por agentes exige novas abordagens arquitetónicas para otimizar o throughput de tokens e reduzir custos. O BIG-IP Next para Kubernetes agora utiliza estatísticas NIM da NVIDIA, sinais de runtime Dynamo e telemetria de GPU para tomar decisões de roteamento conscientes de inferência antes da execução. Ao corresponder cargas de trabalho aos aceleradores mais adequados em tempo real, a solução aumenta a utilização sustentada, reduz a latência e a re-computação.

“Infraestrutura de IA já não se resume ao acesso a GPU ou à escalabilidade das suas implantações. Evoluiu para maximizar a produção económica por acelerador,” disse Kunal Anand, Diretor de Produto da F5. “Juntamente com a NVIDIA, estamos a permitir que fábricas de IA tratem a produção de tokens como uma métrica empresarial mensurável. O BIG-IP Next para Kubernetes fornece a inteligência e governança necessárias para aumentar o rendimento das GPUs, reduzir o custo por token e escalar plataformas de IA partilhadas com confiança.”

** Eficiência de infraestrutura validada: uma melhoria estrutural**

Os números de desempenho falam por si. Em testes validados pelo The Tolly Group, o BIG-IP Next para Kubernetes, acelerado pelos DPU BlueField-3 da NVIDIA, proporcionou até 40% de aumento no throughput de tokens, um TTFT 61% mais rápido e uma redução de 34% na latência global de pedidos.

Estes ganhos não são incrementais. Ao descarregar redes, TLS/encriptação, balanceamento de carga consciente de IA e gestão de tráfego para os DPU BlueField-3 da NVIDIA, o BIG-IP Next para Kubernetes preserva a capacidade da CPU do host e liberta as GPUs para fazerem o que foram criadas: inferência sustentada e de alto throughput em escala. O resultado é uma melhor utilização da GPU, redução de atrasos na fila e aumento do rendimento de tokens — permitindo um custo por token mais baixo dentro de uma infraestrutura fixa. Criticamente, não foram necessárias modificações nos modelos, tornando estes ganhos imediatamente implementáveis na infraestrutura existente de fábricas de IA. Para empresas e fornecedores NeoCloud que competem na economia de tokens, esta é a diferença entre uma infraestrutura que limita a produção de IA e uma que a acelera.

“NVIDIA, com a sua infraestrutura de computação acelerada, combinada com a Plataforma de Entrega e Segurança de Aplicações consciente de IA da F5, desbloqueia uma economia de tokens superior — oferecendo inferência escalável e económica sem alterar os modelos,” disse Kevin Deierling, SVP de Redes na NVIDIA. “Juntos, a F5 e a NVIDIA capacitam as empresas a escalar a inferência de fábricas de IA de forma eficiente e económica.”

** Construído para IA orientada por agentes e plataformas de IA multi-inquilino**

As cargas de trabalho modernas de IA são cada vez mais orientadas por agentes, persistentes e conscientes do contexto. Exigem controlo inteligente de tráfego que o balanceamento de carga tradicional não consegue fornecer. A solução aprimorada do BIG-IP Next para Kubernetes agora suporta:

  • Roteamento consciente de inferência para fluxos de trabalho de IA orientados por agentes
  • Integração com a Plataforma NVIDIA DOCA (DPF) para simplificar a implantação e gestão do ciclo de vida do DPU BlueField
  • EVPN-VXLAN com VRFs dinâmicos para multi-inquilinato seguro a nível de rede
  • Segurança integrada, governação de tokens e observabilidade em ambientes de IA no Kubernetes

Estas capacidades permitem às empresas e fornecedores NeoCloud partilhar de forma segura a infraestrutura de GPU entre unidades de negócio ou clientes externos, mantendo isolamento de desempenho e níveis de serviço previsíveis.

** Um plano de controlo para a economia de fábricas de IA**

A F5 e a NVIDIA fornecem às empresas ferramentas validadas e melhores práticas para otimizar a arquitetura de inferência. Com estes avanços, o BIG-IP Next para Kubernetes está posicionado para se tornar um plano de controlo estratégico para a economia de fábricas de IA, regulando o consumo de tokens, otimizando fluxos de tráfego e maximizando o retorno sobre o investimento na infraestrutura.

Em vez de sobreprovisionar para compensar ineficiências, as organizações podem agora extrair maior valor económico de cada GPU já em produção. O resultado é uma maior receita por GPU, menor overhead operacional e serviços de IA escaláveis, preparados para crescimento sustentado. Ao combinar a telemetria de infraestrutura e aceleração DPU da NVIDIA com a inteligência de tráfego e capacidades de segurança da F5, as empresas estão a ajudar a transformar fábricas de IA em plataformas eficientes e monetizáveis, preparadas para a era dos agentes.

** Materiais de apoio**

** Blog:** ** As fábricas de IA precisam de infraestrutura inteligente. Novos resultados do The Tolly Group explicam porquê.** ** Relatório:** ** Testes independentes do Tolly: F5 BIG-IP Next para Kubernetes**


Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar