Anthropic Apresenta Claude Sonnet 4.6, Oferecendo Desempenho Quase‑Ópera e Capacidades de Contexto Longo Expandidas

Resumidamente

Claude Sonnet 4.6 da Anthropic apresenta uma grande atualização que oferece desempenho quase ao nível do Opus, capacidades aprimoradas de codificação e uso de computador, e uma janela de contexto de um milhão de tokens para todos os utilizadores ao mesmo preço da versão anterior.

Anthropic Unveils Claude Sonnet 4.6, Delivering Near‑Opus Performance And Expanded Long‑Context Capabilities

A empresa de segurança e investigação em IA Anthropic anunciou a introdução do Claude Sonnet 4.6, considerado o seu modelo Sonnet mais capaz até à data. A atualização é apresentada como uma melhoria completa em codificação, uso de computador, raciocínio de longo contexto, planeamento de agentes, trabalho de conhecimento e design, com uma janela de contexto de um milhão de tokens disponível em fase beta. Para utilizadores nos planos Free e Pro, o Sonnet 4.6 passa a ser o modelo padrão no claude.ai e Claude Cowork, com preços inalterados em relação ao Sonnet 4.5.

A atualização é posicionada como um passo que traz desempenho de alta gama para um público mais amplo. Desenvolvedores que testaram o modelo precocemente relataram que melhorias na consistência, seguimento de instruções e compreensão do contexto tornaram-no preferível não só ao Sonnet 4.5, mas, em muitos casos, ao mais avançado Opus 4.5 da Anthropic, do final de 2025. Tarefas que anteriormente exigiam um sistema de classe Opus—particularmente aquelas relacionadas com fluxos de trabalho de escritório do mundo real—agora são apresentadas como alcançáveis com o Sonnet 4.6. A empresa também destaca um salto notável nas capacidades de uso de computador, uma área onde os modelos Sonnet anteriores ficavam atrás.

A Anthropic enfatiza que o modelo passou por avaliações extensas de segurança. Investigadores internos descreveram o Sonnet 4.6 como demonstrando comportamentos de segurança fortes e sem sinais importantes de desalinhamento de alto risco, um ponto que a empresa usa para reforçar a sua posição mais ampla em torno do desenvolvimento responsável de IA.

A discussão sobre as capacidades de uso de computador reflete um argumento mais amplo sobre o valor de sistemas de IA que podem operar software diretamente, em vez de através de APIs. A Anthropic observa que muitas organizações dependem de ferramentas legadas que não podem ser facilmente automatizadas, e que um modelo capaz de interagir com um computador como um humano pode reduzir a necessidade de integrações personalizadas.

Benchmarks como o OSWorld, que simulam ambientes de software reais, mostram ganhos constantes ao longo de dezasseis meses de desenvolvimento do Sonnet. Utilizadores iniciais do Sonnet 4.6 relatam que o modelo agora consegue lidar com tarefas como navegar por folhas de cálculo complexas ou preencher formulários web de múltiplas etapas a um nível próximo do humano, mesmo que ainda fique atrás de utilizadores especialistas. Ao mesmo tempo, a empresa reconhece riscos como ataques de injeção de prompts e afirma uma resistência melhorada em comparação com versões anteriores.

Sonnet 4.6 Avança na Qualidade do Código, Raciocínio e Uso de Ferramentas

Para além do uso de computador, a Anthropic relata melhorias gerais em vários benchmarks. No Claude Code, os utilizadores preferiram o Sonnet 4.6 ao Sonnet 4.5 na maioria dos testes, citando melhor leitura de contexto, redução de duplicações e execução mais fiável de múltiplas etapas. Muitos também preferiram-no ao Opus 4.5, descrevendo-o como menos propenso a overengineering e mais consistente no seguimento de instruções. A janela de contexto expandida permite que o modelo trabalhe com bases de código inteiras ou grandes coleções de investigação, e a Anthropic destaca o seu desempenho na simulação Vending‑Bench Arena, onde o modelo adotou uma estratégia de investimento a longo prazo que superou os concorrentes.

A empresa nota que os primeiros clientes observaram melhorias em áreas como desenvolvimento de front-end, análise financeira e qualidade do design visual. O Sonnet 4.6 também chega com atualizações na plataforma de desenvolvimento Claude e na API, incluindo modos de pensamento adaptativos e estendidos, compactação de contexto, processamento melhorado de pesquisa web e capacidades expandidas de uso de ferramentas. O modelo está agora disponível em todos os planos Claude, incluindo o nível gratuito, e pode ser acessado através do Claude Cowork, Claude Code, API e principais plataformas de cloud.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar

Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)