O modelo de linguagem grande "Shusheng Puyu" 2.0 da SenseTime é de código aberto: contexto de 200K, 300.000 caracteres chineses podem ser lidos de cada vez

Bit Pakistan – SenseTime e Shanghai AI Lab, juntamente com a Universidade Chinesa de Hong Kong e a Universidade Fudan, lançaram hoje uma nova geração do modelo de linguagem grande Scholar Puyu 2.0 (InternLM2).

De acordo com relatórios, o InternLM2 é treinado em um corpus de 2,6 trilhões de tokens. Seguindo a configuração da primeira geração de estudiosos e Puyu (InternLM), InternLM2 inclui duas especificações de parâmetros de 7B e 20B, bem como as versões base e diálogo, que continuam a ser de código aberto e fornecer licenças comerciais gratuitas. Atualmente, a tecnologia de limpeza e filtragem de dados por trás do Puyu passou por três rodadas de atualizações iterativas, e afirma ser capaz de alcançar o desempenho de tokens 1T de treinamento com dados de segunda geração usando apenas cerca de 60% dos dados de treinamento.

De acordo com relatórios, através da expansão do tamanho da janela de treinamento e melhorias de codificação de posição, o InternLM2 suporta o contexto de 200.000 tokens, e é capaz de aceitar e processar o conteúdo de entrada de cerca de 300.000 caracteres chineses (cerca de quinhentas ou seiscentas páginas de documentos) ao mesmo tempo. O InternLM2 está próximo do desempenho geral do ChatGPT em uma escala média de 20B.

TOKEN-2.39%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)