商汤“书生・浦语”2.0 大语言模型开源：200K 上下文，一次可读 30 万汉字

2024-01-18 07:11:06

巴比特讯商汤科技与上海 AI 实验室联合香港中文大学和复旦大学今日发布了新一代大语言模型书生・浦语 2.0（InternLM2）。

据介绍，InternLM2 是在 2.6 万亿 token 的语料上训练得到的。沿袭第一代书生・浦语（InternLM）设定，InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本，继续开源，提供免费商用授权。目前，浦语背后的数据清洗过滤技术已经历三轮迭代升级，号称仅使用约 60% 的训练数据即可达到使用第二代数据训练 1T tokens 的性能表现。

据介绍，通过拓展训练窗口大小和位置编码改进，InternLM2 支持 20 万 tokens 的上下文，能够一次性接受并处理约 30 万汉字（约五六百页的文档）的输入内容。InternLM2 在 20B 参数的中等规模上，整体表现接近 ChatGPT。

TOKEN-2.39%

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

0/400

暂无评论

WendyCS

热门 Gate Fun查看更多
1GMGMEME
市值:$125.2万持有人数:5290
2芝麻开门芝麻开门
市值:$60.7万持有人数:137
3GCATGCAT
市值:$46.3万持有人数:10606
4芝麻人生芝麻人生
市值:$5.6万持有人数:20004
5GDOGGdog
市值:$40万持有人数:22769