Gate 广场「创作者认证激励计划」优质创作者持续招募中!
立即加入,发布优质内容,参与活动即可瓜分月度 $10,000+ 创作奖励!
认证申请步骤:
1️⃣ 打开 App 首页底部【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】,提交申请等待审核
立即报名:https://www.gate.com/questionnaire/7159
豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000 丰厚奖励等你拿!
活动详情:https://www.gate.com/announcements/article/47889
#打榜优质内容
中国的人工智能DeepSeek颠覆了市场:1万亿美元可能蒸发
Nvidia以其芯片被视为人工智能技术的支柱而引领了人工智能股票的繁荣。这家总部位于加利福尼亚的芯片公司的股价在周一市前交易中下跌了10%。
中国人工智能实验室DeepSeek的自命名大语言模型(LLM)成为美国OpenAI公司的ChatGPT的主要竞争对手之一,同时也震动了全球科技股市场。
上周发布的DeepSeek-R1大型语言模型表现出与ChatGPT的最新模型相当的性能,但成本更低,这导致了人工智能芯片巨头英伟达的价值下跌。(LLM)
据认为,ChatGPT处理培训数据需要10,000个Nvidia图形处理单元(GPU)。DeepSeek工程师表示,他们只用2,000个GPU获得了类似的结果。
Nvidia作为人工智能技术的支柱,曾引领人工智能股票的爆发。这家总部位于加利福尼亚的芯片公司的股票在周一盘前交易中下跌了10%。
顺便说一句,DeepSeek的移动应用在周一超过了ChatGPT,成为了美国苹果应用商店中评分最高的免费应用。
据路透社报道,该应用程序与该项目的先前版本DeepSeek-V3兼容。
数据研究公司Sensor Tower指出,1月10日推出的这款型号在美国用户中变得流行。
最近发布的DeepSeek R1模型受到研究人员特别是在处理复杂的数学和编码推理任务方面的能力所赞扬。该模型采用类似于ChatGPT o1的“思维链”方法,通过逐步处理查询来解决问题。
开源模型
此外,DeepSeek-R1主要是以开源方式发布的。也就是说,任何人都可以访问该车辆的代码并使用这些代码来个性化LLM。而培训数据则是专利的。
另一方面,OpenAI 曾经以封闭方式推出了 o1 模型,目前仅以每月 20 到 200 美元的套餐售予用户。
DeepSeek员工和西北大学计算机科学博士生Zihan Wang在接受MIT Technology Review采访时表示,中国不得不采取创新的方式应对制裁。
因此,DeepSeek不得不重新调整培训过程以创建R1模型。 因为芯片公司Nvidia为中国市场销售的芯片的性能仅相当于公司最佳产品速度的一半。 因此,为了减轻Nvidia GPU上的负载,中国调整了培训过程以适应其购买的图形处理单元( GPU )。