DeepSeek团队研究：相信长期主义开源理念可扩展大语言模型

文｜财新徐路易

2025年01月28日 15:53

DeepSeek大语言模型项目团队在论文中特别提到，DeepSeek大语言模型是一个长期项目，致力于推进发展开源语言模型。长期主义和开源能够支持持续创新，促进社区合作，并确保模型能够适应新的数据、技术和研究见解

: 资料图：DeepSeek。图：视觉中国

相关报道: DeepSeek在美引起更广泛讨论特朗普称给美国产业界敲响警钟; 让美国AI圈陷入恐慌的DeepSeek，是颠覆者还是好学生; DeepSeek恐慌触发纳指暴跌逾3% 英伟达抹去5890亿美元市值创纪录; DeepSeek走红后美国科技股暴跌美国人到底在担心什么？; GPT革命｜DeepSeek新模型引热议海外关注中国AI追赶路径

　　【财新网】中国人工智能初创企业DeepSeek（深度求索）正给全球科技市场带来震撼。2025年初，DeepSeek发布新一代推理模型R1，该模型在性能上与OpenAI的o1模型相当，训练成本却仅为557.6万美元，仅为Meta训练大模型纯算力成本的1/10。这一突破在全球AI领域和资本市场引发了巨大震动。R1模型的开源、低成本和高性能也成为全球技术界的焦点。

　　2024年1月，DeepSeek大语言模型团队曾在预印本平台ArXiv发表论文《以长期主义扩展开源语言模型》，深入研究并探讨了他们对于开源模型规模效应（scaling law）的理解。基于对规模效应的研究和理解，团队实现了DeepSeek Chat模型，此后发布的多个升级版本至R1，都是基于DeepSeek Chat模型逐步升级改造而来。

本文共计1791字订阅后继续阅读

登录后获取已订阅的阅读权限

财新通会员
可畅读全文

订阅/会员升级

　　推荐进入财新数据库，可随时查阅宏观经济、股票债券、公司人物，财经数据尽在掌握。

责任编辑：冯禹丁 | 版面编辑：刘春辉

财新网友58N

我有种ds是第二个瑞幸的感觉

2025-02-07 06:36 · 广东

· 回复

mamahuhu123

目前中国人工智能最后的短板是半导体硬件了，把这个突破了美国就没什么可限制的了

2025-01-30 07:43 · 江苏

7 · 回复

赢财小王

数据的质量而非数据的规模，可以更有效地分配计算预算到模型规模。

2025-01-30 04:34 · 江苏

2 · 回复

MrGold968

长期主义开源理念。

2025-01-29 12:56 · 贵州

kobayashishingo

2025-01-29 10:17 · 广东

无业无求

通过这轮预言虽然可以观察到对美欧的影响，但也提前暴露了路径，他们国家安全专家会提前开始思考对策。到了中美一战时，这个套路估计用途就不大了。

2025-01-29 10:04 · 福建

1 · 回复

游侠行天下

创新有巨大的偶然性！除了鼓励更多的人和公司参与别无他法！

2025-01-29 09:40 · 中国

偷懒的鱼

deepseek只是作为量化基金公司日常研发迭代自己的量化模型的意外产物，和伟哥的诞生同理，这也是之所以这么重量的产品发布前业内没有透露一点风声的原因。本身公司体量小，要出成绩自然习惯性多线并发剑走偏锋，这种公司对于研发失败是具有高得多的可接受性，另外量化交易模型本身也不太适合传统ai的SFT训练模式，所以综合来看拿来对比结果高确定性的传统ai公司模式其实并不合适。还有这个公司原型本身也并不是专业的ai公司，技术基础和体量本身也不适合长期和行业巨头同跑道正常肉搏，更不可能长期指望这种意外式收获，所以开源也几乎是后期维持竞争能力的唯一选择。不过这次发布前这公司应该大概率提前挂杠杆做空了美股相关概念股，这把应该是赚大了

2025-01-29 09:05 · 海南

9 · 回复

财新网友UQjUp2
你检索一下财新是从去年何时开始系列跟进报道DeepSeek的相关新闻的，就知道不是突然出现的了，第一次出名是V2版本，造成国内大厂的AI的api接口直线下降数倍，第二次是V3版本，然后才是这次席卷全球的R1
2025-01-29 10:54 · 北京
12 · 回复
财新网友u7d8du
外行就不能先了解了解在发表言论吗，没透露风声都出来了，早在r1发布前deepseek就是业内有名的黑马了，最早国内的大模型集体降价就是deepseek发起的。
2025-02-01 11:00 · 浙江
2 · 回复

linlin3930

整体使用感受还可以，提问的问题质量也很关键，希望能存活下去

2025-01-29 07:24 · 福建

老中医骗子

我问的问题，deepseek都说对不起，很有礼貌。

2025-01-29 07:21 · 云南

12 · 回复

DeepSeek团队研究：相信长期主义开源理念可扩展大语言模型

推荐阅读

评论区 28

图片推荐

视听推荐

编辑推荐

财新名家

视频

博客

最新文章