财新传媒

环科

试听

T中

DeepSeek团队研究：相信长期主义开源理念可扩展大语言模型

文｜财新徐路易

2025年01月28日 15:53

DeepSeek大语言模型项目团队在论文中特别提到，DeepSeek大语言模型是一个长期项目，致力于推进发展开源语言模型。长期主义和开源能够支持持续创新，促进社区合作，并确保模型能够适应新的数据、技术和研究见解

原图资料图：DeepSeek。图：视觉中国

　　【财新网】中国人工智能初创企业DeepSeek（深度求索）正给全球科技市场带来震撼。2025年初，DeepSeek发布新一代推理模型R1，该模型在性能上与OpenAI的o1模型相当，训练成本却仅为557.6万美元，仅为Meta训练大模型纯算力成本的1/10。这一突破在全球AI领域和资本市场引发了巨大震动。R1模型的开源、低成本和高性能也成为全球技术界的焦点。

　　2024年1月，DeepSeek大语言模型团队曾在预印本平台ArXiv发表论文《以长期主义扩展开源语言模型》，深入研究并探讨了他们对于开源模型规模效应（scaling law）的理解。基于对规模效应的研究和理解，团队实现了DeepSeek Chat模型，此后发布的多个升级版本至R1，都是基于DeepSeek Chat模型逐步升级改造而来。

本文共计1791字订阅后继续阅读

登录后获取已订阅的阅读权限

财新通会员
可畅读全文

订阅/会员升级

您正在阅读

DeepSeek团队研究：相信长期主义开源理念可扩展大语言模型

￥0 购买单篇继续阅读

恭喜购买成功

有效期：-

您可在个人中心 - 我的权限 - 单篇找到购买的文章

您正在阅读

DeepSeek团队研究：相信长期主义开源理念可扩展大语言模型

￥0 购买单篇继续阅读

限时优惠，共可读 1 篇相关稿件

我已订阅，切换账号登录

您已经购买了次单篇文章
订阅后阅读更优惠

日更新文章超50篇每篇文章不到5分钱

坚持0元购买单篇

推荐进入财新数据库，可随时查阅宏观经济、股票债券、公司人物，财经数据尽在掌握。

责任编辑：冯禹丁 | 版面编辑：刘春辉

相关阅读

: DeepSeek在美引起更广泛讨论特朗普称给美国产业界敲响警钟
2025年01月28日APP打开

: 让美国AI圈陷入恐慌的DeepSeek，是颠覆者还是好学生
2025年01月28日APP打开

: DeepSeek恐慌触发纳指暴跌逾3% 英伟达抹去5890亿美元市值创纪录
2025年01月28日APP打开

: DeepSeek走红后美国科技股暴跌美国人到底在担心什么？
2025年01月27日APP打开

: GPT革命｜DeepSeek新模型引热议海外关注中国AI追赶路径
2025年01月26日APP打开

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可，禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载，请发邮件至hello@caixin.com，获得书面确认及授权后，方可转载。

推荐阅读

: 中美关税摩擦缓和美股收复失地创下近月最大单日涨幅
2025年05月12日

: 美国对华锂电池关税大幅下调锂电行业对美出口转乐观
2025年05月12日

: 中美联合声明：相互取消部分加征关税继续协商解决关切
2025年05月12日

: 泽连斯基喊话普京5月15日亲自至土耳其谈判
2025年05月12日

: 香港资本市场的传奇人物大卫·韦伯的生前告别
2025年05月12日

财新移动

发表评论得积分

28条评论

收藏

分享

取消

发送

注册

App 内打开