财新传媒
环科 > 要闻 > 正文

DeepSeek登上《自然》封面 梁文锋团队详解大模型如何试错自主学习

文|财新 徐路易
2025年09月18日 20:56
DeepSeek团队提出,大语言模型(LLMs)不必依赖人工示例或复杂指令,也能通过试错式强化学习,自主学会生成推理过程
2025年1月,中国团队发布DeepSeek-R1,随即引发全球科技公司股价震荡,它显示了开源和低成本可以实现强推理能力。图:IC photo

  【财新网】9月18日,中国DeepSeek-AI团队在知名期刊《自然》上,以封面报道的形式刊发了DeepSeek-R1的科学原理,提出大语言模型(LLMs)不必依赖人工示例或复杂指令,也能通过试错式强化学习,自主学会生成推理过程。且AI还会自发进行“自省”,被认为是人工智能(AI)探索人类之外思维路径的重要迹象。DeepSeek创始人梁文锋为该论文通讯作者。

  相关人士向财新表示,这篇论文经由超过5个同行进行评审获得一致意见后才发出,DeepSeek-R1也是首个在国际权威期刊上正式发表、并伴随模型权重与训练细节公开的大语言模型。出于计算机科学的文化习惯或公司知识产权等需要,其他知名大模型如GPT-3、GPT-4、Claude、Gemini等在技术上具有巨大影响力,但主要以arXiv技术报告或公司白皮书形式发布,未经过传统学术期刊同行评审和正式刊载。

  推荐进入财新数据库,可随时查阅宏观经济、股票债券、公司人物,财经数据尽在掌握。

责任编辑:冯禹丁 | 版面编辑:李东昊
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅