【财新网】9月18日,中国DeepSeek-AI团队在知名期刊《自然》上,以封面报道的形式刊发了DeepSeek-R1的科学原理,提出大语言模型(LLMs)不必依赖人工示例或复杂指令,也能通过试错式强化学习,自主学会生成推理过程。且AI还会自发进行“自省”,被认为是人工智能(AI)探索人类之外思维路径的重要迹象。DeepSeek创始人梁文锋为该论文通讯作者。
相关人士向财新表示,这篇论文经由超过5个同行进行评审获得一致意见后才发出,DeepSeek-R1也是首个在国际权威期刊上正式发表、并伴随模型权重与训练细节公开的大语言模型。出于计算机科学的文化习惯或公司知识产权等需要,其他知名大模型如GPT-3、GPT-4、Claude、Gemini等在技术上具有巨大影响力,但主要以arXiv技术报告或公司白皮书形式发布,未经过传统学术期刊同行评审和正式刊载。



















京公网安备 11010502034662号 