【财新网】中国人工智能初创企业DeepSeek(深度求索)正给全球科技市场带来震撼。2025年初,DeepSeek发布新一代推理模型R1,该模型在性能上与OpenAI的o1模型相当,训练成本却仅为557.6万美元,仅为Meta训练大模型纯算力成本的1/10。这一突破在全球AI领域和资本市场引发了巨大震动。R1模型的开源、低成本和高性能也成为全球技术界的焦点。
2024年1月,DeepSeek大语言模型团队曾在预印本平台ArXiv发表论文《以长期主义扩展开源语言模型》,深入研究并探讨了他们对于开源模型规模效应(scaling law)的理解。基于对规模效应的研究和理解,团队实现了DeepSeek Chat模型,此后发布的多个升级版本至R1,都是基于DeepSeek Chat模型逐步升级改造而来。
我有种ds是第二个瑞幸的感觉
目前中国人工智能最后的短板是半导体硬件了,把这个突破了美国就没什么可限制的了
数据的质量而非数据的规模,可以更有效地分配计算预算到模型规模。
长期主义开源理念。
DeepSeek大语言模型项目团队在论文中特别提到,DeepSeek大语言模型是一个长期项目,致力于推进发展开源语言模型。长期主义和开源能够支持持续创新,促进社区合作,并确保模型能够适应新的数据、技术和研究见解
通过这轮预言虽然可以观察到对美欧的影响,但也提前暴露了路径,他们国家安全专家会提前开始思考对策。到了中美一战时,这个套路估计用途就不大了。
创新有巨大的偶然性!除了鼓励更多的人和公司参与别无他法!
deepseek只是作为量化基金公司日常研发迭代自己的量化模型的意外产物,和伟哥的诞生同理,这也是之所以这么重量的产品发布前业内没有透露一点风声的原因。本身公司体量小,要出成绩自然习惯性多线并发剑走偏锋,这种公司对于研发失败是具有高得多的可接受性,另外量化交易模型本身也不太适合传统ai的SFT训练模式,所以综合来看拿来对比结果高确定性的传统ai公司模式其实并不合适。还有这个公司原型本身也并不是专业的ai公司,技术基础和体量本身也不适合长期和行业巨头同跑道正常肉搏,更不可能长期指望这种意外式收获,所以开源也几乎是后期维持竞争能力的唯一选择。不过这次发布前这公司应该大概率提前挂杠杆做空了美股相关概念股,这把应该是赚大了
你检索一下财新是从去年何时开始系列跟进报道DeepSeek的相关新闻的,就知道不是突然出现的了,第一次出名是V2版本,造成国内大厂的AI的api接口直线下降数倍,第二次是V3版本,然后才是这次席卷全球的R1
外行就不能先了解了解在发表言论吗,没透露风声都出来了,早在r1发布前deepseek就是业内有名的黑马了,最早国内的大模型集体降价就是deepseek发起的。
整体使用感受还可以,提问的问题质量也很关键,希望能存活下去
我问的问题,deepseek都说对不起,很有礼貌。