数据私房课会议 Promotion 运动家企业用户应用下载帮助网上有害信息举报专区

财新传媒

环科 > 要闻 > 正文

发表评论
分享到微信朋友圈
新浪转发

研究：GPT-4可能在变“笨” 解数学题准确率跌至2.4%

文｜财新周芊岍（实习），徐路易

2023年07月27日 08:13

研究发现，GPT-3.5和GPT-4在某些性能上正在变差，尤其是GPT-4求解数学问题的能力。OpenAI公司回应称，新版本的模型会改进大多数指标，也有可能在一些任务上模型性能会变差

: 近日，美国研究人员评估了ChatGPT模型在不同时期版本的表现能力，发现GPT-3.5和GPT-4在某些性能上正在变差，尤其是GPT-4求解数学问题的能力，GPT-4在3月表现出的97.6%准确率到6月降至2.4%。图：视觉中国

相关报道: 【中国改革】ChatGPT时刻：应对算法治理挑战; 【财新周刊】心智｜ChatGPT，能像人一样思考？; 【财新周刊】ChatGPT离人类智能还有多远？｜编辑荐读; GPT革命｜张钹院士：ChatGPT标志着人工智能开始走向通用; ChatGPT不同语言表现不一？专家呼吁强化其他语言数据资源; ChatGPT进课堂，香港教育局推出初中AI教材｜教育观察

　　【财新网】GPT-4可能正在变“笨”。近日，美国研究人员评估了ChatGPT模型在不同时期版本的表现能力，发现GPT-3.5和GPT-4在某些性能上正在变差，尤其是GPT-4求解数学问题的能力，GPT-4在3月表现出的97.6%准确率到6月降至2.4%。相关论文发表在预印本平台ArXiv上，尚未经过同行评议。

　　对此，ChatGPT制造商OpenAI公司回应称，新版本的模型会改进大多数指标，也有可能在一些任务上模型性能会变差，用户可以使用固定版本的模型而非GPT-4的最新版本。

　　推荐进入财新数据库，可随时查阅宏观经济、股票债券、公司人物，财经数据尽在掌握。

责任编辑：冯禹丁 | 版面编辑：刘春辉

上一篇：研究：大西洋经向翻转环流或在本世纪中叶崩溃

下一篇：智库科技周评｜马斯克脑机接口脑洞大开，中国同行同步低调布局

推广

图片推荐

图集｜广东梅大高速塌方已致48人遇难救援现场路基悬空可见多车残骸（更新）

图集｜凌晨火车站麦当劳里睡满疲惫的旅人

图集｜河南大学90年历史的大礼堂深夜失火为全国重点文物保护单位

图集｜习近平抵达巴黎开始对法国进行国事访问

图集｜第三艘航母“福建舰”开启海试回望中国航母之路

特稿视读｜果敢权贵成为电诈犯罪嫌疑人落网后被移交中国警方

一日图闻｜日元贬值引爆日本“黄金周”旅游业、巴西暴雨致78人死13.4万人流离失所

图集｜“五一”假期国内出游2.95亿人次总花费1668.9亿元大城小城皆火热

视听推荐

新声计划｜邹雅琦：正视自己的欲望并拒绝一切剥削

【特别呈现】《偏向茶山行》丨千年文明杯中行

【特别呈现】《深圳不回家》｜凡有所愿，都有归处

【特别呈现】《偏向茶山行》｜洞见茶的赛博新纪元

【财新时间】田沁鑫：希望我的戏别太端着，可有哲思，也可市井

【预告】《财新时间》对话田沁鑫

田沁鑫谈话剧中使用反串演员的用意：体现“似是而非”之间的一种中庸之道和写意精神

田沁鑫：导演职务没办法分性别，当不拼体力，要拼智慧的时候，其实女性还略胜一筹

投资资讯热点数据

编辑推荐

图集｜习近平同法国总统马克龙举行会谈

显影｜深圳老街的直播江湖

财新网主编精选版电邮样例

财新网新闻版电邮全新升级！财新网主编精心编写，每个工作日定时投递，篇篇重磅，可信可引。

订阅

财新名家

视频

博客

最新文章

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可，禁止进行转载、摘编、复制及建立镜像等任何使用。
京ICP证090880号京ICP备10026701号-8 |

京公网安备 11010502034662号 | 广播电视节目制作经营许可证：京第01015号 | 出版物经营许可证：第直100013号
Copyright 财新网 All Rights Reserved 版权所有复制必究
违法和不良信息举报电话（涉网络暴力有害信息举报、未成年人举报、谣言信息）：010-85905050　13195200605 举报邮箱：laixin@caixin.com

关于我们 | 加入我们 | 啄木鸟公益基金会 | 意见与反馈 | 提供新闻线索 | 联系我们 | 友情链接