当前位置：首页 > 直播软件 > 软件教程 > GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

2024-04-13 来源：泛电竞编辑：佚名标签： GPT-4

文章导读: 新版GPT-4是在Q*的输出上微调的？在竞技场重回榜一的新版GPT-4 Turbo，成功再次踩中大家嗨点。它此次的性能提升体现在数学、推理、代码上，而且输出内容废话更少。最让大家感

新版GPT-4是在Q*的输出上微调的？

在竞技场重回榜一的新版GPT-4 Turbo，成功再次踩中大家嗨点。

它此次的性能提升体现在数学、推理、代码上，而且输出内容废话更少。

最让大家感到兴奋的是其数学/推理能力，现在可以在一些问题上完胜其他大模型。

比如“求y=x^4-5x^2-x+4和y=x^2-3x交点的y坐标之和。”只有最新版GPT-4 Turbo能测出来。

这条推特被公开承认自己参与过Q*的Lukasz Kaiser转发。

Noam Brown也发推表示新版GPT-4 Turbo在推理能力上大幅提升——要知道，这位OpenAI科学家一直被外界认为正在研究Q*。

各方信息汇总后，网友们一拍脑袋反应过来，这其中会不会就引入了Q*啊？

数学方面的提升意味着其中可能包含了一个数学模型，可能是Q*。

（以及他的数学题测试推特被OpenAI的人转发了）

好家伙，难道OpenAI在悄悄搞大事？

新GPT-4的“新马脚”？

OpenAI官方公告表示，最新版本的GPT-4 Turbo全方位大提升，现在ChatGPT用户可直接体验。

网友立马冲去实测，有人给出评估结果，特别是数学/推理能力有了重大提升。

实际问题测试中，在多个数学推理题上，GPT-4 Turbo都没有翻车，但是如Command-R plus、Clauede-3 Opus等都有失误。

比如一道乘电梯的推理题。陷阱在于这部神奇电梯无论坐几层，最后都会停在一层。GPT-4 Turbo理解了这层逻辑，最后给出了正确答案。

还有在修改二叉树问题上，GPT-4 Turbo不仅回答正确，而且过程清晰完整。

同时在“大海捞针”能力上，与之前版本对比，最新GPT-4 Turbo已经是出版GPT-4能力的4.3倍。

竞技场的结果表明，在代码能力方面，GPT-4 Turbo也更强了。

文本输出方面变得更加简洁。

生成代码也少了很多废话（下图右侧为新版本）。

有人补充说，生成速度上也更快了。

神秘Q*：OpenAI的最大秘密？

现在Q*已经成了OpenAI的流量密码了，只要出现这个关键字，网友们都会兴奋不已。

毕竟当初奥特曼宫斗大戏就和它有关联，还有人发出警告，Q*预示着AGI即将出现。

不过官方一直没有公开承认过这个项目的存在，奥特曼拒绝回答，Transformer作者公开承认参与Q*也被OpenAI公关跳起来捂嘴。

从目前各方透露的信息来看，Q*专注于逻辑和数学推理能力，数学能力突出。

Transformer作者之一Lukasz Kaiser承认自己参与了这个项目。

德扑AI之父、前FAIR（Meta）研究科学家Noam Brown也被视为是Q*项目的重要成员（推测来自LeCun）。

他加入OpenAI的动作也被外界视为分析Q*的一个线索，“有理由怀疑Q是将LLM和AlphaGo结合起来，并用强化学习进行训练”。

Noam Brown开发出了第一个在打扑克牌上超越人类的AI，后来加入Meta致力于让AI学会玩Diplomacy（外交游戏）。

目前，关于Q*的准确信息还是非常少。

可能奥特曼还在等一个合适的时机来回应外界。

One More Thing

btw，网友们意外捉到总裁Brockman转发的一个视频演示里的提示词是：

创建一个python脚本，使用pytube库从YouTube下载视频。

看来大家拿GPT-4干的事也都差不多嘛（doge）。

上一篇: 22岁的火狐，市占率被3岁的自己超了

返回首页 返回栏目

返回列表: 下一篇

头条资讯

微软与 OpenAI，远没有看起来「亲密无间」: 百度或将推出全新AI对话软件“万话马斯克的第三条腿，被李书福打断了微软改进必应聊天（Bing Chat）：引入视

从网约车到“跑腿”，货拉拉甩不掉“差评”: 微信为什么要做「小绿书」？谷歌裁员1.2万人当天，幸存员工崩溃

留言跟帖

近期热点

热门文章

日榜周榜: 1 22岁的火狐，市占率被3岁的自己超了
上个月，火狐浏览器凭一个骚操作，把一堆用户都惹急了。但奇怪的是，这怎么看都是一个大新闻的事故，世超却没看到多少媒体报道。。。事情是这样。火狐浏览器有个夜间模式，打开会反...
2 GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位
新版GPT-4是在Q*的输出上微调的？在竞技场重回榜一的新版GPT-4 Turbo，成功再次踩中大家嗨点。它此次的性能提升体现在数学、推理、代码上，而且输出内容废话更少。最让大家感...; 1 营收下降，首现亏损，三六零何以至此？
近日，三六零公布了2022年年度报告。报告期内，公司营业收入95.21亿元，比上年同期的108.86亿元减少12.54%；归属于上市公司股东的净利润为-22.04亿元，较去年的9.02亿元同比减少了34...
2 天涯社区关闭，海量数据和内容怎么处理？
因为跟不上潮流，曾经火爆的天涯社区出现了转型困难、经营不善等问题，被迫在近期以“技术维护”为名关闭了论坛。随后有消息传出，因为天涯公司付不出每月10万元的月...
3 美国为何不敢轻易禁用Windows操作系统？
禁用Windows这样的操作系统是一个非常严重的决定，因为它会对整个国家的经济和社会生活产生巨大的影响。美国政府可能会考虑到这些影响，并且会采取更加谨慎的措施来保护国家安...
4 喜马拉雅需要新故事，互联网难容“小而美”公司？
今年1月，喜马拉雅创始人兼CEO余建军在公司年会上透露，公司于2022年第四季度首次实现单季度千万级的盈利。虽然盈利额度并不高，但这却是喜玛拉雅成立十余年以来，首次实现盈利。...
5 NewBing突然全面开放，还更新了一堆卷死友商的功能
昨天 Bing 迎来了超级重磅的更新。先不说别的更新细节，光是一个全面开放公测，就足够劲爆了。这意味着，你只需要注册一个微软账户，就可以使用 Bing Chat 了。这么一来，恐怕 Bing...
6 小红书电商的“第一口螃蟹”，9块9包邮真香？
内容社区起家的小红书，一直给用户的关键词标签是潮流、时尚以及精致。小红书做电商也一直希望沿袭这些标签，从董洁直播案例，到时尚行业的电商大会，小红书在尝试走出自己风格的...
7 小红书全面加速赚钱：进最热的赛道，啃最硬的骨头
小红书的商业化正在全面加速。近期，小红书杀入本地生活赛道。具体而言，小红书开始招募到店餐饮商家及服务商，一部分商家正入驻参与内测。不久后，小红书将上线团购功能，用户可以...
8 知乎新增专业认证快速通道，可一键认证领英职业信息
5月12日消息，知乎宣布为广大职人群体开通专业认证快速通道，创作者可将在职场平台已完成认证的公司、职位、个人主页等信息，快速提交至知乎，完成专业身份一键认证。目前，该通道首...
9 上QQ就可AI绘画？Midjourney中文版来了内测申请已在QQ频道上线
Midjourney官方中文版已经开启内测申请，其将搭载在QQ频道上，每周一、周五下午6点统一开放，达到一定人数后会关闭入口，用户扫描相关二维码即可加入；②有知情人士透露，Midjourney入...
10 Shein“流血”融资20亿美元：寒冬里，活下去才最重要
根据消息，Shein在新一轮融资中筹到了20亿美元，但是这一轮的估值仅为660亿美元，相比一年前的1000亿美元跌去了近三分之一。最新的一轮融资仍然由老股东红杉领投，General Atlanti...

热门视频

关于泛电竞 | 联系方式 | 发展历程 | 泛电竞帮助 | 广告联系 | 网站地图: 备案号：粤ICP备2023097408号 Copyright © 2020-2021 海南金游汇电子竞技有限公司版权所有

try {var urlhash = window.location.hash;if (!urlhash.match("fromapp")) {if ((navigator.userAgent.match(/(iPhone|iPod|Android|ios|iPad)/i))) {window.location="https://www.fandj.cn/m//zbrj/1127.html";}}} catch(err) { }