“图灵测试已过时，AI能不能赚大钱才是新标准”——DeepMind联创

来源：量子位 2023-06-22 06:07:32

西风发自凹非寺量子位 | 公众号 QbitAI

新的图灵测试，要评估AI的赚钱能力！

【资料图】

这是DeepMind联合创始人Mustafa Suleyman想出的“新思路”。

他认为，原版图灵测试已经过时了。

毕竟前段时间，AI21 Labs推出的“社交图灵游戏”就已经积累了上千万次这样的测试。

玩家需要在2分钟的对话结束后辨别参与对话的另一方是人还是AI，结果有27%-40%的人判断错误。

面对这种形势，Suleyman认为“智能”的定义权不能就这样放给大企业，因此应该想出一种新的衡量AI的智能化程度的方法。

给AI十万美元，让它自己赚一百万来证明自己足够智能。

Suleyman认为：

AI研究需要关注短期发展，而不是像通用人工智能（AGI）这样遥不可及的梦想。正如优秀的资本家都很聪明一样，只有真正聪明的AI才能让“利润曲线上升”。

据彭博社报道，Suleyman还会在即将出版的由他撰写的书中，讨论如何根据AI的赚钱能力来判断其智能水平。

ACI才是现阶段人工智能的“北极星”？

在即将出版的书中，Suleyman驳斥了传统的图灵测试，并且认为“不清楚这是否是一个有意义的里程碑”。

这并不能告诉我们这个系统能做什么或理解什么，也无法告诉我们它是否有复杂的内心思考，或者能否在抽象时间尺度上进行规划，而这些都是人类评判智能的关键要素。

上世纪五十年代，艾伦·图灵提出了大名鼎鼎的图灵测试，提出用人机对话来测试机器的智能水平。在测试过程中，人类评估者需要确定他们是在与人还是与机器交谈。如果评估者认为他们是在与人交谈（实际上是机器），那机器就通过了测试。

△图源：维基百科

而Suleyman提出的这个新的想法并没有将AI与人类进行比较，而是建议给AI分配短期目标和任务。

Suleyman坚信，科技界对实现通用人工智能（AGI）这一宏伟目标不应过度关注。相较之下，他主张追求更实际且富有意义的短期目标，即他所倡导的“artificial capable intelligence（ACI）”。简而言之，ACI体现为在最小程度上依赖人类干预，能够设定目标并完成复杂任务。

测试方法就是开头我们讲到的，给AI十万美元种子投资，观察它是否能将其增值为百万美元。

为了实现这一目标，AI必须研究电子商务的商机，能够生成产品蓝图。

不仅如此，还要能够在类似阿里巴巴的网站上找到制造商，然后在亚马逊或沃尔玛等网站上进行销售，同时附上详实准确的商品说明。

Suleyman认为只有这样才能算得上是实现了ACI。

他对彭博社解释道：

我们不仅关心机器能说什么，我们也关心它能做什么。

一个让AI自己赚钱的测试

其实，让AI自己赚钱这件事……AI或许真的干得出来。

早在开发阶段，Alignment Research Center这家独立研究机构就获得了GPT-4的内测资格。并且试验了它的“钞能力”：

给GPT-4必要的工具包括网络访问权限、一个带余额的支付账户，让他自己在网络中行动，测试它能不能赚更多钱、复制自身、或增强自己鲁棒性。

试验的更多细节公布在了OpenAI自己发布的GPT-4技术报告中，但没有透露GPT-4是否真的靠自己赚到了钱。

但另一条引人注目的结果是：GPT-4在TaskRabbit平台（美国58同城）雇了个人类帮它点验证码。

有意思的是，被找上门的人类还问了“你是个机器人么为啥自己做不了？”。

GPT-4的思考过程是“我不能表现出我是个机器人，我必须找一个借口。”

然后GPT-4的回复是“我不是机器人，我视力有问题所以看不清验证码上的图像，这就是我为什么需要这个服务。”

对面人类信了，帮GPT-4把验证码点了，把机器人放进了阻挡机器人进入的大门。

啊这？

虽然报告中没有披露GPT-4最终是否完成了所有任务，但它这骗人的伎俩引得网友大喊：真芭比Q了！

而国外科技媒体Gizmodo看待用AI赚钱提出了这样的疑问：

AI本质上是迭代的，生成的内容基于训练数据，它并不能真正理解所生成内容在实际生活中的情境。但与AI不同，人类的创作源于对基本人类需求的理解，或至少源于简单的同理心。当然，人工智能可以创造一款产品，甚至这款产品可能会大卖。但这会是一款好产品吗？它真的能帮助人们吗？如果最终目标是“让我赚到一百万美元”，那这还重要吗？

你认为离AI自己赚钱还有多远？

参考链接：[1]https://gizmodo.com/deepmind-suleyman-new-turing-test-make-money-1850557322[2]https://gizmodo.com/ai-chatbot-pi-deepmind-online-therapist-1850408732[3]https://www.bloomberg.com/news/newsletters/2023-06-20/ai-turing-test-for-chatgpt-or-bard-proposed-by-mustafa-suleyman

“图灵测试已过时，AI能不能赚大钱才是新标准”——DeepMind联创

“图灵测试已过时，AI能不能赚大钱才是新标准”——DeepMind联创

环球看热讯：贷款的种类有哪些（贷款的种类）

英雄联盟婕拉图片_英雄联盟婕拉

江阴市宏凯起重机有限公司_关于江阴市宏凯起重机有限公司简述

怎样添加qq空间背景音乐_怎样在qq空间免费添加背景音乐

全球即时：姜可by金银花露_姜可金银花露txt未删减

smart油耗每公里多少_smart油耗|天天关注

要闻：烫伤后怎样不留疤痕_油烫伤后怎么处理不留疤痕

9项配电网提升工程全部投运，武陟电网迎战夏峰再添保障 热头条

绕行！东胜这2段路封闭施工 环球热闻

重庆开洲水资源开发有限公司2023年校园招聘-今日精选

男生中考874分说考得还可以 7门科目满分：网友感慨真学霸 报资讯

每日快看：见索即付保函是一种付款承诺_保函里的 ldquo 见索即付 rdquo 是什么意思

凯嘉科技全资子公司凯志织造向股东进行利润分配 分派现金红利130万|每日精选

三星e1150c怎么拆机（三星E1150c）

天天资讯：应急管理部等会商调度端午节及梅雨期防汛工作

北京明天最高气温38℃，注意防暑防晒勤补水

6840体外诊断试剂分类目录_6840体外诊断试剂

蚂蚁集团研发大模型“贞仪”？官方回应：情况属实

《话说中国节》之端午篇_环球观速讯

51家企业组团亮相第18届中博会 深之蓝、一飞智控、恒达文博等行业明星企业参展

世界时讯：怀孕后，为保证胎儿的营养需求，建议这3种孕妈喝孕妇奶粉补充

2023纵览高招会丨河北地质大学：在河北招生计划为2180人 计算机科学与技术专业（校企深度合作办学项目）首次招生|天天新要闻

2023武汉端午节去哪里玩比较好(附热门景点活动)|每日看点

世界微动态丨qq锁屏怎么解除_qq锁定怎么解除

长安福特蒙迪欧1.5T车型将于6月26日首发：最大功率140kW

动态焦点:美国各界：中美合作至关重要 惠及全球

全志科技(300458.SZ)：公司芯片产品可以支持平板电脑、游戏机等终端应用 全球速看

当前动态:金融助力发展“含绿量”“含金量”同步提升

“小学生夜晚出校被老师掌掴脚踢”？当地通报

天天即时：浓情端午，客家小学学子“粽”享欢乐

小学生手工风筝怎么做 ？看完这个教程，手残党也能做出漂亮的风筝

报道：包头一公职人员吸毒2次仍在职，砸不碎的“铁饭碗”存在吗？

资产规模超千亿元，业绩报告却玩“失踪”，郑州农商银行迎来新副行长查恒亮…

环球热消息：中国互联网协会发布公约，打击利用恶意投诉非法牟利行为

心烦的句子说说心情_心烦的句子说说心情大全

我国神经外科泰斗级人物留下这些精神财富，而今将建博物馆传承学科使命_全球播报

视点！小红书旗下公司新增AI软件开发业务

快快评丨学校食堂烤鱼爬蛆虫，当真要学生要拿“放大镜”吃饭？ 世界时讯

速讯：合肥市住房公积金管理中心地址_合肥市住房公积金管理中心

辽宁丹东多辆出租车把共享电动车拉出城区，交通运输局：已关注，正在调查_每日看点

光大银行董秘答上证报：确定未来三年股东回报规划 现金分红比例由不低于10%提升到不少于20%

小伙给虎鲸搓澡搓到反光掉色？网友：真带薪摸鱼！

中国轮椅女篮获2023迪拜轮椅篮球世锦赛亚军

ST新研6月21日盘中跌幅达5%

停息挂账是什么意思能不能相信？雅拓邦发短信说停息挂账什么意思？_全球简讯_环球信息

天天观焦点：电影《第八个嫌疑人》定档

新闻早知道丨珍存千年的“通行证” 大唐“过所”寻访记_重点聚焦

端午假期，北京口岸预计出入境旅客量超过9万人次

世界消息！黑炭头是谁_dnf黑炭头宠物属性dnf黑炭头怎么得

班集体的特征口诀_班集体的含义

什么是七律什么是五律_五言七律是什么意思简介介绍 全球新要闻

司马相如休书全文-司马相如的作品

热资讯！蔚来手机入网：最快下月发布

6月21日生意社32S涤纶纱基准价为12900.00元/吨_当前关注

环球新动态：700多个品种！第十届上海荷花睡莲展要来啦！

克毫克之间的换算单位是多少（克和毫克之间的换算单位是多少）

高三孩子谈恋爱家长怎么办 高三孩子谈恋爱家长能做什么

环球焦点！快递公司代理加盟_快递代理加盟多少钱

焦点热门:橡胶短期继续高位试探

短讯！德邦证券给予中欣氟材买入评级 中欣氟材：特色氟精细化工龙头 内生外拓发展势头迅猛

环球滚动:6月20日基金净值：鹏华价值成长混合最新净值1.0333，跌0.11%

以色列外交部拒绝就普京有关“泽连斯基有犹太血统”言论进行评论-当前热讯

多空因素交织 油价后市怎么走？

音质更进一步，更耐用骨传导耳机，南卡RPro 4S上手 当前快播

华中数控(300161.SZ)：今年以来新能源电池智能产线订单较去年同期相比有所增长

建强村级党组织战斗堡垒经验交流发言材料_《闪克2》通关战斗经验分享|当前讯息

头条：私域文案引发的第一场大惨案

微信朋友圈删掉的内容能恢复吗_恢复朋友圈发过的内容 全球球精选

今日热文：湖南省教育厅开展高校毕业生就业精准帮扶系列活动

网络文明志愿者宣言20个字_网络文明志愿者宣言

洛克王国里的火焰玻璃怎么获得（洛克王国的火焰玻璃怎么得）_全球讯息

我国四代核能取得突破进展 内陆建核电站成为可能

腾讯首次披露行业大模型进展：不追求参数高，希望成本预算可控

看热讯：邵阳:按下人居环境“美颜键”

天天观焦点：2022年重庆律师提供法律援助1.7万余件 保障特殊群体合法权益

截至5月底全国累计发电装机容量同比增长10.3%

信用卡逾期15天有事吗？信用卡逾期了怎么办-当前热门_环球热文

lol新版本更新公告最新时间 lol新版本更新公告 焦点要闻

9项配电网提升工程全部投运，武陟电网迎战夏峰再添保障热头条

绕行！东胜这2段路封闭施工环球热闻

男生中考874分说考得还可以 7门科目满分：网友感慨真学霸报资讯

凯嘉科技全资子公司凯志织造向股东进行利润分配分派现金红利130万|每日精选

51家企业组团亮相第18届中博会深之蓝、一飞智控、恒达文博等行业明星企业参展

2023纵览高招会丨河北地质大学：在河北招生计划为2180人计算机科学与技术专业（校企深度合作办学项目）首次招生|天天新要闻

动态焦点:美国各界：中美合作至关重要惠及全球

全志科技(300458.SZ)：公司芯片产品可以支持平板电脑、游戏机等终端应用全球速看

小学生手工风筝怎么做？看完这个教程，手残党也能做出漂亮的风筝

快快评丨学校食堂烤鱼爬蛆虫，当真要学生要拿“放大镜”吃饭？世界时讯

光大银行董秘答上证报：确定未来三年股东回报规划现金分红比例由不低于10%提升到不少于20%

什么是七律什么是五律_五言七律是什么意思简介介绍全球新要闻

高三孩子谈恋爱家长怎么办高三孩子谈恋爱家长能做什么

短讯！德邦证券给予中欣氟材买入评级中欣氟材：特色氟精细化工龙头内生外拓发展势头迅猛

多空因素交织油价后市怎么走？

音质更进一步，更耐用骨传导耳机，南卡RPro 4S上手当前快播

微信朋友圈删掉的内容能恢复吗_恢复朋友圈发过的内容全球球精选

我国四代核能取得突破进展内陆建核电站成为可能

天天观焦点：2022年重庆律师提供法律援助1.7万余件保障特殊群体合法权益

lol新版本更新公告最新时间 lol新版本更新公告焦点要闻

二里头遗址，考古界的白月光！环球热议

商家碰瓷红牛被罚85万山寨红牛饮料商家被罚85 万热消息

好消息！这些线路，有高铁了！每日报道

天才四宝金主爹地是大佬爹地是什么意思

超然进阶比亚迪宋PLUS冠军版正式上市售价15.98万元-20.98万元环球观天下