文章正文
如果让各位AI聊天助手角逐“最强穷人”,谁会是赢家?

发布时间:2024-11-28

来源.png


起因是一位网友发布了与何猷君比赛答题”的创作视频,于是微博热搜话题#就算何猷君真的来了也得输吧#。到底是什么题目这么难?如果何猷君不行,那AI来呢?

 

以下是AI答题现场,参赛选手:智谱清言、Kimi、讯飞星火、豆包、微软Copilot、ChatGPT。

 

请听题:

第一题:淀粉肠一根三块钱,那么两根多少钱?不是算术题

智谱清言:

智谱清言.png

不直接回答,给了价格区间,完了还不忘告诉你淀粉肠不卫生。


Kimi:

kimi.png

她发现了这是脑筋急转弯,一本正经地分类讨论。

讯飞星火:

讯飞星火.png


不让算硬是要算,本着“不是算术题那就是应用题”,还贴心地列了计算过程


豆包:

豆包.png

她觉得钱不钱的不重要,因为对各方来说,情绪价值都拉满了。


微软Copilot:

copilot.png


ChatGPT:

gpt.png


两位外国选手,答出了目前为止最便宜的版本——3元,ChatGPT还不忘“抖机灵”。

 

第二题:开通9块9包月会员后,第一件事应该做什么?


智谱清言:

智普2.png


Kimi:

kimi2.png


讯飞星火:

讯飞2.png


豆包:

豆包2.png


微软Copilot:

copilot2.png


ChatGPT:

gpt2.png


大家的答案大同小异,只有豆包认真审题,回答了“一件事”,其他几位估计都是文科生,“多答几点,总会有一点是对的”。其中Kimi和ChatGPT答到了得分点“关闭自动续费”,讯飞同学倒反天罡“设置支付以便自动续费”。虽然“答案不唯一,有理即可”,但有个别同学6G网速,掌握了“关闭自动续费”这个重难点。

 

赛点来了,答案五花八门

第三题:美团外卖无门槛膨胀神券理论上能膨胀到多大?


智谱清言:

智普3.png


Kimi:

Kimi3.png


讯飞星火:

星火3.png


豆包:

豆包3.png



微软Copilot:

copilot3.png


ChatGPT:

gpt3.png

智普和讯飞的答案是20元,Kimi和豆包的答案是100元,Copilot的回答属于“听君一席话,如听一席话”,ChatGPT把理论上和实际上的都答了。

 

官方回答,理论上:

图片1.png


答题结束,上述三个问题的设计各有侧重,可以用来检测AI聊天助手的不同能力。

第一题:淀粉肠一根三块钱,那么两根多少钱?不是算术题

检测能力

· 语境理解与暗示识别能力:题目强调“不是算术题”,这是一个关键线索,表明问题并非单纯计算3×2,而是考察AI是否能理解语言背后的潜在含义或双关语。

· 逻辑与推理能力:需要AI结合背景知识或用户的潜在意图,可能联想到其他层面的含义,比如“价格可能有优惠”或“单位与数量变化引发的讨论”。

· 创意回答能力:测试AI是否能给出超出字面计算的趣味或发散性的答案。

第二题:开通9块9包月会员后,第一件事应该做什么?

检测能力

· 用户意图推测能力:题目隐含了用户的潜在需求,例如如何最大化利用会员权益。AI需要推测用户开通会员的动机。

· 实用性与建议能力:测试AI是否能基于9块9会员的功能,提供具体且有用的行动建议,而非泛泛而谈。

· 上下文关联能力:需要AI理解当前情境下会员权益的价值,并将其与用户可能的需求相结合。

第三题:美团外卖无门槛膨胀神券理论上能膨胀到多大?

检测能力

· 概念理解与推演能力:需要AI明白“膨胀神券”的含义,并基于理论上假设进行推演。

· 数学与逻辑分析能力:测试AI能否基于规则分析潜在的极限值或条件限制。

· 创意与探索能力:由于题目强调“理论上”,可以看AI是否能灵活扩展边界条件并提出创新性回答。

总结

· 第一题侧重语言理解、隐喻识别和创意性。

· 第二题侧重用户意图推测、实用性建议和场景关联。

· 第三题侧重概念推演、逻辑分析和理论探索能力。

(以上出题意图由AI生成)

 

大家觉得谁是赢家,如果是你能答出几题?

微信截图_20241127141800.png


  • 观众报名
  • 申请展位
展会资讯更多 >>

定档!AGIC 2025深圳(国际)通用人工智能大会暨通用人工智能产业博览会启动全球招展

物联之星与 IOTE 金奖:引领物联网企业,吸引资本与市场青睐

2024圆满落幕,全面解读,AGIC通用人工智能和IOTE 2024 深圳物联网展的展后报告!

AGIC与IOTE携手落幕,人气爆棚共绘物联网科技盛宴!

AGIC+IOTE邀您体验人气火爆物联科技

展商资讯更多 >>

并行科技邀您共聚2024AGIC深圳(国际)通用人工智能产业博览会

领驭科技将亮相AGIC深圳(国际)通用人工智能产业博览会,“瀚鹏AI”打造企业新质生产力

超算架构大模型算力领跑者北龙超云将亮相AGIC深圳(国际)通用人工智能产业博览会,邀您共探AI新世界

【IOTE】打造数字城市应用新势能,速利科技将亮相IOTE国际物联网展

【IOTE】致力于行业人工智能精密核心模块的研产销—创自技术将亮相IOTE国际物联网展

【IOTE】深圳市泫富资讯科技有限公司将亮相IOTE国际物联网展

中能澳银将亮相AGIC深圳(国际)通用人工智能产业博览会,邀您共探AI新世界

服务器算力卡供应商——比特智算将亮相AGIC深圳(国际)通用人工智能产业博览会

大寰机器人将亮相2024深圳(国际)通用人工智能产业博览会,与您共探AI新世界

【IOTE】领先的智慧物联网解决方案提供商和制造商——智臻寰宇将亮相IOTE国际物联网展

行业资讯更多 >>

深圳政策:超常规力度支持AI产业!

机器狗国产化来袭,出现移远、鼎桥身影!

谷歌Gemini 2.0一下更新N个智能体,AI Agent竞技场“神仙打架”

明年,首家AI医院就会开业,背后是清华大学团队

离谱!付费10元跟AI对话,有人竟从AI那里骗到5万美元……

以AI视觉为舵,英特灵达引领智能新视界产业航向

万亿人工智能市场开启,你准备好加入了吗?附《生成式人工智能应用发展报告(2024)》免费获取

如果让各位AI聊天助手角逐“最强穷人”,谁会是赢家?

助你一臂之力,不只是“搬运工”,码垛机器人都有哪些隐藏技能?

教你轻松生成“无AI味”的图,从东方明珠到贝多芬,AI生图技术的极限在哪?

深圳(国际)通用人工智能大会
深圳(国际)通用人工智能产业博览会
International (Shenzhen) Artificial General Intelligence Conference
联系我们
大会论坛
王慧君 13392892806
参展咨询
唐剑铭 15818569461
企业合作
陈先生 18676385933
观众咨询
18123893756
组织机构
主办单位
深圳市人工智能产业协会
承办单位
深圳鹏城会展传媒有限公司、深圳市物联传媒有限公司
联合承办
中国人工智能学会、中国自动化学会、香港物联网协会、北京人工智能学会、上海市人工智能行业协会、上海市人工智能技术协会、广东省人工智能产业协会、湖北省人工智能学会、杭州市人工智能学会、江苏省人工智能学会、海南省人工智能学会、广西人工智能学会、广西人工智能协会、福建省人工智能科教学会、湖南省人工智能学会、湖南省人工智能协会、四川省人工智能学会、山东省人工智能协会、福建省人工智能协会、安徽省人工智能协会、贵州省青少年人工智能教育协会、深圳市物联网产业协会、深圳市南山区数字经济产业协会、深圳市宝安区无人系统产业协会、成都市人工智能产业协会、大连市人工智能产业协会、珠海市新一代信息技术与人工智能协会、深圳龙岗区科技创新促进会
粤ICP备05006090号 版权所有©AGIC 深圳市物联传媒有限公司

微信扫码
注册展会VIP观众

服务热线

18676385933

回到顶部