AI这次数学题又搞砸了,连数个方块的答案都能整出几个版本。国内外那些大模型一起玩起了“猜猜猜”的游戏,让人不禁怀疑它们是不是悄悄地参加了同一个数学补习班。
大模型集体眼瞎现场
这题简单得小学生都能搞定:图里少了多少块才能拼成个大立方体?结果那O3家伙一口气报了45块,2.5Pro那货小气巴拉的拷打AI难度升级!图像推理新难题引热议,大模型答案为何不同?,只说10块,国产的Qwen3更绝,直接砍到9块。这差距简直比菜市场砍价还夸张,要是不懂的人还以为是在参加拍卖会。
这o3简直了,按理说应该是5乘5乘5的算式,愣是把79给算成了45。这数学水平要是去小卖部找零,那老板都能直接报警了。再后来一看,它数现有的方块时AI模型,竟然把46个当成了80个——这AI的眼睛简直就是自带了高斯模糊滤镜。
规格理解大型翻车现场
各家AI对“大立方体”的认知,简直跟直男分辨色卡似的。o3幻想着要搭个五层的蛋糕,结果2.5Pro觉得四层就足够了,国内的俩兄弟直接摆烂,直言:“三层已经不能再往上加了。”下次咱们换个题目,改成“请先统一下,咱们说的‘大立方体’到底是个啥?”
最悲催的是咱们这些用户,本来想着要试试AI的智商,结果却被迫开始玩起了那个什么规格盲盒游戏。同一个问题,竟然能蹦出三种答案,这比咱们去吃自助餐的时候能看到的菜品种类还要多。有网友试了试用那个o3,前两次都提示,结果第三次突然就开窍了——原来这AI就像骆驼一样,得抽它三鞭子它才肯乖乖地往前走。
人类其实也懵逼
评论区炸锅了,真事来了:这题人类自己都吵得不可开交。有人死磕必须原样拼,有人觉得能拆了再组,还有杠精问“大立方体能不能带洞洞”。更绝的是,某网友来了一句神提问:“你们数方块的时候,是不是都喷口水了?”
最惨的就是那个AI了,它可能以为自己是在玩Minecraft,心里想“老子平时都是随便搭搭的”。结果一发现得严格按照图纸来,CPU差点儿烧起来。事实就是,让AI去解数学题,就跟让文科生修电脑一样,完全是专业不搭调的虐恋。
提示词才是真外挂
老哥们注意了,给o3来三次“最长边”的提示AI模型,它立马从弱智变天才。原来这AI跟某些学生似的,不划重点就瞎蒙。再后来发现,它还把错误经验记牢了——早知道,这不就是那种临时抱佛脚的学霸。
这操作简直骚得一批,直接给AI抛出现有方块布局,结果那货瞬间就给算出来了。所以说,AI其实并不是算不出来拷打AI难度升级!图像推理新难题引热议,大模型答案为何不同?,问题就出在出题人连个说明书都没给。下次咱们得在题旁边附上个《方块摆放图解》,免得AI像踩高跷似的瞎猜。
训练数据背锅侠
这题妥妥地成了AI的黑历史,以后所有的小机器都得反复操练数方块这活儿。你瞧,将来AI要是再看到那些小方块,保不齐就得犯病,得先翻翻那本说明书:"这回我得先弄清楚这些方块到底怎么玩..." 咱还得给它们加个“防手残”的培训课程,毕竟数数这种简单事都能搞错,指不定哪天就把人民币错算成越南盾了。
最悲催的是那个教练,本来还幻想着培养出一个奥数冠军,结果一看,考场上那学生竟然用脚在拨算盘。网友们都笑喷了:"你们训练的时候是不是只顾着讲笑话了?"还得提醒一下,下次考试前得先测测视力,别让AI把那些方块字误当成了二维码。
未来属于数学渣
现在各个实验室都在火急火燎地补习立方体数学,听说有个团队连轴转,给AI整了个“数数不傻系统”。更逗的是,网友们脑洞大开,提议说:“咱们不如让这些AI自己批改作业,要是出错了就让它背圆周率去。”
瞧着这些AI为了那几个小方块题都愁眉苦脸,我突然觉得心里平衡多了——没想到学霸们也会栽在小学奥数里。话说回来,下回这些AI会不会栽在哪种小学数学题上?是鸡兔同笼还是水池进水,真是让人好奇。