国内那些AI大模型,就跟满大街的煎饼果子似的,到处都是。每个厂家都想要摊出个又大又圆的煎饼。可问题是,这些宣称有千亿参数的“数字煎饼”,味道到底咋样,怕是只有老天爷心里有数。
大模型比谁家盘子大
报参数这事,跟手机跑分似的,动不动就是千亿万亿的。这不,上周某厂商刚吹了个万亿模型,结果隔壁就拿出个两万亿的来。这场景,就像那烧烤摊老板非得说自家的羊肉串比别人多两粒芝麻似的。说到底,普通用户打开聊天框,还真看不出来100亿和1000亿参数到底有啥区别。
算法才是真家伙
讯飞那帮人说他们主要在搞算法升级,这话听起来挺有道理。就跟做饭似的,食材差点意思,但厨子手艺够硬,也能做出香喷喷的菜。去年他们只用十分之一的算力训练语音模型,识别率愣是比那些瞎堆算力的强了3%。现在这星火大模型打算六月再升级,估计又要让那些瞎烧钱堆参数的厂家心里不是滋味了。
中文数据有点寒酸
搞训练AI那东西,跟喂娃儿奶粉似的,咱这中文数据,就跟超市打折的临期奶粉似的。行内人说了,不管是质量还是数量,都比那英文的差一大截。怪不得那些国产的大模型,说中文的时候AI模型,总感觉像是翻译软件在帮忙。更逗的是,网上搜集的数据里,还掺和着各种稀奇古怪的东西,AI学完了,说不定还以为“马老师”真的是个武林高手。
算力卡脖子日常
搞个巨型模型没显卡,那跟做菜没锅灶似的,现在国内这些企业全靠游戏显卡的残次品硬撑着。有家公司为了训练模型,干脆把全市网吧的3080全给租了个遍。不过,讯飞那家伙说他们能在算力上吃瘪的情况下也能搞出点名堂,这倒是给整个行业打了一针鸡血,至少说明咱这戏还没完全黄。
落地应用才是正经
现在这大模型最大的糗事就是除了能写写诗聊聊天,正经事干不了几个。医院里头有人试了诊断系统,结果AI把个感冒当成了新冠肺炎。企业们今年百模大战爆发,AI大模型产品不断涌现,政策也在关注,先得好好想想到底要解决啥问题,别光喊口号说“改变人类未来”,先把公司里头那报销流程搞明白再说。
评测标准急缺
各家各户各说各话,你吹你的模型能码代码,他吹他的能解数学题,跟直播带货似的AI模型,全靠嗓门大。真得有个像高考那样的统一考试,别让用户对着参数表像读天书。最好是来个“大模型315晚会”,把那些吹牛的都拉出来溜溜。
这帮AI大模型,先得搞定哪个实用场景?得是帮程序员敲代码,还是得帮学生糊弄作业今年百模大战爆发,AI大模型产品不断涌现,政策也在关注,再或者是帮老板应付那周报?逗比们,你们说?