听说最近那啥大模型挺火的,连楼下那卖煎饼的大爷都在那儿瞎扯淡“参数规模”那东西。说白了就是:吃得多,长得胖,干得多——跟那些互联网公司里头那996的程序员似的。
大模型的胃口有多大
模型训练一次得把图书馆全搬空。2022年那啥GPT-3,读的文本有45TB,差不多就是《红楼梦》看了百万回。这训练成本,都能买300辆911了,电费都能让一个小县城用上半年。
这效果,简直了得!现在这些大模型,能写代码,能做报表,还能帮你写情书,连老板的年终总结都能搞定。可就是有点问题,动不动就胡说八道,跟喝大了的销售总监似的。
国产大模型在狂奔
文心一言半年就升级到4.0版本,更新速度比某些APP还猛。它理解能力从小学渣直接跳到高中学霸,不过偶尔还是会闹出把量子力学说成量子奶茶的乌龙。
国内那帮家伙现在拼了老命搞那些大模型,生怕自己掉队。跟当年那共享单车混战似的,最后估计又是搞得一地鸡毛。不过话说回来,至少这次咱们不用收拾那些破单车了,改收拾那些废弃的参数了。
大模型的黑箱之谜
这些AI,就像你女朋友的心思一样AI模型,让人摸不着头脑,为啥说翻脸就翻脸。专家们发现了个规律,模型越大,就越容易“发神经”,突然间就学会了一些连老师都没教过的绝活,简直就是自学成才的民间高人。
这多模态大模型真是玄乎到家了,看个图都能把猫说成狗,老板的照片都能认成打码图。要是在美术院校考试众多科技企业围绕AI大模型扩张版图,发展存制约与挑战,估计连艺考班都瞧不上这水平。
大模型的职业危机
找份工作对大模型来说也不容易,专业领域里表现得跟刚毕业的小白似的,医疗诊断敢给开药方,法律咨询敢写诉状,可就是没那个胆量保证当事人能不能顺利出狱。
错误信息多得跟地摊小册子似的,昨天还信誓旦旦说地球是扁的,今天个又来个一百八十度大转弯,说地球是方的。时效性那叫一个感人,你问它俄乌那点破事,它都能给你扯到克里米亚那场老掉牙的战争上去。
搞大模型就像养吞金兽
养个巨型模型,成本比养熊猫还高。那东西得占用比足球场还宽敞的数据中心,显卡堆叠起来能拼出一座小金字塔。听说有实验室为了省点电,特意挑了半夜电价便宜的时候训练,这操作跟网吧通宵似的。
咱们的国产框架还在努力拼搏,就跟用算盘去造原子弹似的。不过,最近它进步显著,至少咱们不用再看别人的脸色行事了。就是有时候调试起来,心里那个火大,真想砸电脑,这感觉,真是典型的国产风。
大模型的未来在哪儿
专家这话说得,简直就像是在让学霸带学渣似的。企业手里有数据,可就是不会用;学校,擅长分析,可又没数据。最后众多科技企业围绕AI大模型扩张版图,发展存制约与挑战,俩人可能就互相推诿责任了:“这模型不准AI模型,还不是因为数据太烂?”“数据没问题,是你算法太水。”
这安全事真逗。现在的那些大模型,就跟喝了假酒的保安似的,既抓不住坏蛋,还可能自己瞎胡闹。你说要提升安全度,结果训练的时候还是用的网上那些乱七八糟的数据,跟用地沟油做健康餐似的,一个味儿。
看完这堆东西,咱们猜猜看,哪个行当先得挨刀?是那些天天复制粘贴的文案小能手,还是那些能说会道的中间人?