这人工智能,最近火爆程度简直跟小区门口新开的烧烤摊一样,人气爆棚,排队的人多得都能排到火星上去。
三次浪潮的真相
那时候第一次潮涌,电脑还只会算1加1等于几,现在却能帮你洋洋洒洒地写篇高考作文。1956年达特茅斯那帮大佬要是穿越到现在,看到这景象AI模型,牙套都得笑掉。到了80年代的第二次浪潮,专家系统弄的跟算命先生似的,算得准不准全得看程序员心情。
现在这波深度学习热潮,说白了就是教电脑自己翻垃圾桶觅食。2012年,AlexNet在ImageNet大赛上一炮走红,准确率比第二名高出10.8个百分点,自此开启了全民炼丹的狂潮。那时候,各大实验室的显卡都享受上了996的“幸福”生活。
大模型的秘密
曾大军说,大模型是工程领域的重大突破,换句通俗点说,以前咱们是捏泥巴,现在都玩起3D打印了。你看,GPT-3这东西训练一次得花460万美元,这钱在北京都能买半个厕所了。不过,这效果是真的挺唬人的,写写诗画画画啥的都不在话下,就是有时候它会把1+1算成11,也是挺逗的。
咱国内那搞大模型的,取名都挺有范儿,什么文心一言、通义千问,听着就像是武侠小说里的名字。不过,核心技术还是得看老美的,咱们这就像是在别人的地基上盖楼,不管盖得多高,那地皮终究是租的。这不,最近科技部说要搞个算力网,听起来就像是推销宽带套餐一样,599块就能包月,还送你100T的算力。
算力的困局
这AI训练,跟让大象去自助餐似的,就GPT-3那东西,参数就高达1750亿。NVIDIA显卡的价格,简直比茅台还硬气,矿老板和AI公司抢得那叫一个激烈,头都磕破了。国内某高校为了研究,老师领着学生去网吧通宵达旦ChatGPT刮到中国引关注,第六届数字中国建设峰会热议AI大模型,就因为学校机房那显卡不够用。
2030年咱们吹牛要成全球老大,可现在得先搞定那显卡的难题。中科院自动化所的地下室里,研究员们正琢磨着用算盘来训练大模型,这操作也是够奇葩的。隔壁那组更离谱,直接把算卦的铜钱当成了随机数生成器,还说什么要搞出具有中国特色的AI,这画风也是没谁了。
数据这把双刃剑
数数据这事,跟养娃似的,喂对了能成神童,喂错了就变神经病。国外那谁,AI来着,看了太多坏消息,直接抑郁了。国内那谁,公司里的客服机器人,训练资料全是吵架视频,现在见人就跟打鸡血似的,比那帮大妈还猛。
数据清洗工这活儿火了起来,天天就是盯着屏幕看几万张图,然后给它们贴标签。做这行的人最后都挑花了眼,看到只猫都能纠结半天,是标“喵星人”还是“毛球怪”。有家数据标注公司年终奖发了眼药水,员工们感动得眼泪哗哗的。
能耗危机
搞个大模型的电费能顶一个镇子一年的消耗,电费单比清明上河图还长。马斯克说AI能弄死咱们,我倒是觉得先得被电费单吓个半死。欧洲那疙瘩有个实验室,为了省点电,专挑半夜电费便宜的时候训练模型ChatGPT刮到中国引关注,第六届数字中国建设峰会热议AI大模型,结果研究员们全成了夜猫子AI模型,作息跟吸血鬼似的。
国内某些团队正致力于用风力发电来培养AI,这听起来挺环保的。结果,训练到一半,风停了,这AI竟然学会了说:“等风来”。还有一拨更狠的,直接用仓鼠跑轮发电,现在那AI写《论持久战》读后感简直是一绝。
未来的出路
曾大军那家伙,他提了个主意,说是要把大模型和脑科学搞到一起,听起来简直就像让爱因斯坦跟个跳大神的家伙联手。还真有实验室照着这么干,结果,那模型竟然学会了装神弄鬼的把戏。现在它在淘宝上开店给人看手相,准确率居然有50%,跟瞎蒙差不多。
2030年咱们要争做全球老大,但现在得先搞定这三件事:芯片比美国弱,算法不如美国精细,电费还比美国高。有专家说,咱们得培养一个能造芯片的AI,可这就像让公鸡生蛋,它得先有那个本事才行。
末了儿来个戳心窝子的问题:要是真到了AI主宰地球的那天,咱们这些天天给它喂数据的苦力,能不能混个看门狗的差事?