搞AI大模型的这帮家伙都在寻觅芯片,就跟那饿得眼冒金星的狼找肉似的。现如今,最值钱的东西不是那算法,而是显卡。
算力饥渴症晚期
那家创业公司的技术家伙说,他们手头有1000张A100,可就是感觉算力不够使。这不就跟买了1000碗米饭,结果发现得喂一头大象似的。现在搞语义大模型的公司,满世界找芯片,既要性能猛还得价格亲民,这难度简直比找对象还高。
展台前排队的人全是AI公司的产品经理。他们盯着参数的眼神,简直比相亲时翻看对方工资条还要专注。一位芯片销售员抱怨AI模型,三天内接待了二十多个客户,现在一听到“大模型”三个字就感觉头皮发麻。
大模型选型像买菜
金融界的大家伙、数据的大佬、医疗的小能手......展会上这些AI模型摆得跟菜市场似的。可企业那帮主儿一看这些才热乎了半年的高科技,脸上的表情就跟瞧见超市里新上的奇奇怪怪豆子似的——想尝尝鲜,又怕被坑。
这公司CTO抱怨说,他们搞数字化转型,本想精简流程,可供应商们却一个劲地推销那些大模型。这不就是去修个水管,结果工人非得给你推销挖掘机似的。现在好多企业选型时最闹心的是,是得先花大价钱赌未来,还是赶紧解决眼前这马桶堵了的问题?
自研模型的面子工程
会自己研发大型模型的企业,简直就像那些拿了奥数金牌的小屁孩。星环科技在5月份就推出了两款模型,一款叫“无涯”,一款叫“求索”,名字听起来就像是武侠小说里那些神奇的武功秘籍。
业内人士私下里吐槽,现在发布个大模型的消息,比在朋友圈晒个自拍还简单。有的公司成立才仨月,就敢吹嘘自己搞出了千亿参数的模型,懂行的都知道,这东西就跟小学生的作业本上随便画了个火箭似的。
找场景比找对象难
星环的老大说,当务之急是得找个用武之地。这话听起来挺有礼貌的,但真相是,好多模型都像待业青年一样闲着。比如有个专门做医疗影像的模型,在医院里试用时,被主任医生给喷了:“这东西看片子速度,比我这老花眼还慢。”
GE医疗那帮人说了实话:好多时候咱们还真用不上那么大个儿模型。就比如说切个西瓜,咱干嘛要用电锯?现在AI这行当,就是拿着水果刀能干的事,偏要去考验核电站。
数据才是真土豪
风电那帮兄弟说,他们巡检机器人的数据将来能培养出大模型。听起来挺美,可现实是,他们连风机叶片上落了几只鸟都数不清。现在搞风电AI的,基本上都在干一件事:给风机装上监控设备,先拍够素材再说。
医界这行当挺接地气,GE那摊位直接就亮出底牌:治疗AI咱不用那大块头参数。就跟老中医搭脉一样,靠的是经验,那啥文凭啥的都不算啥。现如今2023世界人工智能大会:大模型成绕不开的核心主题,最受欢迎的医疗AI,就是那种能帮医生少费笔力的“病历打字员”。
大模型的魔幻现实主义
展会上那画面简直了,每家公司都吹嘘自己在搞AI,你一细问,卖软件的、卖硬件的,就连卖办公家具的2023世界人工智能大会:大模型成绕不开的核心主题,都把大模型概念当成了香饽饽。有个搞考勤系统的AI模型,竟然把人脸识别硬是吹成了“组织行为学大模型”,真是让人哭笑不得。
这帮AI公司里的兄弟们抱怨说:“要是不提那啥大模型,就跟相亲时不说自己有房一样尴尬。”不过背地里他们得瑟,去年那啥垃圾分类的小东西,今年改名成了“环保行业认知智能系统”,价格直接翻了个跟头,涨了十倍。
说起来,你们公司这阵子是不是也给自己的产品起了个新名儿,带点“智能”或者“大模型”啥的?说出来,咱们这儿热闹热闹,逗大家一乐。