AI行业如今竞争激烈得如同春运,大厂小厂都在玩命往模型里投入精力。最新消息是就连深度求索这种厉害的玩家都放弃了自家的R1模型,开源这东西现在比相亲市场上条件好的对象还受欢迎 。
模型开源能当饭吃吗
上周还被吹嘘得神乎其神的AI模型,这周没准就成了电子废物。当下情形是,随便拎出个模型都能把活儿干个差不多,差别就如同泡面里的牛肉粒AI模型,有它没它都不耽误你饿肚子。OLMo 2这种完全开源的模型突然备受青睐,毕竟谁不想瞅瞅训练数据里有没有藏着猫腻。
可是开源许可证瞅着就让人脑袋疼,跟小区物业的规定差不多。你根本弄不明白用这东西会不会半夜收到律师的信,又或者弄出来的结果就像被门夹过的核桃,看着是完整的,一敲全碎了。
思维链比老太太裹脚布还长
这些新型推理模型思考时,就如同患上了选择困难症,几个字母就能给你弄出三套方案来。测试人员发现,R1的思维链如同重庆的立交桥,走着走着就不知道该拐向哪里了。其好处是能够随时更换模型,就像渣男换对象那般干脆利落。
不过计算量比比特币矿场还要大,运行起来电表都能倒转三圈。现在大家都已经不在意了,等AI思考一周又怎样,总比相亲对象已读却不回复要好。
国产复刻版到底行不行
听说国内有团队已经复制了o1模型,其效果跟原版相比,就如同康师傅与康帅傅那般。技术封锁?根本不存在,中国程序员连特斯拉代码都能弄下来做成回锅肉。问题在于,这些模仿的模型使用起来就像抽盲盒,永远不清楚下次会冒出啥麻烦。
深入探究一下,放弃R1算是挺聪明的做法,毕竟在人工智能这个圈子里混,就如同在健身房办卡一样AI 行业快速发展竞争激烈,多款自研模型媲美 OpenAI 预览版,钱花出去了,器械也摸过了,到头来却发觉还是隔壁的麻辣烫更实惠。
开发者的头发还好吗
如今搞AI开发,就好似在夜店拼桌,才刚摸清这个模型的性子,那边就又推出个更惹眼的新款。Matt讲开发者测试R1的时候,都快精神错乱了,毕竟这东西的解题思路比甲方需求还没个准头。
但从另一个方面想也挺不错,起码不用像侍奉GPT-4那样把它当祖宗一样供着。系统可以随意更换模型,这就好比外卖软件能同时下单三家店,虽说最后送来的也许都是同一家沙县小吃。
未来AI会不会思考到宇宙毁灭
照这个趋势发展下去,往后AI的思考时间,或许会比程序员发际线后移的速度还要慢。有人提议让模型思考一星期之后再给出结果AI模型,这想法跟把快递放在驿站半个月没啥区别,等拿到手的时候才发觉早就过了退货期限了。
不过要是真能憋出些创新,那也挺值当的,总比现在这些模型跟复读机似的强。只是不知道电费账单会不会比模型参数涨得还快。
模型竞赛最后比的是谁家电表转得慢
如今各大厂竞争的,并非模型有多聪慧,而是谁家服务器先冒烟。开源模型看似省心,实则调试起来麻烦得很。有公司已着手用AI预测AI的崩溃时间,这简直就是数字时代的占卜术。
说到底,这场军备竞赛到最后,可能就只有两三家还付得起电费。其他的AI 行业快速发展竞争激烈,多款自研模型媲美 OpenAI 预览版,大概就跟共享单车似的,还没认全颜色就倒闭咯。
所以问题就来了,你们觉着下次大厂裁员的时候,会不会先把天天给模型喂数据的标注员给炒了,毕竟现在AI都学会自己编数据了,就跟大学生抄作业一样 。