深度求索新出的MoE大模型V2,这价格低得让我怀疑人生
这年月,AI公司们都在拼谁更会省银子,深度求索直接亮出一张王牌:V2模型性能跟GPT-4有得一拼,可价格却只要它的百分之一。这操作,简直就像在菜市场砍价,老板一激动,直接给你来了个骨折优惠。
性能强到离谱
V2那家伙参数高达2360亿,结果活跃的才210亿,这就像学霸考试时只使出了三成功力就秒杀了所有人。中文能力那叫一个杠杠的,直接跟GPT-4-Turbo和文心4.0一较高下AI模型,至于英文,那更是吊打当前最火的开源模型。
练了8.1万亿个token,结果算力才Llama 3 70B的五分之一。这就像你花五毛钱搞了个好莱坞大片级别的特效,让隔壁Meta那帮人看了都得赶紧改PPT,连夜加班。
价格低到谷底
V2的API收费版只要GPT-4的百分之一那么贵开源大模型新秀DeepSeek-V2发布,媲美GPT-4且价格仅百分之一,而且还能白嫖五百个token。这定价,搞不好其他公司的销售团队都开始琢磨改行卖红薯去了。
有网友一算,一台服务器每小时能赚个七成,这东西根本不是什么AI公司,简直就是个活脱脱的印钞机附体。深度求索这帮家伙,估计是想用低价策略直接把竞争对手干趴下,毕竟在科技圈里,“薄利多销”这招还是挺管用的。
技术骚操作一堆
为了省点小钱,V2这小子搞了个低秩键值压缩技术,给数据来了个减肥大法。MoE架构这东西也来个新把戏,16路并行训练搞出多线程的感觉,通信成本还低得跟啥似的。
这东西简直逆天,居然能跟OpenAI的API无缝对接,用户连代码都省得动一根指头。这操作就像你去麦当劳点了个汉堡,服务员直接给你端来一整份肯德基全家桶,还笑嘻嘻地说:“凑合吃,反正都一个味儿。”
开源界的搅局者
现在这开源模型圈儿,简直跟手机圈儿那小米年代似的:性能跟顶级旗舰杠上,价格直接杀到最低点。V2那中文资料库,比Llama 3丰富多了,质量也是杠杠的AI模型,简直给老外开了个中文速成班。
这AI圈的内卷速度,简直比网红过气还猛。今天个V2风光无限,明儿个说不定就被哪个车库里的创业小公司给超越了。毕竟在这行,最厉害的模型永远是那个“下一款”。
商业逻辑被颠覆
老式的靠高价API捞金的玩法,现在让V2给整了个大翻车。毛利率高达70%开源大模型新秀DeepSeek-V2发布,媲美GPT-4且价格仅百分之一,这数据说明技术降价比涨价更能让用户掏腰包。其他厂商要么学学降价,要么就只能拿“我们更安全”这种玄乎其玄的卖点来唬人。
这深度探索的招数,跟用拼多多那套玩法打高端局似的。以后要是投资大佬问“你们这跟GPT-4有啥不一样”,创业小能手们估计都得齐声答:“咱们这更实惠。”
这事挺棘手的:咱们公司要是打算搞个大模型API,是得选那个性能超群、价格却让人心疼的GPT-4,还是选那个价格亲民、量又足的V2?这俩家伙,一个贵得要死,一个便宜得要命,真是让人头大。
还没有评论,来说两句吧...