开源大模型新秀DeepSeek-V2发布，媲美GPT-4且价格仅百分之一

深度求索新出的MoE大模型V2，这价格低得让我怀疑人生

这年月，AI公司们都在拼谁更会省银子，深度求索直接亮出一张王牌：V2模型性能跟GPT-4有得一拼，可价格却只要它的百分之一。这操作，简直就像在菜市场砍价，老板一激动，直接给你来了个骨折优惠。

开源大模型DeepSeek-V2_DeepSeek-V2 MoE大模型_AI模型

性能强到离谱

V2那家伙参数高达2360亿，结果活跃的才210亿，这就像学霸考试时只使出了三成功力就秒杀了所有人。中文能力那叫一个杠杠的，直接跟GPT-4-Turbo和文心4.0一较高下AI模型，至于英文，那更是吊打当前最火的开源模型。

练了8.1万亿个token，结果算力才Llama 3 70B的五分之一。这就像你花五毛钱搞了个好莱坞大片级别的特效，让隔壁Meta那帮人看了都得赶紧改PPT，连夜加班。

价格低到谷底

V2的API收费版只要GPT-4的百分之一那么贵开源大模型新秀DeepSeek-V2发布，媲美GPT-4且价格仅百分之一，而且还能白嫖五百个token。这定价，搞不好其他公司的销售团队都开始琢磨改行卖红薯去了。

有网友一算，一台服务器每小时能赚个七成，这东西根本不是什么AI公司，简直就是个活脱脱的印钞机附体。深度求索这帮家伙，估计是想用低价策略直接把竞争对手干趴下，毕竟在科技圈里，“薄利多销”这招还是挺管用的。

AI模型_DeepSeek-V2 MoE大模型_开源大模型DeepSeek-V2

技术骚操作一堆

为了省点小钱，V2这小子搞了个低秩键值压缩技术，给数据来了个减肥大法。MoE架构这东西也来个新把戏，16路并行训练搞出多线程的感觉，通信成本还低得跟啥似的。

这东西简直逆天，居然能跟OpenAI的API无缝对接，用户连代码都省得动一根指头。这操作就像你去麦当劳点了个汉堡，服务员直接给你端来一整份肯德基全家桶，还笑嘻嘻地说：“凑合吃，反正都一个味儿。”

开源界的搅局者

现在这开源模型圈儿，简直跟手机圈儿那小米年代似的：性能跟顶级旗舰杠上，价格直接杀到最低点。V2那中文资料库，比Llama 3丰富多了，质量也是杠杠的AI模型，简直给老外开了个中文速成班。

这AI圈的内卷速度，简直比网红过气还猛。今天个V2风光无限，明儿个说不定就被哪个车库里的创业小公司给超越了。毕竟在这行，最厉害的模型永远是那个“下一款”。

DeepSeek-V2 MoE大模型_开源大模型DeepSeek-V2_AI模型

商业逻辑被颠覆

老式的靠高价API捞金的玩法，现在让V2给整了个大翻车。毛利率高达70%开源大模型新秀DeepSeek-V2发布，媲美GPT-4且价格仅百分之一，这数据说明技术降价比涨价更能让用户掏腰包。其他厂商要么学学降价，要么就只能拿“我们更安全”这种玄乎其玄的卖点来唬人。

AI模型_开源大模型DeepSeek-V2_DeepSeek-V2 MoE大模型

这深度探索的招数，跟用拼多多那套玩法打高端局似的。以后要是投资大佬问“你们这跟GPT-4有啥不一样”，创业小能手们估计都得齐声答：“咱们这更实惠。”

这事挺棘手的：咱们公司要是打算搞个大模型API，是得选那个性能超群、价格却让人心疼的GPT-4，还是选那个价格亲民、量又足的V2？这俩家伙，一个贵得要死，一个便宜得要命，真是让人头大。

还没有评论，来说两句吧...