AI大模型排名公布后,各路厂商纷纷暗中较劲。这榜单简直就像期末考试的成绩单,可这次比拼的不是学生的脑细胞,而是服务器集群的算力值。
百度文心一言领跑榜单
百度这次考了7个满分,简直就是班上那个每科都拿A的学霸。但你细看,这学霸偏科挺厉害的国内百模大战谁实力最强?IDC发布AI大模型技术能力评估报告2023,在业务范围上明显比不上阿里。百度那技术老大估计正熬夜开会,琢磨着怎么把剩下的4项也给搞成满分。
阿里家的通义千问紧跟着拿下了6个满分,简直就是班上那个万年老二,每次考试都比那个学霸少那么点分数。不过,在商业落地这块,阿里确实有两把刷子,毕竟他们最拿手的就是把技术这门手艺变成能赚钱的买卖。现在就看他们能不能把技术这块短板给补上,争取下次考试能逆袭一把。
阿里通义千问紧咬不放
通义千问那创新能力简直满分,这画风太阿里了。他们连个双十谬论都能玩出新花样,技术创新那是手到擒来。不过,报告也说了,他们在行业覆盖上还有得提高,光会创新那可不行,还得把业务版图再拓宽点。
科大讯飞的星火认知考试拿了四个满分,这成绩简直了得。就跟咱们班那个特长生似的,总分虽然没排第一,但在那几个专业领域里,绝对是顶尖高手。讯飞在语音识别这块的技术储备,那可真是让其他厂家羡慕得不行。
科大讯飞稳居第三
星火认知在语音交互领域的表现简直能当教材用。毕竟这可是他们吃饭的家伙,要是连自己最拿手的领域都拿不到满分,那可真是成了天大的笑话。不过,在其他技术方面AI模型,讯飞还得继续努力,可不能总靠着老本混日子。
第四范式和智谱AI各得了两个满分,这成绩在重点班可能不算啥,但在全年级里已经算得上是学霸了。尤其是智谱AI,这创业小公司能跟BAT这种大鳄一起玩,本身就够吹牛的。
二线厂商暗自发力
这帮二线厂家,最让人佩服的就是他们懂得在资源有限的情况下得集中力量。跟那些大厂家比,他们不搞全面开花那一套,而是先在几个小领域里把事做到最好。这招挺高明,至少能让人在排行榜上看到他们的名字。
报告里头那14家厂子,360的表现真是个谜。本来是搞安全的,结果在大模型这行居然混得风生水起。这就像学校里那体育好的家伙,平时就爱玩,突然考试也能进年级前二十,让人不得不佩服得五体投地。
行业应用才是终极考验
这份报告最让人眼前一亮的是,它没把那啥大模型当成了装逼的道具,反而着重说了得能解决实际问题。就好比考试光会做题可不行,还得知道怎么把那学问用到实际生活里去。现在的问题就是AI模型国内百模大战谁实力最强?IDC发布AI大模型技术能力评估报告2023,好多大模型在实验室里那叫一个风光,一到实际应用场景就蔫了。
厂商们,现在最要紧的不是光顾着冲榜,得好好琢磨怎么把技术落到实处。企业客户们可不是傻瓜,他们不会因为实验室里那些花哨的数据就掏钱,他们需要的是能真正解决问题的产品。这事,各家厂商最好赶紧开窍。
未来属于开源开放
预测说开源成主流,这话说得挺靠谱。现在的这些大模型,跟安卓早期似的,越开放越有戏。要是有人还死抱着闭源那套,早晚得被市场踢出局。但开源这事也有风险,技术壁垒不是光靠情怀就能垒起来的。
到了这个地步,大模型的发展不能再只看技术参数了。手机行业早就不玩跑分那套了,现在大家拼的是用户感受和生态圈。得看哪家公司最先悟出这其中的门道。
瞧这榜单,不禁让人好奇:在这堆大模型里,哪个能成未来三年的行业老大?