多家互联网公司都进军了AI赛道,在最近这段时间里,我们可以看到各种大模型集中爆发。那么在国产AI掀起“百模大战”之时,我们要如何解读当前的发展现状?谁又能真正拿到未来大语言模型的“船票”呢?一起来看看作者的分析。
近日,在麻省理工学院举办的“The Future of Business with AI”论坛上,OpenAI的首席执行官Sam Altman首次回应《暂停AI巨型实验》的公开信。按照这位“ChatGPT之父”的说法,“建更大的模型,喂更多的数据”已经不能奏效,GPT-4的硬件条件也到了天花板。
但ChatGPT自发布以来掀起的科技军备战并没有停息,其余威在国内愈演愈烈,各公司在AI领域卷生卷死,各种大模型集中爆发,颇有十年前“千团大战”的气势。相比此前数千家团购赛道玩家疯狂烧钱,每一位“百模大战”的参与者都在争夺时间,试图让自己提前出线。
一、“百模大战”,一触即发
原本,国内的这波“百模大战”或许不会来得这么快,但在国外的ChatGPT掀起AI热潮之后,压力给到了国内的科技公司。为了顺势提前卡位,各家都选择且不管能否实战,先把成果端出来溜溜。在媒体报道中,它们都属于“类ChatGPT产品”。
在百度打响AI大模型内卷第一枪之前,大多还是小打小闹。小公司的数据库不够,开发的AI大模型训练不足;大公司则只停留在放出风声的阶段,阿里声称可能将AI大模型技术与钉钉深度结合,腾讯则表示成立“混元助手(HunyuanAide)”项目组来构建大参数语言模型。
直到2月7日,百度在公众号官宣将推出大模型新项目文心一言(ERNIE Bot)。消息一出,全网翘首以盼,坐等百度大招。
没想到的是,在3月16日文心一言新闻发布会召开的前一天,GPT-4重磅推出,百度此前铺垫的热度为他人做嫁衣,还因为GPT-4的功能升级而被架到了毫无退路的期待高位上。
热闹之中,相比发布会开始之前的众望,发布会开始之后铺天盖地的吐槽,诸如功能不惊艳、使用提前录制的演示案例、需要邀请码才能体验等问题,让文心一言在AI领域的路人盘岌岌可危,甚至被嘲“ChatPPT”。
而当时百度创始人李彦宏关于“百度文心一言和OpenAI差距可能在两个月左右”的说法,在后来搜狗创始人王小川官宣与前搜狗COO茹立云联合创立的AI大模型公司“百川智能”之际,又被翻出来作为双方隔空掐架的主题。很难想象,我们在2023年还能看到巨头们互怼对方脱离一线。
但这只是“百模大战”的冰山一角,过程中有无数公司或赶来入局,或官宣蛰伏的产品。无一例外的是,它们都吸取了百度翻车的教训——拒绝高调直播,尽量配备现场实测。
阿里达摩院先是低调地在魔搭社区(ModelScope)放出了“文本生成视频大模型”(体验链接:https://modelscope.cn/studios/damo/text-to-video-synthesis/summary)。
至4月7日,阿里云推出专门响应人类指令的语言大模型“通义千问”,面向企业及邀请用户开放,并表示在月底逐步开放文字生成图像产品“通义万相”。此外,旗下的AIGC交互系统和个性化大模型“鸟鸟分鸟”也将向行业开放。
实际上,阿里巴巴在大模型领域并非新手。其曾在2019年推出LLM模型(Large language model大语言模型)PLUG,在2021年官宣了多模态大模型M6,后者至今没有对公众开放,但据悉已在旗下产业应用。
目前,BAT已有两家下场竞赛,剩下的腾讯则另辟蹊径,于4月14日发布面向大模型训练的新一代HCC(High-Performance Computing Cluster)高性能计算集群。显然,腾讯瞄准的是大模型最容易被卡脖子的算力问题。
跻身互联网大厂新贵的字节跳动也没闲着,旗下的火山引擎在4月18日发布自研DPU等系列云产品,并推出新版机器学习平台,支持企业客户更好地训练AI大模型。根据火山引擎总裁谭待透露,“国内大模型领域的数十家企业,超过七成已经在火山引擎云上。”
显然,搞基层的这两家未来必会有短兵交接的时候。
此外,据微果酱不完全统计,近期往大模型方向伸手的包括但不限于:
- 3月29日,三六零发布360gpt“翻车”,十天后宣布“360智脑”落地搜索场景。
- 4月8日,华为公开“盘古大模型”的进展,或将上线。
- 4月10日,昆仑万维宣布合作奇点智源的大语言模型“天工3.5”将发布。
- 4月10日,商汤科技公布大模型体系“日日新SenseNova”。
- 4月13日,知乎合作面壁智能发布中文大模型“知海图AI”。
- 4月20日,科大讯飞宣布将于5月6日发布讯飞星火认知大模型(https://xinghuo.xfyun.cn/)。
- 4月20日,出门问问宣布内测大模型“序列猴子”。
- 4月21日,复旦大学的新版MOSS模型上线(https://moss.fastnlp.top/)。
- ……
如此密集的新品官宣场面,让沉寂已久的科技圈沸腾了起来,也足以让你对AI热潮有更具象的认知。毋庸置疑,“百模大战”一触即发。
二、“百模大战”的实质和未来:不是谁都能拿到最后的船票
所有产品都值得用大模型重做一遍。
在2023年阿里云峰会上,阿里巴巴集团董事会主席兼CEO张勇喊出如此口号。
这样的说法在近几年常常耳闻,每时兴一种事物,所有产品、产业都能用其逻辑再做一遍,现在轮到大模型了。
放到应用层面来理解,每个玩家都期待借着这个风口,把自家产品包装一下再重新推广出去。所以,目前各家的大模型都与本身业务类型相关,比如360智脑率先落地搜索场景,知海图AI的首个功能“热榜摘要”将对知乎热榜的问答进行抓取并把梗概整合给用户。
这种风向在一定程度上说明了国内“百模大战”的实质——相比底层技术的成熟程度,大家更加关注其应用的有效性。也就是说,当前大模型的内卷说到底仍然是互联网企业主流业务的竞争,大模型的辅助作用更像是跟风的宣传噱头。
4月18日,钉钉、WPS、印象笔记在同一天官宣“AI办公助手”,再加上相距一周前飞书发布的“My AI”,都是大模型能力在办公场景的落地。这便是“百模大战”实质的力证之一,各家没有将推广笔墨花在背靠的大模型上,用户也并不关心,大家都聚焦在产品应用,实用才是硬道理。
所以,从初始提大模型必带参数,到现在推出大模型只说明能如何应用,真正把大模型做出声量的并不多。在这种情况下,诸如出门问问创始人李志飞等大佬,思路也从做通用型大模型转向做结合自身业务场景的垂直整合大模型。
另一方面,“百模大战”实际上卷的还是各家多年技术积淀的实力,所以也体现为大家仍是在自己擅长的领域进阶的情况。
就像OpenAI公司在发布ChatGPT之前已经深耕行业八年,微软先后投资高达100亿美元,OpenAI对于GPT-3的训练费用超1200万美元,“每次训练消耗的电力足够3000辆特斯拉汽车每辆跑20万英里。”
国内“百模大战”的玩家们应当对这个赛道的巨额成本深有体会,所以除了头部的几家企业,余者还是从自己擅长的产品出发做结合。当前能够把成果真正拿出手的寥寥,而它们大多已经在自己当霸主的领域发展多年,沉淀了海量数据。
实际上,“百模大战”发展至今,满打满算才三个月左右,竞争却按天论计。现阶段“百模大战”的实质释放出一些关乎未来的信号,我们不妨大胆预测:
1)“百模大战”的后期会变成寡头相持
由于算力、资金、技术门槛存在,能在大模型内卷中走到最后的或许还是资本实力和科技积累更加深厚的巨头们,新生选手面临更大的竞争困难。
2)“百模大战”的升级天花板有限
算力限制让GPT的发展都有所保留,“百模大战”的最后必然需要直面这个问题,在追赶GPT的路上能走多远或许与客观条件有更强的相关性。
3)“百模大战”的结局将回归产品深化
巨头们不会轻易放弃原有的优势赛道,大模型之争最终会落到产品应用场景,为“产品+AI”提供支持,加固原有的产品护城河。
4)“百模大战”将延伸出更多垂直模型竞赛
近来,国外大模型的相关动作就呈现了细分趋势,这在一定程度上可以预示国内“百模大战”的更多可能性:
OpenAI发布了AI画图模型Consistency Models,支持修改现有图像不需任何额外训练和数据;英伟达推出AI视频生成模型VideoLDM,可以根据用户的文本描述自动生成视频;Meta推出AI模型Segment Anything Model,能根据文本指令等方式实现“一键抠图”;微软则拟推出AI芯片“雅典娜”,为大语言模型提供动力……
综上所述,国内“百模大战”可以算是ChatGPT掀起AI热潮的一个缩影,无论是否准备好,时代已经推着所有企业走到了这一步。就目前来说,大模型们仍然处于“只闻其声不见其人”的初级阶段,旋涡中心的参与者未来必将还有鏖战。
但对于普通用户来说,感知到的时候,科技竞争就已经决出胜负,最终落地的产品应用便是赢家。
评论(0)