科技云报到 · 5月19日 · 美国

科技云报道:何许人也?敢把大模型价格“打骨折”?

科技云报道原创。

云计算价格战的硝烟尚未散去,全球AI大模型也卷出了“骨折价”。

今年以来,OpenAI、Mistral AI、通义千问、智谱AI、文心一言纷纷祭出降价“撒手锏”。

在海外,法国人工智能企业Mistral AI大模型Mistral Large的输入、输出价格比GPT-4 Turbo便宜约20%。OpenAI推出新一代旗舰AI模型GPT-4o,其API价格下降50%。

国产大模型在降价上也“不甘落后”。通义千问2.5性能基本追平GPT-4 Turbo,个人用户可从App、官网和小程序免费使用。

智谱AI将入门级大模型GLM-3 Turbo调用价格下调80%,1元就可以购买100万tokens。字节跳动豆包大模型开启对外服务,根据火山引擎公布的价格计算,1块钱就能买到豆包主力模型的125万Tokens。

究竟是什么原因引发了大模型这轮波澜壮阔的降价潮?降价后大模型将往何处去?值得我们研究。

全球大模型掀起降价潮原因几何?

任何技术最终的落脚点都是实用性、易用性和性价比的三者统一,没有例外。

无论是当初的电商、外卖、手机,还是如今的新能源汽车、大模型,当技术发展到一定阶段,竞争到最后都会遵循价格第一的铁律。目前,全球大模型产业不约而同地掀起“降价潮”,也正印证了一个规律:性价比是商业最高真谛,贵不等于值得,划算才是。

在新技术或新产品追求大规模商业化落地过程中,“降价”策略得以使新技术和产品得到最快速度、最大限度的普及,也成为科技企业技术商业化的必然路径。

全球大模型头部企业OpenAI于近日宣布最新GPT-4o多模态大模型,其在保持与GPT-4同等智能水平的基础上,实现了文本、图像和语音处理的全面提升,同时GPT-4o将免费开放给所有用户,整体API价格相比于前代也下降了50%。

事实上,这已不是OpenAI在商业化道路上的第一次降价。以GPT-3.5系列的输入成本为例,2023年3月首次降价90%,6月再次降价25%,到了2024年2月,进行第三次降价50%。

反观国内,以具有代表性的大模型头部企业智谱AI为例,去年6月,在科技媒体The Information的盘点中,智谱AI被视为最有可能成为“中国OpenAI”的5家企业之一,其一举一动在业内具有风向标性质。

智谱AI的大模型开放平台bigmodel.cn于近日上线了全新的价格体系。新注册用户可以获得额度从500万tokens大幅提升4倍,至2500万tokens,入门级产品GLM-3Turbo模型产品的调用价格更是断崖式下降80%,从5元/百万tokens直接降至1元/百万tokens,堪称“价格屠夫”。

我们看来,降价并非简单粗暴的价格战,而是充分释放让利空间,是技术、规模带来的正循环。目前,大模型应用发展仍处于早期阶段。QuestMobile数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。而降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

“数据飞轮”在大模型进化过程中的作用不可忽视,通过客户在应用程序中输入的提示词这样的数据反馈,使大模型快速迭代。

通过降价,一方面用户不仅感受到了大模型应用带来的便利和高效,大模型企业还可以更快速地吸引用户,通过用户反馈数据加速大模型迭代升级,另一方面帮助大模型企业抢占市场份额提高营收,以对冲高昂的研发投入,真正实现“技术-场景-盈利”的商业化闭环,同时随着大模型应用场景的开拓,还会衍生出更多的微调及推理等需求,进一步带动国内AI应用的繁荣发展。

从这个角度来讲,大模型降价这事无论对于个人用户还是企业用户都是一种双赢。

大模型迈入“普惠时代”

通过对比通义千问、文心一言、百川、MiniMax、月之暗面等入门级产品API调用价格不难发现,智谱AI此次降价幅度之大前所未有。

价格调整后,使用GLM-3 Turbo创作一万条小红书文案(以350字计)将仅需约1元钱,足以让更多企业和个人都能用上这款入门级产品。

除了个人版GLM-3Turbo,智谱AI的企业级产品GLM-4/GLM-4V价格尚未出现大幅波动,仍维持在0.1元/千tokens,百万tokens的价格为100元。作为一款能力逼近GPT-4的国内领先大模型,GLM-4这一价格还是具有明显优势。

再与OpenAI价格进行对比,其最新模型GPT-4 Turbo每100万tokens输入/输出价格分别是10/30美元。Claude 3 Opus则更贵,每百万tokens输入/输出价格15/75美元。

在这轮降价潮中,我们可以隐约看到“摩尔定律”也在深深影响着大模型行业。伴随大模型价格下降的是性能的大幅提升。

今年3月,清华大学基础模型研究中心联合中关村实验室发布的《SuperBench大模型综合能力评测报告》显示,GLM-4已然闯入第一梯队,与GPT-4、Claude-3等国际一流模型水平接近,且差距已经逐渐缩小。

2023年3月,智谱AI推出千亿开源基座对话模型ChatGLM系列,并在过去一年内完成4次升级,于2024年1月推出新一代基座大模型GLM-4系列,整体性能相比上一代提升了60%,已经逼近GPT-4。

它能够支持128k的上下文窗口长度,与GPT-4 Turbo相当,同时具备更强多模态能力,效果超过开源SD模型,逼近DALLE-3。

为进一步降低大模型使用门槛,智谱AI推出智能体定制功能,用户只需使用简单的提示词指令,就可以创建属于自己的智能体。

任何人都可以自由运用GLM-4模型,即使没有任何编程基础,也能便捷地进行大模型开发。正是得益于GLM模型的强大的智能体能力,GLM-4实现了自主根据用户意图,自动理解、规划复杂指令,从而完成更加复杂的任务。

技术的持续进步为降低开发大模型成本提供了现实可能。智谱AI通过模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现,以及精细化集群调度等技术,将GLM-3 Turbo推理成本进行大幅压缩。

自大模型开放平台上线以来,在模型效果和推理性能不断提升的情况下,已累计降价超过百倍,这无疑也给了智谱AI将API调用价格打至“冰点”的底气。

一直以来,大模型给外界的印象是贵、小众。事实也确实如此,在行业发展初期,由于还未形成规模效应,厂商的成本一直居高不下,很多企业和开发者只能望洋兴叹。

但智谱AI等大模型厂商此次调价向行业和公众宣告这样一个事实:优质的大模型,不一定要花大价钱,“技术普惠时代”已经到来。

所谓的“技术普惠”,就是坚持致力于突破技术壁垒,让更多前沿科技以大众更能接受的价格走进生活,让更多人有机会享受到科技带来的便利。

“强性能+好价格”是技术普惠的最大特征,智谱AI正在沿着这条路前行,其开放平台上已经聚集了超过数十万的企业和开发者,并且在持续快速增长,过去的半年每日的token消耗增长超过一百倍。

比如官方开发的三个调用工具,网页检索、函数调用以及知识库,自从1月上线以来调用次数已经超过3亿次。

智谱AI CEO张鹏曾表示:“虽然目前技术已经非常快速地在呈现,但仍有很多问题值得去探索。智谱着眼于通用人工智能(AGI),这里的每一个问题的突破都有可能实现飞跃式发展,我们还远未达到技术的天花板,但曙光已现,2024年是向AGI发起冲锋的起始年份。”而此轮凌厉的降价,预示着智谱AI吹响了向AGI发起冲锋的号角。

商业化先行者已立潮头

虽说大模型这两年很火,但质疑之声仍不绝于耳。

其中一个很重要的原因,就因为现阶段做大模型每天的投入可能成百上千万,但很多的产品目前商业化程度并不高,有点像“砸钱赚吆喝”。

虽然“高投入”依然是主流大模型赛道玩家的主色调,但近两年,基础大模型及上层应用服务商的盈利能力明显在增强。同时,大模型应用在C端涌现出了不少现象级产品,但很多仍处于以免费模式获客到商业转化的阶段,营收规模并不突出。

在这其中,OpenAI较早开始商业化尝试,2022年对外的营收是2800万美元,2023年ARR增至16亿美元,激起了业内的无限联想。不过,OpenAI爆发式的营收增长和其丰富的业务线、市场占有率、以及B端、C端的双布局也有很大关系。

对比国外,国内企业级大模型服务的渗透更快,发展势头也更猛。在B端需求井喷以及客户群较高的付费能力的推动下,《中国AIGC应用全景报告》预测,国内AIGC应用市场2024年底有望增至200亿规模,预计2030年可达万亿规模。

从目前来看,底层通用大模型赛道多采用开放API接口的形式,扩大客群,最终按实际消耗或调用的tokens量收费。对于主流的大模型应用来说,按订阅费、调用费以及定制化收费显得更常见。

比如OpenAI的另一条业务线DALL-E 3,虽然没有公布明确的商业计划,不过它更多向ChatGPT的付费版/企业版用户开放,充分放大了ChatGPT会员订阅的吸引力。

反观智谱AI,其大模型开放平台bigmodel.cn,被视为公司今后大模型应用和商业化的重要接口之一,其平台生态也日益壮大。截至目前,智谱AI已有超过2000家生态合作伙伴、1000家规模化应用和200家深度共创客户。

通过采用降价策略,智谱AI率先抢占市场一角,吸引大量企业和开发者对API的调用,当企业和开发者形成平台粘性后,实现大规模营收也就是顺理成章的事情了。

在大模型的激烈竞争中,智谱AI率先拿起“价格屠刀”,无疑将带给行业不小的压力,但也加速了整个行业的商业化进程。

对于大模型厂商而言,价格战既是压力也是前进的动力,但对于企业和开发者而言,则是实实在在的利益和价值,有助于加快大模型行业应用创新落地。

但最终市场蛋糕能做多大,将取决于能否落地合适的业务场景,打造商业闭环,同时也是对大模型应用服务商自身的产品和服务实力的深度考验。

可以预见的是,未来大模型一定是技术、成本、性价比三者的平衡,国内大模型厂商通过不断在B端和C端进行持续探索,将为大模型打通商业化闭环提供了切实可行的路径。尽管前路挑战重重,但随着技术的普惠发展,我们相信,大模型全民普及时代正加速到来,一个充满机遇和创新的新纪元已为时不远。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、数博会、国家网安周与全球云计算等大型活动的官方指定传播媒体之一。深入原创报道云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。

推荐阅读
关注数
9
内容数
119
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息