以为是套路,其实是账单。
6月1日,36氪爆料称:豆包即将收费,预计6月下旬启动。同时称,定价将分为三档。这一报道当即引起舆论震动。
而上述信息在经过两天发酵后,也终于引来官方回应。
6月3日,豆包官方发表《关于豆包即将推出专业版的说明》正式回应,表态日常功能保持免费、收费只针对专业生产力场景,同时指责最近两日内有大量营销号散布不实信息。
这“谣”辟得就和没辟似的。因为整篇说明的核心意思,实际还是承认了36氪报道的主要信息,即豆包收费在即这个事实。仅仅对“大量营销号散布不实信息”这种赛博常见的加料炒作行为,表达了不满。

当然,事后很多网民回溯豆包之前的信息,发现其实早在一个月前,豆包App Store页面就出现过付费版本服务声明,而且还标明了68元、200元和500元的三档付费标准。尽管当时产品内并无实际付费入口。
缕一缕“豆包收费”风波里的真真假假
粗看起来,这一次从“收费传闻”到官方“辟谣”的整个循环,就如同这些年赛博空间内常见的企业PR危机:确有其事,但官方却扭扭捏捏不敢直面,最后弄了一个看起来似乎不着调的、名曰辟谣,实际承认的声明,把锅甩到舆论发酵后各路跟风炒作的自媒体头上。
所以我们来详细缕一缕这个事件的前后关系以及其中因果。首先是必须肯定,“收费”传闻确有其事。
豆包官方6月3日那份《关于豆包即将推出专业版的说明》,实际并不是在否认36氪那个“即将推出付费版”的爆料,而是承认了将会面向软件开发、数据分析、专业设计、流程自动化、金融分析、科研等专业生产力场景,推出付费专业版。
但同时官方也强调了,包括搜索问答、写作生图、语音/视频对话这些日常功能,将会保持免费状态;同步还再次说明了,目前专业版还在测试,上线后(收费)会走公开合规渠道。
所以站在最客观角度,豆包官方实际不是在辟谣“要收费”的传言,而是在强调绝不会取消免费版、逼迫所有用户买会员的说法——这也是其指责“大量营销号散布不实信息”的核心问题。
看到这里,相信大家也都释然了:这收费的领域和继续免费的功能,似乎也算合情合理。所以为什么网上会立即出现“大量不实消息”呢?
且看官方声明第四条,其指控可谓尖锐——我们观察到,近期有大量同IP的营销号,集中发布内容完全一致的不实信息,称豆包将通过降低基础功能体验来推动用户购买会员。该说法完全不实。
笔者无法验证这条指控是否确实,但却非常合乎逻辑。毕竟豆包目前的最高月活高达3.45亿,位列国内大语言模型类应用第一宝座,天然是竞品流量战和平台流量号产业链的猎物。更何况其App Store页面5月初那个三档定价说明,不但冲击到了当前国内互联网用户内心“AI应该免费”的锚定,更是给后续谣言提供了一个“有图有真相”级别的背书材料。

▲ 鉴于近期豆包的“官司”有不少,又是航班退票闹剧又是代客订餐的,所以这次收费事件才更有热度
然而这其中的来回拉扯,反映出的实质便是:豆包的这次对专业服务推出收费已经是箭在弦上、势在必行了。而这一存在风险的商业选择背后,实质上是:即使豪气如字节跳动,也正陷入逐渐“烧不起Token”这一困局的事实。
豆包为什么要甘冒大不韪?
圈外的朋友很多并不知道Token是什么,这里简单解释一下。
在搞AI这一行,Token的准确翻译既非“令牌”,也不是“礼券”,而是“词元”,即大模型处理文本的最小计算单位。以汉字为例,每一个常见字通常计1~2个Token。
而为什么不直接用字或者词来计算?是因为其背后的残酷真相——
大语言模型虽然时不时能给出一些精妙的反馈信息,文字组织也颇为优美,但其实它并不真的“认识”输入及其反馈结果里每个字、每句话的语义,无论汉字、英文字母还是日文假名,更遑论由字组成的词或者字母构成的单词。程序只认一个数字ID表(词汇表,几万到十几万项)。在输入信息后,系统把你所说的一句话拆成一串ID的过程就叫Tokenization(分词),拆出来的每一块就是一个Token。输入ID之后,系统会基于现有算法计算出一个针对性的最优解(即概率最高的Token序列),然后再将其转换为普通用户能够理解的人类语言。
所以,对于大语言模型供应商来说,其提供服务本质上就是:用户输入一串Token,然后系统给出一串概率上最可能、近似最优的Token序列。
既然来来去去都是Token,那么豆包一天要输入输出多少Token呢?
豆包官方此前曾在3月前后有过公开披露,日均达120万亿。而作为对比,2024年5月的时候,这个数字还只有1200亿。22个月之内,增长达到了1000倍!
让我用大家都能理解的表述和单位,给烧掉的这些Token算一下成本。首先,Token的成本本质上由GPU硬件折旧(50%~60%)、含散热在内的电力成本(25%~30%)、人力成本、机房租金、网络租金等(10%~15%)三部分构成。虽然各家大语言模型提供商成本各不相同,但这里既然说的是豆包的事,就按豆包Pro口径:每百万Token输入成本约0.8元,输出约2.0元。
由此可见,如果大家没事把豆包当问答机器人随便聊几句,花费微不足道;但若有人丢一篇几千字文章让豆包总结——比如评论区常见的“用大语言模型来几句话总结全文”——那可能就得一次几分钱的程度了。而如果有人要生成个PPT甚至来段几分钟的视频,那么单次任务的成本可能要到几块钱的地步。
从二十年前开始,国内互联网的流量经济学逻辑一直是:拉更多用户,摊薄从硬件到网络服务等各项固定成本,再把用户流量通过广告或其他增值方式变现,如此循环滚动,使边际成本逐渐趋零,实现滚利润。

▲ Token的背后是真金白银
但到了大语言模型时代,规则就变了:拉更多用户意味着Token消耗线性甚至超线性增长,而每次交互都有硬成本。问题是,这个过程中你还没法插广告,否则会彻底毁掉体验,于是边际成本永远不为零,结果就变成越活跃越亏。这种状况,即使号称“互联网印钞机”的字节跳动亦无可奈何——毕竟你不可能强制用户在每一次提问获得答案前,都先看30秒广告。
所以,这里真不是给豆包开脱:这一次收费的本质,就是运营方希望用专业用户付费来补贴非专业访问,让自己少亏点。
把镜头切到汽车上
聊到上面这些,相信各位对这几天豆包收费的种种已有清晰认识。既然C次元是一个汽车媒体构筑的偏科技类矩阵账号,下面不妨聊聊从前年开始的那波“全员接大模型”浪潮,现在回头看是什么?
其实这茬风头最早可追溯到2023年下半年。当时不少整车品牌在初步完成智能座舱上车之后,逐渐发现传统体系的语音助手太蠢了点;恰好大语言模型开始展露锋芒,于是从年末起,吉利、东风、上汽、长安等开始各自宣布展开合作。
其直接结果就是:2024年北京车展上,有超过20个大语言模型上车项目集中亮相,各品牌恨不得在车尾标旁都贴上AI标识。其副作用便是:当时一众互联网流量大佬扎堆来车展刷存在感。当然,2024年还有一件大事,DeepSeek横空出世,以及紧随其后不到两周内又有十几个汽车品牌宣布“接入DeepSeek”。
那么这一波轰轰烈烈的“AI上车”,取得了什么成果?这里就偷个懒,直接引述J.D. Power(君迪)杨涛,在2025上海车展期间接受《上海汽车报》采访时曾经直言不讳。
“过去两年,大模型彻底改变了车内交互逻辑。”J.D. Power中国区汽车产品事业部总经理杨涛表示:传统语音助手仅能识别固定指令,而大模型通过自然语言处理(NLP)可理解模糊语义甚至用户情绪。
然而当前功能仍集中于娱乐和信息检索,与期待中的“全场景智能管家”尚有差距:“开车时最需要的往往是主动安全提醒或疲劳监测,但现在系统更热衷推荐短视频。”
▲ 本质上就是一个语音控制器
这番表述,中译中说直白点就是:整车企业花了不少钱和时间,自建或采购大模型能力,用户感知到的增量仅仅是——接入大语言模型后,车机终于不太会把“播放《晴天》”听成“播放《倾盆大雨》”了。这确实是一个真实进步,但远远撑不起“智能化革命”的叙事重量。
说白了,迄今为止所有“接入座舱的大模型”,本质上都是通过车载API调用大语言模型,本质就是更聪明的语音助理(遥控器)。而真正意义上的汽车AI,是让车“活过来”,变成一个可以真正交流互动、执行驾驶者与乘客指令,甚至发挥主观能动性为车上人员提供服务的存在。
从这一点来说,现实相比预期,暂时还差了十万八千里。
伴随一阵急促的电子合成器节奏音,于暮色中一望无际的大地上,一台纯黑色庞蒂亚克火鸟跑车正在飞驰,车头正中的一盏红色指示灯来回游动。
“Please don’t call me ‘car’ or ‘four wheels’, I’m KITT, Knight Industries Two Thousand.”(请勿称我为“汽车”或是“四只轮子”,我是“基特”——奈特工业2000。)
是的,上面这一幕来自经典美剧《霹雳游侠》,一段铭刻在无数中国七零、八零后甚至部分九零后记忆深处的少时科幻汽车梦。而搭载在那台无所不能的神奇汽车之上的超级智能、那个拥有自我意识的车载AI“基特”(KITT),实际就是几十年来我们所期待的“真正意义上的智能汽车”的标准形象。
《霹雳游侠》第一季于1982年首播,距离现在已过44年。令人遗憾的是,44年来尽管汽车在车载电子系统乃至座舱交互界面上取得前所未有的进步和突破,却在真正“智能”这个关键点上仍旧踌躇不前。
回望去年和前年的种种:说到底,当初车企排队接大模型的狂欢,和今年豆包站在“免费还是收费”的火线上,是同一场戏的两幕——
第一幕是“AI魔法看起来很好也很便宜”的放卫星;而第二幕成了“哦,原来每个token都要付电费”的讽刺戏码。但这不是坏事:对于产业乃至于广大用户来说,只有走出幻象、打破神话,真正的建设才会开始。
