Tokenmaxxing:当 AI 的"账单"追上"信仰"

评论

今天看了一篇文章,聊的是硅谷和国内科技圈最近特别火的一个现象——Tokenmaxxing,说白了就是企业无节制地烧 AI Token,像不要钱一样。

文章里讲了好几个故事,挺有意思的,分享一下。

先说 Uber。

Uber 的运营负责人 Andrew Macdonald 最近在接受采访的时候说了句话,大意是:公司现在越来越难证明 AI Token 的消耗是合理的。原因是 Uber 提前用完了 2026 年的 Claude Code 预算——这事之前 CTO 得意洋洋地透露过,还在网上火了一阵。但 Macdonald 冷静下来一算,发现问题了:Token 用了那么多,真正对消费者有用的功能,并没有同比例增长。

他说了一句挺实在的话:”如果你只是坐在那里想各种有趣的用例,而且不用自己付钱,AI 看起来确实是免费的。但最终,账单是由公司来买的。”

据说 Uber CEO 已经为了对冲 AI 投入,开始放缓招聘了。

再看几个烧钱的案例,那就更夸张了。

米哈游内部有个员工,为了实现一个项目,建了几十个 Agent 一起干活,结果一个晚上烧掉了 200 万人民币的 Token。团队负责人说”这是学费”,网友说”价值没看出来”。

Meta 的数据更吓人——员工在 30 天内消耗了 60.2 万亿个 AI Token,按 Anthropic 的价格算,这笔成本可能高达 9 亿美元。九亿美元,就烧了三十天。

不过呢,也有人开始踩刹车了。

多邻国曾经想把 AI 使用量纳入绩效考核,结果员工开始困惑:”我到底是为了用 AI 才用 AI,还是因为它真的有用?”公司最后收回了这个做法。CEO 的判断很简单:绩效考核的核心是把本职工作做到最好,AI 能帮忙就用,但不能为了用而用。

Shopify 把”Token 排行榜”改成了”使用情况仪表盘”,还加了熔断机制——某个员工一天的花费突然飙升,系统自动断掉权限。Meta 在舆论发酵后也下线了排行榜。

最荒诞的是 Salesforce。他们做了个 Mac 小组件,每 15 分钟刷新一次个人 Token 花费,还能看同事的用量。设置了最低消费线——Claude Code 每月 100 美元,Cursor 每月 70 美元。结果呢?员工开始刷 Token 达标。不是做出更好的产品,就是单纯把数字刷上去。像极了当年把”日均外呼电话数”当 KPI 的销售团队——电话打了,业绩没变。

那这场狂欢谁赚了?

第一层是 OpenAI、Anthropic 这些模型厂商,Anthropic 预计 2026 年第二季度销售额超过 109 亿美元,已经把企业焦虑直接变成了 API 收入。第二层是 Cursor、Claude Code 这些 AI 编程工具,Cursor 年化收入超 10 亿美元。第三层是英伟达这些卖算力的,单季收入 816 亿美元,同比增长 85%。而最大的输家,是那些无法把 Token 消耗转化成实际产出、但还在盲目跟风往里砸钱的企业。

更有意思的是,YC 正在把 Tokenmaxxing 包装成创业方法论。YC 合伙人 Diana Hu 对创业者说:最大化 Token 使用而不是最大化员工人数,这才是关键转变。文章反问了一句:连有收入的 AI 工具公司都还没盈利,创业公司凭什么撑得起”高到令人不舒服的 API 账单”?

文章结尾说了一句话,我觉得是整篇的点睛之笔:“Tokenmaxxing 的本质,是企业在 AI 转型焦虑下,把’消耗’误当成了’生产力’。”


读完全文,我最大的感受是——似曾相识。

不是技术上的,是管理上的。

2015 年喊”互联网+转型”,2019 年喊”All in 中台”,2021 年喊”数字化转型”。每一次新概念出来,企业都经历同样的循环:先烧钱表态度,再算账发现不对,最后回归理性。Tokenmaxxing 不过是这个循环的 2026 年版本。

Uber 那个故事最打动我的,不是 CTO 说”我们用完了预算”,而是运营负责人 Macdonald 那句”脑袋炸开了”。因为说这话的人不是技术乐观主义者,是算账的人。当一个运营负责人开始问”这笔钱到底换来了什么”,说明 AI 在企业内部已经从”尝鲜期”进入了”常态化期”。接下来的问题都一样:当你没法在 AI 投入和业务产出之间建立清晰的因果关系,你还能说服董事会继续批预算吗?

米哈游那个 200 万一晚的故事,让我想起 2021 年的中台热。当年有公司花两千万搭中台,最后只跑通了审批流。负责人的说法也是”这是基础设施投入”。结果呢?中台这个概念验证了一件事:不能和产出画等号的投入,再多预算也撑不过两个财务周期。 AI Agent 和中台的区别在于:中台烧的是工程师的头发,AI Agent 烧的是实打实的 Token 账单。工程师可以免费加班,但模型调用每一次都记在账上。现金流不会骗人。

Salesforce 的做法看起来荒诞,其实是经典管理错误的又一次复刻。把 Token 消耗量当考核指标,员工就会去想怎么刷 Token 而不是怎么写出好代码。Tokenmaxxing 的悖论就在这里:一旦消耗量成为目标,它就被异化了。 员工不是在创造价值,是在交”AI 税”。多邻国 CEO 做得对——他叫停的理由很简单:AI 是工具,不是目标。这个判断标准,吊打了所有搞 Token 排行榜的公司。

至于 YC 的建议——“最大化 Token 使用而不是员工人数”——逻辑上说得通,但大公司烧预算和创业公司烧自己的钱是两回事。连有收入的 AI 工具公司都在亏损,还没有 PMF 的创业公司拿什么撑”高到令人不舒服的 API 账单”?Token 不是人力成本,人力成本可以欠着,API 账单按月结,不付钱就断供。这种固定支出对现金流的压力,比发工资还大。

说到底,当一个企业陷入”别人都在用 AI,我们不用会不会掉队”的焦虑时,最简单的事情就是先让大家放开烧。这跟当年”先占坑再想怎么盈利”的思路如出一辙。但 AI 不是流量生意。流量的边际成本趋近于零,Token 的边际成本是正数——用得越多,花得越多。这个数学题,做不了假。

最后说几句。

Token 不会消失,AI 也不是泡沫。但把 Tokenmaxxing 当绩效这件事,一定会被企业治理追上。

未来的赢家,不是 Token 烧得最多的公司,是能回答”我的每一块钱 Token 换来了什么”的公司。 而这恰恰是管理问题,不是技术问题。

不同的技术,相同的故事。每代人都觉得自己这一波不一样,但潮水退去的时候,穿泳裤的永远是那些算得清账的企业。

本文作者:Samjoe Yang

本文链接: https://need.uno/tokenmaxxing-ping-lun/

版权声明:本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可。

评论