「商业访谈录」141 集,张小珺访 Altimeter Capital 合伙人 Freda Duan。这家硅谷基金一二级双跨:一级投了 OpenAI、Anthropic、字节;二级握着英伟达、Snowflake、Robinhood。一个能看到 LP 内部账本的人亲口说了一段话——按 token 收费这件事,行业会逐渐变成按效果收费。这是当事人对自己旧框架的认错。


2024 年初,全球大模型每天调用大概 1000 亿 tokens;到 2026 年 3 月,是 140 万亿——两年涨了一千多倍。这是声入商业之前那篇《Token 调用量两年涨千倍:泡沫论死于计量,不死于信仰》铺过的底——刘平在「面基」E154 里讲完之后,DAU 这把旧尺子失灵已经是共识。

Freda 这一期把刻度尺再换了一次:

"token 其实也是一个非常容易误导人的单位。同一个任务,不同的模型或者说不同的应用消耗的 token 可能差几十倍,甚至上百倍。"

一个二级量化背景的投资人,对自己每天用来看公司、写 memo、说服 LP 的最常用单位说它在骗你。她紧接着的判断更值得停一下:按 token 收费这件事,会变。

"这个收费模式是一定要变的,会逐渐从按照 token 收费转向按照效果收费。"

《泡沫论死于计量》写的是用户怎么算被换了刻度尺——DAU 不行了;《Agent 应用层的过渡命:MiniMax 阿岛|Hermes 把话挑明了》 写的是应用层怎么被吃——通用 Agent 应用层会被模型内化;这一篇是同一个力的第三层——定价机制本身也在被换刻度尺。计量层、产品层、定价层,三个剖面合起来是 AI 商业模式的整体重写。

一、Token 是会撒谎的计量单位

Freda 给了一个具体例子:同一个 coding 任务,好的模型一两百行就写完,差的模型要写几千行。表面上两边都完成了任务,token 消耗完全不是一个量级。再算上 reasoning tokens——很多模型回答之前要做大量中间推理,用户看不到,但 token 表上跳的是真金白银。

她举了 Cursor:问它同一个问题会消耗更多 token——同样的效果,能效低一档。她接着把这件事推到 CFO 视角:

"如果我是一个大公司的 CFO,我给我的 developer 一些 Cursor 的 credit,那我能看到的就只是 Cursor 的使用量在暴增。然后我就会推断说,员工是非常喜欢用的,能看到一些员工生产效率的提升。我作为 CFO,结论就是要继续加单。"

这是一条完整的认知错觉链条:用量上升被解读成价值上升,但用量上升本来就可以是低能效的副产品。CFO 看不到这层,就会用 token 消耗作为决策依据,越用越多,越多越加单。这跟刘平说的 DAU 越大越值钱是同一种思维定势——把中间度量误读成终值。

更精准的数据来自 Anthropic 自己。模型名义售价 $5/M input tokens、$25/M output tokens,但 Freda 引述行业第三方分析——实际单价只有 $1,cache 命中率高达 98-99%。当你以为自己按 token 付钱的时候,Anthropic 用的已经是另一套逻辑给你定价。token 还是那个 token,单价已经被技术(cache)拿走了 80%。

行业内部早就放弃了 token 名义价。它在外面还活着,是因为这是当下所有人都在用的唯一计量单位,不是因为它准。

二、按效果收费已经在发生

按效果付费这件事不是预言,AI 客服公司 Sierra 已经在这么干。

"Sierra 是做 AI 客服的,它就是完全按效果收费的——如果我 AI 能帮你解决这个客服、我没有转人工,我是收钱的;如果我转了,我就不收钱。"

Sierra 还按问题复杂度、解决程度做单价分层。这个收费模式让客户和 Sierra 变成 interest aligned——双方都想解决问题、都想少烧 token。按 token 卖的时候做不到这一点:模型公司想让你多烧、你想让模型少烧,双方目标对立

按效果付费不是所有领域都能做。Freda 自己挑明了边界——客服、销售转化、催收贷款、保险理赔,这些有明确完成/未完成信号的场景会先转过去;写作这种创意类、效果难量化的,长期可能还是按 token 收费。但主业务流程脱离 token 计费这件事,已经在发生

这背后是定价权的转移。按 token 收费的时候,定价权在算力侧——谁的卡多、谁的 token 便宜,谁有定价权。按效果收费的时候,定价权移到结果侧——谁能保证业务结果,谁就能按业务价格卖。从工业品定价(按投入计价)跳到服务业定价(按交付物计价),是一次范式切换。

三、Coding TAM 是怎么算错的

Freda 给出了一段现场认错。1-2 年前 coding 赛道刚出来时,硅谷投资人内部估市场大小用的算法是:

  • 量:美国 developer 总数大约 400-500 万人,是个小众群体
  • 价:一个公司每人最多花 $20-200/月在软件订阅上
  • 结论:100 亿美金 TAM 顶天

"但明显这个东西是完全错误的。Anthropic 一家的收入都远不止这个量了。对量和价当时的估算都错得非常离谱。"

错在哪?错在用了 SaaS 时代的按人头框架。这个框架默认每个软件给每个员工每月赚一个固定上限的钱,TAM = 用户数 × 单价。

Coding 不在 SaaS 框架里。Coding 卖的不是工具的使用权,是代码这件事本身。Dario 在 Anthropic 投资 PPT 第一页摆的是全球白领时间——三四十万亿美金市场。任何一个白领工作里只要有一部分能被代码自动化,那部分价值就归 Coding 模型。Coding 模型卖的不是 Cursor 这个 IDE 的订阅费,是被它自动化掉的那一部分白领的工资

按这个算法,Anthropic 在 ARR 30 亿美金这个段位还远没到上限。投资人愿意把估值往一万亿美金堆——一万亿不是凭空,是看到这个 TAM 之后才合逻辑的。

《泡沫论死于计量》写过 DAU 失灵,原因是人类不再是唯一用户。今天补一个:单价失灵,原因是白领时间才是真正的计价单位,token 只是个权宜之计。

四、Anthropic 每员工 1000 万美金,给整个软件业算了一笔账

Freda 给了一组数字。

"Anthropic 百分之八十都是企业用户,员工只有三千人。传统软件公司算下来每个员工五十万美元的对应收入,Anthropic 每个员工应该能接近千万美金,差了一个数量级。"

传统软件公司——ServiceNow、Salesforce、Adobe——三四万人、七八万人、销售和营销占收入 40-50% 的那套打法,在 Anthropic 这种 3000 人 ToB 公司面前是结构性低效。Anthropic Cowork 这个产品她说两个人做出来。她自己也在反思——过去是否过于强调销售的重要性。

按这个数字外推,传统软件公司的人头费用约束着估值上限——每个员工大约 50 万美金 ARR;Anthropic 这种公司不靠人头堆,靠模型本身的可复制性。

这跟《Agent 应用层的过渡命》那条线接得起来。那一篇写的是 MiniMax 阿岛说通用 Agent 应用层会被模型内化——价值从应用层迁移到模型层。这一篇看到的是上一层:应用层在被模型吃只是其中一面,整个传统软件业的人头堆叠模式,在 Anthropic 的人均产出面前都被点了名

二级市场先反应了。Freda 说软件在二级已经跌了 50% 不止;一级很多明星 SaaS 还停在 AI 之前的估值逻辑里,于是出现一二级估值倒挂——市场的某一边先看清了。她举的另一个细节——SBC(股票薪酬)的死循环:股价跌 50%,要发两倍的股票才能维持同样的薪酬,稀释更狠、股价跌更多。这是估值压缩的二阶效应。

她原话讲得很干脆:

"投资人是在抛弃软件公司吗?对,是。最简单的逻辑是 discount rate。"

不需要对未来有强判断,只要不确定性上升,估值就会被压。这是二级常识,放在今天的语境里它在说:对软件公司未来是否还能复制旧模式,市场已经决定不再相信。

五、把电机塞进蒸汽机:一个错位的时代

这一期 Freda 用了两个看起来矛盾的比喻。

第一个,关于 Coding 模型护城河:

"马车换汽车那种感觉。最早创造出来的汽车可能也是非常抛锚的,前面的一些快马还能跟一跟、追一追。但是你一旦汽车可以正常稳定地跑起来了,那你没有汽车这个引擎的马,就没有任何比的意义了。"

第二个,关于组织架构变革:

"我觉得现在可能就是把电机塞进蒸汽机的那个位置——每个人都把 AI 加进了自己工作流。但是没有人真的去问说这个流程本身、这个公司本身为什么长成现在这个样子。"

第二个比喻借的是经济史的一段往事:电灯泡发明之后,工厂生产率有 30 年没有提升——因为大家只是把蒸汽机拆下来换成电机,工厂还是按蒸汽机时代垂直堆叠的设计。一直到流水线被发明、整个生产组织围绕电力重建,生产率才上去。

两个比喻并不冲突——汽车跑稳了 vs. 电机刚塞进蒸汽机——它们讲的是不同的层。模型能力(technology diffusion)那一层,已经过了汽车跑稳的临界点;企业把这套能力消化吸收(economic diffusion)那一层,还在塞电机的最早期。

这一期的关键判断在这里——技术 diffusion 和经济 diffusion 严重错位。模型那边形成 better AI makes better AI 的递归飞轮,每个月出新版本,没有 Coding Agent 的公司迭代速度比别人慢一档;企业内部的组织、流程、定价都还是上一个时代的产物,在按蒸汽机的逻辑跑电机的引擎。

她接着给了一个新比喻:

"之前可能是一棒一棒的接力赛,之后可能更像是一个小团体的篮球赛——三到五个人一个小分队,必要的技能都在团队里面,能自己直接做决策,只有非常大的问题才会向上汇报。"

每一棒都是一次翻译、一次等待、一次信息损失;篮球赛是同步推进、自己拍板。这是按效果付费倒逼出来的组织形态——当价格按结果计、不按人头计时,人多就不再是组织效率的代名词,反而是负担

六、应用层的角落到底在哪

《Agent 应用层的过渡命》写到的"通用 Agent 应用层会被模型吃",Freda 给出了 2026 年 5 月这个时间点的更新版。

2023 年应用层公司被叫做 wrapper,大家担心模型会吃一切;2024-2025 这两年大家不担心了,因为应用层收入增长很快、退出也好;到了 2026 年这两个月,她重新开始担心了

为什么重新担心?模型本身在向 wrapper 靠拢——有 skills、有 connector、有记忆、能用工具。具体几个事件她都点了:Anthropic 站出来说先吃编程,第二大业务去吃金融;OpenAI 推自己的音频模型,对 ElevenLabs 直接构成威胁;OpenAI 和 Anthropic 几乎同一天宣布和很多私募基金合作,把模型推到这些基金的被投企业里。这是一个把应用层赶向边缘的合谋。

那么应用层还能做什么?Freda 给出的方向里比较清晰的一个是给 Agent 用的基础设施——Agent Mail、Agent Phone、Agent 用的 browser、identity、payment、compliance。人类用 HTTP,Agent 用 WebSocket;人类用 Gmail API,Agent 会被 detect、被 block。这一整套基础设施都需要重做一遍。

还有一类 Freda 没明说但可以从她的逻辑推出——能把 token 翻译成业务结果的那一段。定价权从算力侧移到结果侧,价值的位置就在离结果近的那一段。法律公司说护城河是合规;客服公司说是 last mile;Freda 看不上这两个 defense——只靠合规或者只啃 last mile,吃不到肥的那一块价值。反过来推:真能把 AI 能力和具体业务结果挂钩、按效果定价的应用,就是模型公司吃不下去的那一块

这跟阿岛说的"价值会迁移到模型吃不掉的角落"接得起来。这一篇把角落具体在哪指了出来——在按结果计价的那一段。

七、Strong Opinions, Loosely Held

这一期访谈里有一个不属于硬题、但值得被记下的瞬间——Freda 讲,有一天深夜在家装不上 OpenAI,痛哭。一个 Altimeter 合伙人,投了 OpenAI 之后,会因为装不上 OpenAI 哭。前面所有关于 Token、定价、组织、估值的判断,到这里有了一个落点:做出这些判断的那个人本身,正在剧烈变化的时代里同样不确定

她也讲到,近一长段时间里最有内容的一次对话——这是她原话——不是从专家那里换来的高浓度信息,95% 的信息内容现在都可以问 AI 拿到。那次对话是跑步时跟一个朋友坐下来,聊做事的勇气、人生遗憾、什么会让她 spark。一个职业是用信息换钱的人,亲口说"以信息交换为目的的对话,意义在快速被掏空"。

一个对所有未来都要有判断、又对判断本身保持警惕的人,给这段不确定时代留下的方法论很简单。她引了一句英语:strong opinions, loosely held——观点要硬,但要松松地握着。

声入商业这条线想记录的是 AI 商业模式的整体重写——计量层(《泡沫论死于计量》)写过用户/Token 不再是好刻度尺;产品层(《Agent 应用层的过渡命》)写过应用层会被吃;定价层(这一篇)把这两件事接到了一起:按 token 收费在退场,按效果付费在登场,组织从接力赛变篮球赛,SaaS 估值框架被 AI 击穿。

但这些判断都建立在今天这个时点。Token 会不会真的退场、按效果付费会不会渗透到所有领域、Anthropic 的护城河会不会真的过了不可追赶的临界点——三年后再看,今天每一句都可能被自己打脸。

这不影响今天就把它说清楚。观点要硬,但留出被推翻的空间。这是这一期值得记下来的那句话。


素材来源:张小珺《商业访谈录》ep141《Freda 的投资札记 第 2 集:Tokenmaxxing、把电机塞进蒸汽机、接力赛变篮球赛、孤独、人的连接》(2026-05-18 发布)