"如果是通用 Agent 的应用,你永远会被模型内化掉。"
「十字路口 Crossing」04-29 这一期,MiniMax Agent 首席架构师阿岛在直播间里讲了一句不会单独出现在精华剪辑里的话。两小时的对谈,主题看起来是 Harness、是 Multi-Agent、是 Skill 加 CORE,但真正的论点不是技术问题,是产业归属问题——Agent 这层东西,最终归谁所有?
2026 年的春天有两个词在中文 AI 圈刷屏。先是"养虾",OpenClaw 一夜爆红,从硅谷烧到中国;紧接着是"驯马",Hermes Agent 接管热度,OpenRouter 上的 token 日均消耗一个月内从 20 亿涨到 3000 亿。
「十字路口 Crossing」把 MiniMax Agent 首席架构师阿岛、研发工程师择因,和 Hermes Agent 业务负责人 Tommy Eastman 同时请进了直播间——这是 Hermes 在中国社交媒体的官方首秀,也是 MiniMax 第一次公开讲他们和 Hermes 的合作底色。77 分钟里有几句狠话,今天没有被切成 reels 单独传播,但产业内部人会反复回想。
我们的判断是:通用 Agent 应用层正在被两端挤压——一端是模型公司在快速吸收上一代用户搭建的 workflow 和 skill,把它们内化进下一代模型的原生能力;另一端是用户的 skill 社区在用分发网络对抗这种内化。中间留给纯应用层创业者的空间,正在快速收窄。
但"应用层会消失"这种说法太满。更准确的版本是——标准化、可复用、低语义密度的通用 Agent 功能,会被基础模型快速吞并;应用层不会整体消失,价值会迁移到模型吃不掉的几个角落里。这是听完阿岛和 Tommy 这一期对谈之后,我们给所有押注这条赛道的人的一个产业 timeline。
人成为瓶颈:Harness 的真实起点
阿岛在 17 分钟讲了一段话,是这一轮 Harness 范式诞生的真实起点:
"我自己的工作流中,我实际上已经不怎么用 IDE 了。我可能同时并发五六个 Agent,甚至在云端有十个 Agent 在为我工作……这时候我会发现我自己成为了一个极大的瓶颈。"
人类成为了瓶颈。这是过去三十年软件史里第一次出现的反转。CPU 不够快、网络不够稳、模型不够聪明的时代过去了;突然之间,人类的输入速度、上下文切换能力、判断频率,反过来成了系统短板。
Harness 的字面意思是给烈马上挽具。阿岛的比喻是高达——你有一个非常强大的引擎,要让它最大化发挥,就得造一台机甲,把能力外化为可调度的整体。Harness 不是让 AI 更聪明,是让 AI 不再被人类的输入速度所限。
这是 2026 年春天产业真正的拐点。不是模型又强了一档,是模型已经强到"等不及人类反应了"。OpenClaw 在 IM 端 7×24 小时跑、Hermes 用多层记忆做"启动即联想"——它们解决的都是同一个问题:怎么让人类从"瓶颈"位置上撤下来。
阿岛最锋利的一句话:通用 Agent 应用层会被模型内化
整场对谈的火药味在 45 分钟那段。Koji 问"模型公司做 Agent,怎么和模型形成 synergy?"——阿岛给了一个直接打脸 Agent 应用层创业故事的答案:
"模型推出之后,无数的应用在不断地 unlock 探索……当模型推出后,这样的模型 unlock 这些做法之后,其实在重新吸收他的模型,内化到模型和 Agent 一起提供的能力里面,让大家在下一次就能够直接体验到。这可能也是今天做 Agent 的应用比较悲哀的一件事情——如果是通用 Agent 的应用,你永远会被模型内化掉。"
过去一年大家讲 Agent 应用层创业,逻辑通常是这样的:模型公司专注做模型,应用层专注做工作流和 skill 集,两层各有 moat、互不替代——就像移动互联网时代,iOS 是平台、微信是应用,井水不犯河水。
阿岛在直播间不留情面地把这个类比拆了。他的逻辑是:模型不是 iOS,模型是会进化的物种。每一代新模型会"看见"上一代用户怎么用它(通过 RL pipeline 里 70-80% 由模型自己完成的数据合成),自动把那些工作流、skill 内化进自身权重里。今天你写的每一个 OpenClaw skill、每一个 Hermes 工作流,都是在帮明年的模型版本做免费的训练数据。
但这句话有一个不能被忽略的关键限定词——"通用 Agent 的应用"。阿岛紧跟着补了一段往往被忽略的话:垂直 Agent 之所以会百花齐放,是因为它解决的是"最后一公里"。通用模型再强,也不能给一份不能犯错的法律意见、不能担一个出问题的医疗诊断、不能在合规框架内自动签字。这些事情在阿岛的产业模型里不是会被内化的对象。
把这条边界画清楚之后,"应用层会被内化"这个判断就从一个绝对论变成了一个产业坐标系:
- 会被吃掉的:通用 Agent 平台、可被工作流复用的 skill 集合、不需要垂直 know-how 的助理类产品。
- 不会被吃掉的:垂直行业里"模型不被允许出错"的那些场景(法律、医疗、合规、金融的关键决策);以及任何嵌入在组织流程、采购关系、合同责任里的代理——这些不是技术问题,是制度问题,模型权重内化不了制度。
这个分层比"应用层终将被内化"更稳,也更锋利。它告诉所有 Agent 创业者一件事:别问应用层会不会消失,问你做的是哪一层。
Anthropic 最近的几个动作把这条边界画得更清楚——强制实名、Mythos 模型不发布、推 Managed Agent(把 Agent 的"脑"和"手"分开,思考全在云上跑)。这三件事从产业地缘上看是一条线:模型公司正在用安全和算力的双重叙事,把 Agent 范式从"开源、外置、用户可定制"重新闭合回"私有、内置、平台垄断"。这不是新的策略,是"内化"这件事在制度层的加速版。
Skill + CORE 这一刀:模型公司争夺的不是 Agent,是分发网络
阿岛在 42 分钟讲了一个细节,是这一期对谈里最不应该被忽视的工程判断。
他说他在一月初就注意到了 OpenClaw,那时候 Peter 还没火。他直接给团队群发消息说"惊为天人",并且总结了 OpenClaw 三个核心范式:接入 IM 7×24 小时,基于 Skill + CORE 而不是 MCP。MCP 扩展性好但需要工程师写,Skill + CORE 普通人就能写——这意味着 skill 的来源不是模型公司内部,是全网用户。
"如果 OpenClaw 离开了 GitHub,他也不可能那么火。"
这句话表面上是讲技术架构,底下藏的是一个产业判断:Agent 时代的真 moat 不是模型,不是 Agent 引擎,是 skill 的传播网络。
OpenClaw 的爆发不是因为它的核心代码多魔法(Claude Code 源代码泄露之后,择因说"我们的思考可能都在同一个大气层内"),而是因为它跑在 GitHub 上、跑在 Discord 社区里、跑在小红书的"训虾教程"上。Skill 的传播网络一旦形成规模效应,模型公司想内化都会变慢——因为 skill 的产生不来自任何一家公司内部,来自全网用户的分散贡献。
这给前面的"分层"补上了一个新角落:Agent 时代的 GitHub——做让 skill 流通起来的分发网络,本身可能是一个能扛住模型内化的位置。Hermes 在 Tommy 那段对谈里反复强调的"Nous 社区"、"赛博朋克美学"、"价值观一致的社区",本质上不是文化包装,是分发网络的别名。它能跑赢模型内化的速度,前提是社区效应足够强、足够快——这是个有窗口的赛道,不是常态机会。
Manus 的生命周期:Harness 这一层就是为了让自己消失
聊到 Manus 的时候,阿岛和择因给了对 Harness 这个范式的最直接判断。
"Agent 这层、或者 Harness 这一层,是有生命周期的。它会不断随着模型进步而更新换代。"
这句话和阿岛在 1 小时 8 分对未来 Agent 形态的描述对得很巧——
"我们自己定义的目标就是:有全模态的输入,也能给你全模态的回复,是实时的,和你的交互会非常简洁……外面那一层在越来越薄。"
外面那一层在越来越薄。这是 Harness 这个范式的注脚——Harness 的存在本身就是为了让自己消失。今天我们花大力气写 skill、配 CORE、调 Multi-Agent 协作,本质上都是在替 2027 年的下一代模型做训练数据;当下一代模型能"原生"完成这些事情的时候,Harness 这一层就会像 Cursor 之于 Claude Code、Manus 之于 OpenClaw 一样——被外面那层越来越薄的产品形态轻轻覆盖过去。
但人不会消失。阿岛在直播间反复强调的一句话是——
"Taste 是不可取代的,而且每个人都有他自己的 taste……(Agent)需要一个目标。这个目标,我觉得只能由人来定义,而且这是人类不应该放弃的一个权利。"
模型会内化所有可被标准化的应用层,但模型不能定义自己的目标。在 Harness 这个范式被下一代模型"拽回机箱内部"之后,留给人类的位置主要剩两个——定义目标的人,和给模型出题的人。前者是产品创始人,后者是阿岛说的"做最好问题定义的科学家"。
阿岛对中美模型差距的判断,其实落在的也是这件事:算力差距在缩小,真正的差距是"问题定义权"。Anthropic 之所以能在 coding 上跑赢 OpenAI,不是因为工程师更聪明,是因为它请了全球最顶尖的程序员系统性地"教模型解决最难的问题"。这件事是组织能力问题,不是 GPU 数量问题。
给押注 Agent 应用层的人一份产业 timeline
如果你今天还在做 Agent 应用层创业,这一期对谈给你的礼物不是技术指南,是一份残酷但诚实的 timeline。
通用 Agent 平台:窗口期约等于头部模型的代际间隔(6-12 个月)。每一代模型发布之日,是上一代 skill 被内化之时。
Agent infra(沙箱、memory、runtime):身份认证和支付这一层最终会归到微信、支付宝这些既有玩家——基础设施级别的责任和资源不是创业公司能撬动的。沙箱、memory infra 这些细分赛道阿岛的判断很直接:"没有那么本质"——要么会被模型内化,要么会被云厂商打包卖。
垂直业务级 API(让 Agent 能挂号、缴费、打车):阿岛的两阶段判断是冷峻的——今天大部分这一类创业公司,是在第一阶段还没启动的时候,去抢第二阶段的机会。业务方还没把 API 改造成 Agent-friendly(滴滴、美团没准备好),创业公司又没有领域 know-how,两头不着边。
真正能扛住模型内化的位置只有两类:
第一,垂直行业的"最后一公里"——法律、医疗、合规、金融这些"模型不被允许出错"的领域,moat 不是技术能力,是制度责任和领域 know-how。模型权重内化得了 workflow,内化不了组织嵌入和合规签字权。
第二,加入模型公司,让自己写的 skill 成为下一代模型权重的一部分。这是阿岛的路,也是诚实的路。
至于"分发网络"——OpenClaw 跑通的那种 GitHub + Discord 的 skill 传播路径——它不是 moat,是延缓内化的变量。社区效应能把内化从 6 个月拖到 12-18 个月,但拖不到永远。这条路对极少数有社区基因的团队是机会,对其他人是错觉。
结语
OpenClaw + Hermes 这一波 Agent 春天的真正意义不在产品本身。它的意义是把过去一年所有人都不愿意明说的产业归属问题摊开了——Harness 是一层有生命周期的过渡范式,模型公司从一端建机甲,skill 社区从另一端拖延内化,中间留给纯通用 Agent 应用层的桥面正在被两端慢慢吃掉。
但模型不会内化制度责任,不会内化合规签字权,不会内化人的 taste。应用层不会整体消失,价值会迁移——迁移到通用模型权重写不进去的角落。2026 年春天这场 Agent 热潮,从舆论场退潮的那一天回头看,真正赢的不是养虾的,不是驯马的,是看清楚自己站的是不是过渡层的人。
收听原节目:小宇宙搜「十字路口 Crossing · 当我们在讨论 Harness 的时候,我们在讨论什么 | 深度对谈:Minimax × Hermes Agent」
— 听澜
留言