2026 年 3 月 3 日,许华哲注册了一家新公司。名字叫破壳机器人。

这件事在国内具身智能的小圈子里足够大——他是清华交叉信息研究院的助理教授(出自姚期智门下),更近一点的身份是星海图(Galbot)的联合创始人和首席科学家,2023 年那波具身热里被资本追得很紧的几个名字之一。

外界一度把他离开星海图传成"和平分手"或者"闹掰"。但 5 月 25 日《晚点聊》第 166 期播出,他和程曼祺聊了将近两个半小时,把决裂讲清楚了——不是和某家公司决裂,是和整个国内具身智能行业当下走的那条路决裂。

这一期里他特别锋利的一句话是这么说的:"如果你卖数据给英伟达,那其实是把弹药卖给竞争对手。今日割三成,明日割五成。"另一句更刺耳——"不做通用智能,铁架子里装的大脑就不由你来控制,那么我认为这就错过了定义未来的权利。"

以下是我们的拆解和判断。

不是 robotics,不是自动驾驶,也不是史前深度学习

许华哲在节目里给当下的具身智能行业开了一张三连否定的诊断书:not robotics, not 自动驾驶, not pre-deep-learning

第一条,"不是 robotics"。他的意思是,传统机器人学习惯把每个酷炫的动作单独解题——单独一个翻跟头模型、单独一个跳舞模型、单独一个端酒杯模型。"它的极致就是现在的那些翻跟头、武术、跳舞。"这种思路的天花板早就明摆着——任务无法穷举,把 100 个小模型叠在一起也凑不出一个会过日子的家庭机器人。

第二条,"不是自动驾驶"。自动驾驶的范式是数据闭环:先把五道口跑透,再把中关村跑透,然后逐区滚动覆盖。"这不是一个通用的解决方案。"路径依赖很重的,恰恰是中国这一波具身公司里大量自动驾驶背景的创始人——他们习惯了"先解决一件小事儿,然后获得这件小事儿的数据,然后期待还有第二件事儿,再用这个数据让它变得更好",这个思路移植到具身上来,许华哲判断"会比较困难"。

第三条更刺耳,叫 "not pre-deep-learning"——不是史前深度学习。"史前"两个字带着鄙视链。许华哲指的是 2012 年 ImageNet 之前那种"针对单一任务调一调小模型"的旧 AI 思维。"你永远不要指望一个小模型叠加一个小模型,叠加一百个以后,它等于一个大模型。"

这三条放在一起读,是同一句话的三个版本:不要把生在大模型时代的具身智能,做成大模型时代之前那种 AI

我的判断是,许华哲这一刀不是他第一个挥的——派(Physical Intelligence)从 2024 年起就这么做、Generalist 也是从 day 1 就赌一个统一的 VLA。但这是国内具身智能阵营里第一次有"前阵地"出来的人公开把这件事说成是路径错误。这跟一个外部观察者批"行业方向不对"完全不是一个量级——是 2023 年那波热钱的当事人之一从内部走出来,回头说"我们当时想错了"。

无脑量产 + 卖数据:今日割三成,明日割五成

如果说"路径依赖三连"是技术诊断,那"无脑量产 + 卖数据"就是产业诊断,许华哲的语气是后者更狠。

"无脑量产"这个词他是一语双关的——既是没有考虑用在哪儿就开始量产,也是产品里面没有大脑。"我想看到一个数字叫机器人活跃率,日活。卖出去的五千台机器人到底日活是十、还是一百、还是五千?"他知道这个数字没有人会公开,因为"那样太难看了"。但他坚持,消费机器人公司的健康度只能由日活定义,不是出货量、不是订单 LOI、不是某月某日某城市的展会现场。

"卖数据"这一条更狠。他点名英伟达——"英伟达自己是没有能力采数据的,他们那儿人很贵。所以他从谁买呢?很显然从一些有大量人力运营能力的公司去买。但是我们仍然把弹药卖出去,因为这样可以赚到钱。"

许华哲化用了一句六国论的句式——今日割三成,明日割五成——把这种交易称为割地赔款,"为了让自己可能融到资,或者是在账面上看得好看一点"。我留意到节目原话他说的是"今日割三成,明日割五成"而不是六国论原句的"今日割五城,明日割十城"——他显然知道自己在化用古文,把"城"换成"成",是把领土被切走的画面感平移到收入比例上来,更贴当下创业公司财报。

把这两件事合起来看,许华哲在控诉的是一种自我消耗式的繁荣——日活不敢看、数据卖给最终会成为竞争对手的那一方、机器人去卷一些注定无意义的指标("让机器人翻一百八十度再加一个三百六十度,你去卷这让机器人卷这个事情,我觉得就失去意义了")。这些是 2023-2025 三年里中国具身智能赛道资本特别热的部分——结果被一个亲身在量产阵营里待了两年多的联合创始人,定性为"今日割三成,明日割五成"。

最大的西瓜是智能,不是铁架子

破壳机器人要做的是什么?许华哲的答案很短——通用家庭机器人

短,但不简单。它的反面是"专门机器人"——专门做炒菜、专门做擦地、专门做接送。许华哲发散思考过备菜机器人这条路,跟在中美两地的朋友都问过定价——中国朋友说"备菜很重要,可以付一个冰箱的钱(约 1 万元)",美国朋友说"备菜过程我也很喜欢,最多两百美元"。"光是七个关节就已经超过他的购买预算了。"——所以家庭机器人想做成"某某机"(电饭煲那种价位的某某机)这条路,至少在硬件成本大幅下降之前,根本算不过账。

那只剩通用机器人这条路。许华哲在节目里多次重复同一个比喻——大脑。"如果不去做一个很好的通用的智能,那你的那些铁架子里面最后装的大脑就不由你来控制。那么我认为这就错过了定义未来的权利。"

中国具身智能现在很像什么?许华哲不愿意明说,但他描绘了一个画面——大量的铁架子,里面装的大脑全部 made by 别人。可能是英伟达的,可能是某家美国具身大模型公司的,也可能是某家正在训通用 VLA 的实验室的。中国公司贡献的是骨架、外壳、电机、关节、以及在工厂奔波采集的数据——"非常好的弹药"——但骨架里面那个会推理、会感知、会泛化的东西不属于自己。

这就是许华哲反复警告的"最大的西瓜"被错过——不是错过一个赛道,是错过定义未来人形机器人长什么样、思考什么、为谁工作的权利。

我想加一个他没明说的判断:节目里他对"派""Generalist""Figure"和国内傅立叶等公司给出的评价排序,本身就在透露价值取向。他说他焦虑的是 π(Physical Intelligence)和 Generalist——这两家美国团队——的进展;他怀疑 Figure 视频里"机器人自己眨眼睛"是不是又一个有人在头巾后面遥操;对国内公司他只点出傅立叶的 GR3 和小鹏的产品设计,对智能能力上的进展他没有点出任何一家中国公司。这种点评结构本身就是一个信号——目前能让一个具身科学家由衷焦虑的智能进展,几乎没有发生在中国。

战略定力的真空:是钱的问题,也是氛围的问题

许华哲在节目最后给出一个有意思的解释——为什么明明说过相信"东升西落",现在却承认领先的具身智能进展在美国发生?他把原因拆成两层:氛围

钱这层好理解。π 融资充裕,"对它来说容错空间可能更大"——他们可以两年不做商业化,第一天就说"我要做 Physical Intelligence",名字就是要做的事,然后真就一直做下去,每三个月发一个东西。许华哲承认中国具身智能的钱多,但容错带宽窄——投资人会要求三个月、六个月看到产品里程碑,团队会被迫去做"看起来在交付"的事情,于是先解一件小事、刷出落地,再去想通用智能就来不及了。

氛围这层更微妙。他打了个比喻——"如果老师说我就看看今天谁坐得正,那大家都会坐得很正。如果老师说我就看看今天谁这个上课发表的观点最多,那大家都会七嘴八舌去说。"行业氛围是巨大的同辈压力。当周围所有公司都在谈量产、谈渠道、谈进哪些工厂、谈下一笔融资估值,没有一家公司在讨论我们怎么把通用智能再往前推一步的时候,你就算心里相信智能优先,也会被氛围拽走

我自己接触过的几家国内具身智能公司,基本都给我留下两个印象——一个是 BD 团队比研发团队更靠近 CEO,另一个是技术访谈里对"我们正在攻关什么前沿模型问题"这类问题,回答会突然变得比"我们卖了多少台、签了多少订单"含糊得多。这两件事都是行业氛围的折射。许华哲走出来做破壳,在某种意义上是在试着另起一套氛围——把"对智能本身的信仰"重新做成创业公司主流叙事。这件事他能不能成是另一回事,但有人愿意从已经融到 B 轮的位置上跳出来再来一次,本身就是给国内具身智能补上一个稀缺人格——死磕智能突破的科学家创业者

强化学习被低估,规模化后训练是通往西瓜的路

光提"通用智能"是一句空话,许华哲在节目里给出了破壳机器人具体押什么。规模化后训练 + 强化学习

行业现在的标准做法是这样:用一个大的预训练 VLA 当底座,然后在某个具体任务上做后训练,做完就能上线了。听上去合理。许华哲不同意——"那其实最终你是把你预训练的一个很大的东西,在后训练上面给它收缩到一个具体任务上"。后训练把通用模型搞专用了,通用性被烧没了

破壳的差异化在于"想做规模化的后训练,让模型在后训练之后仍然保持泛化性,而且能做很多很多种任务"。配上的是强化学习——让机器人自己跟世界交互获取数据、对数据自评分、知道哪些数据是次优的、知道哪些失败的数据该怎么用。这一步在传统 RLHF 之外多了一个评估环节,"现有的很多地方可能低估了强化学习,或者说低估了刚才我说的评估的这一步"。

我的判断是,这一段技术押注是整期节目里特别值得行业内人士细听的部分。许华哲不是用一句"我们走 AI native 路线"就糊弄过去,他给出了一个相对具体的工程路径:(1) 用世界模型作为骨干网络注入物理先验;(2) 在机器人本体上做预训练学习"物理到交互"的动作先验;(3) 后训练阶段不收缩到单任务,而是同时训七个任务、十个任务,保持泛化;(4) 整个过程用强化学习把数据质量分级——好数据 / 次优数据 / 失败数据各派各的用场。这个思路不一定对,但这是一个可以被同行反驳的具体工程蓝图,不是一句口号。这件事做对的难度在哪里他自己也清楚——节目里他承认每个任务初期都会"比较平庸",需要相信一年后会突然全部变好,"这是 AI native 一致的"——而这恰好是中国创业公司当下很难给到的耐心。

装与拆:两位创业者,两个尽头

上一篇 《在愚昧之巅做景观,在绝望之谷吃细节》 写的是 invoko.ai 的梦琪。她讲的是创业者不再装——不再装大佬、不再装"我什么都懂"、不再装融资材料里那种自信,把自己从"伪装着站在愚昧之巅"拉回到绝望之谷里捡细节。

这一篇写许华哲,他做的事可以叫——拆中国具身智能行业的路径依赖,拆量产神话,拆"卖数据换取生存"的合理性,拆"在中国先发生"的乐观叙事。装的反面是诚实,拆的反面是惯性。一个创业者的诚实,和一个创业者从内部砸开惯性,是 2026 年 5 月这一周中国 AI 创业者群体里同时上演的两幕戏。

把它们合起来看,会得到一条更长的线索——当具身智能的资本周期、装腔的幻觉周期同时进入下半场,敢说真话的创业者会开始从舞台两端走出来。梦琪从一端,许华哲从另一端。中间的那一大块——还在装大佬的、还在卷量产指标的、还在把数据当弹药卖的——压力会越来越大。

许华哲自己讲的故事里我特别喜欢一段——他在最近读哈萨比斯传记,特别共鸣的一句话是关于"什么是过了一个尽力的人生"——"像马拉松一样,跑过终点线的时候立刻跪下了,更好的是被抬进医院但没死掉。"他现在不太能感受到那种"轻轻一碰就快乐"的状态了,"那种婴儿皮肤的敏感是以前。现在我感觉就是那些东西都无法影响到我"。他的快乐阈值变高了,所以只能去帮助更多的人来兑现快乐。

这是一个想做一辈子机器人的人,不是一个想退出再回炉学术的人。这两者的差别就在这里——他没法回头了。

声入商业说

许华哲的判断当然不一定对。具身智能的窗口是不是 18-24 个月、家庭通用机器人是不是 2028 年初进家、奇点会不会在 5 年之内到来,这些时间表全都是他作为信徒的预测,不是行业共识。π 真的会赢吗?Generalist 那条路真的比量产路线更短吗?没有人知道。

许华哲这一篇访谈真正的价值不在预测的准确性,而在他给整个行业立了一面镜子——把那些一直没有被公开命名的内部矛盾(无脑量产、卖数据、卷无意义指标、缺战略定力),从一个曾经在阵营里的人嘴里,逐字念出来。这件事比预测对不对重要得多。

我们这个公众号关心的是商业判断的清醒——所以这一期我们站在他这一边。具身智能要想真正改变人类的生活方式,不能只造铁架子。铁架子里的大脑必须是自己的,这件事一旦让出去,定义未来的权利就跟你没关系了。

评论区想听听你的判断:你觉得这一波国内具身智能的"无脑量产"背后,更主要的原因是钱(容错带宽窄)还是氛围(同辈压力 + 投资人压力)?还是另一种结构性原因?

收听完整节目:小宇宙搜索《晚点聊 LateTalk》第 166 期,或点击文末"阅读原文"。