频道:@DavidOndrej · 时长:47:41
| 项目 | 内容 |
|---|---|
| 视频标题 | Tokens can make you rich – Mario Zechner |
| 视频ID | sqtX2OmgOF0 |
| 频道 | @DavidOndrej |
| 时长 | 47:41 |
| 主题 | Pi Agent 创始人 Mario Zechner 谈 Agent 工程、Token 经济、欧洲 AI 现状与知识工作的未来 |
| 视频链接 | https://www.youtube.com/watch?v=sqtX2OmgOF0 |
“我觉得这会变成一个有钱人的游戏。掌握了’生产资料’(也就是付得起 token)的人,对其他人有压倒性优势。”
David Ondrej 这次请到了 Pi Agent (pi.dev) 的作者 Mario Zechner——20 年软件 + AI 老兵、Krypton 创业元老。Mario 是 Claude Code 的早期忠实粉丝,但因不堪 Anthropic “feature 堆积 + 反复改 harness” 的混乱,从 2026 年 10 月起完全转向自己开发的 Pi Agent。本教程提炼了这场对谈最干货的部分:Agent 工程哲学、token 经济学、open weights 模型崛起、知识工作未来、年轻人 vs. 老员工的 Chop-pocalypse、训练数据与”top 0.01%“问题。
Anthropic 的革命性创新:
“不再像 Cursor 那样索引代码库 + 喂 context,而是给 Agent 一个 bash terminal,让它自己探索代码。结果证明 LLM 极擅长用 bash 探索代码库。”
这就是Agentic Search 的诞生。
“Claude Code 团队 token-maxed 了,feature 堆积如山,bug 一堆,system prompt 也改来改去。我逆向了它的 JavaScript——发现他们做了一堆愚蠢的事。”
Anthropic 静默 ship 了一个改动:
“会话 idle 超过 1 小时就清除旧的 thinking trace——为了降低 latency。”
Mario 的诊断:
“你的 Agent 跑了 1 小时,或者你去吃午饭回来——所有旧 thinking trace 没了。这等于在 session 中 lobotomy(脑叶切除)模型——拿走它生成的一半信息。”
“我不需要 Anthropic 在背后偷偷改 system prompt、偷偷改 harness。我要完全控制我能控制的所有部分。”
10 月起 Mario 完全切换到 Pi,从此稳定。
| 原则 | 含义 |
|---|---|
| Minimal harness | 不堆 feature;feature 多 = bug 多 |
| Stable system prompt | 你今天和明天的 Pi 是同一个 |
| User in control | 用户能控的部分全控 |
| Efficient context | 上下文越精简越聪明 |
“我做了 20 年软件——我要 efficient + control。否则软件就 suck。”
Mario 反驳社区流传的”Anthropic 偷偷量化模型”阴谋论:
“我用 Pi 从没见过其它人在 Claude Code 上报告的 degradation。”
“如果你知道’让模型 quantized 运行’对基础设施意味着什么——那不是省钱的事,那是巨大的工程投入。”
“200 美元一月对很多人是经济门槛。但在我们 AI 圈子,大家觉得 $200 是 bargain(白菜价)。”
为什么?
“因为大多数 AI 圈子的人是高收入软件工程师,年薪几十万美元。$200 对他们是 peanuts(花生米)。”
“现在我每月在 Anthropic API 上跑出 $6K-10K 的 run rate。这种 token spend,普通人玩不起,但产出绝对值。”
Mario 老婆是语言学家、非技术。她做的工作:
Mario 给了她 Claude Code + 两个晚上的训练,结果:
“她的科研产出 5 倍化。她对 Cloud Code 说:‘我知道输入数据长啥样、我知道输出该是啥样。你现在是我的 little programmer body。我不懂编程,相信你。给我写 Python 脚本把输入变成输出。’”
“代码不需要完美。代码可以是一坨 slop(垃圾)。只要能省时间,那就是 amazing。”
David 公司 6 人团队:视频剪辑师、会计——这些完全非技术的人也在写内部工具:
“Mario 你 6 个人的团队,可以打 50 人甚至 100 人的旧组织——只要你会用 Agent。”
“10-60 岁混编的传统企业?这个不行(doesn’t work)。年轻人能跑得动,老一代跟不上节奏。”
“最烦的就是 hype。Ralph Loop 是 cargo culting(货物崇拜)。我从没见过那种’给一份 PRD + spec 文件,让 Agent 死循环到实现完成’的 Ralph 真的 work 过。”
“Karpathy 的 auto-research 才是科学的 Ralph:给模型具体的成功标准 + 客观函数——让模型能评估自己是否进步。这种 Ralph 真能用。”
差异点:
| 项目 | 假 Ralph | 真 Ralph |
|---|---|---|
| 成功标准 | 模糊的 spec | 可测量的 objective function |
| 反馈环 | 自我评估,容易自欺 | 客观函数评估 |
| 实际效果 | “我从没见过 work” | “scientific Ralph,真的 work” |
“私底下很多人对我说:‘这一套(dark factories 这些)都不 work,但我们还得卖。’ 我不明白为什么要这么做。”
Mario 给 AI 圈子做了一个三层分类:
“聪明的人会更聪明(the smart get smarter)。富的人会更富(the rich get richer)——因为可支配收入能投资到 token + 工具上。”
“我过去 3-4 天在用 Kimi K2.6。说实话——它真不错。我可以部署在我自己的小 GPU 集群上,成本跟 Anthropic 差不多,但智能水平够用。”
“中国实验室(DeepSeek、Kimi)正在血洗(fucking)美国实验室的 token 经济。我很喜欢——因为我知道 inference 阶段美国公司的毛利率。”
“如果我们的 intelligence 在未来 2-3 年就维持在现在的水平,我也满意。我会完全切换到 open weights 模型——它们已经追上来了。”
David 问 Mario 答:
“要么是对中国的恐惧(China fearmongering),要么是 Anthropic / OpenAI 的品牌——尤其在企业市场。Anthropic 营销极强、品牌极好。但作为欧洲人,中美在数据隐私上对我都一样——都不信任。”
“EU AI Act 没那么可怕。加州自己也有 AI 法规,而且加州各州都不一样,比欧盟 27 国统一一套法规还麻烦。”
“看看 AI 圈所有名字——大半是欧洲名字 + 中国名字。人才在逃往美国——那才是钱所在。”
EU Inc movement 在推进,但 Mario 悲观:
“I love the European Union, I hate the implementation. They will probably fuck that up too。”
| 类型 | 命运 |
|---|---|
| 小型 app(饮食记录、健身追踪) | 死定了,会被 personal Agent 内置 |
| Spotify 这类 app | 不会死——因为软件之外还有授权谈判、版权 mafia、人际关系这些 squishy human parts |
“软件人总觉得自己懂世界,因为他们能让电脑做事。但你去非软件公司工作就会发现:世界比 IT 人想的复杂得多。”
他在 Slack 里跑一个 Pi 实例做饮食追踪:拍菜的照片让 Pi 估算 calories。
“餐厅给的 calories 一般写得比实际少。Agent 至少没有 hidden agenda(隐藏议程)。”
David 自己用 OpenClaw 做饮食追踪: - 一个 CSV 记 calories - 一个 markdown 文件存”approved meals” - 一句”50 grams of blueberries”,Agent 知道你买的 blueberries 是哪种、宏量营养素是什么
“这不能跟 App Store 上任何 app 比——intelligence 是唯一稀缺资源。”
“未来 5-10 年会有一段 ‘chop-pocalypse’(砍头大灾)——直到达到新均衡。”
40-50+ 岁知识工作者:不会用 Agent 的就被淘汰。
Junior 们也惨:
“Senior + Agent 现在可以替代两个 Junior。Junior 找不到工作——不止软件,所有知识工作领域都一样。”
“年轻人不就是用 AI 长大的吗?应该是优势?”
“我教过 12-16 岁的孩子。他们不是 digital native,他们是 digital consumer(数字消费者)。他们刷 TikTok 很溜,但不会用 phone 上的 Canva 创作图片。”
| 类型 | 行为 |
|---|---|
| Digital Producer / Creator | 创造东西的人——任何时代都赢 |
| Digital Consumer | 消费内容的人——任何时代都被动 |
“任何有动力的人都能做出好东西。任何随波逐流的人都会失败。这不是年龄问题,是态度问题。”
“Junior + Agent + Senior 导师 = perfect。我合作的公司就这么干,work 得很好。但很多公司认为 ‘Junior 是 drain(拖累),不要了’——这是愚蠢的。”
“从数学上讲,模型学到了一坨’云’(cloud of learned things)。它能在云内插值(interpolate)——产生新组合。但云之外它做不了。”
| 适用 LLM | 不适用 LLM |
|---|---|
| 实现一个简单 feature | 设计系统架构 |
| 改 bug | 给我一个独特的商业 idea |
| 重构小块代码 | 提出真正原创的研究方向 |
“feature 实现的训练数据多得是——Codex / Claude Code sessions、GitHub commits。但’设计系统架构’的过程从来没被编码成 tokens。”
“顶尖 0.01% 的人——伟大软件设计师、伟大作曲家、伟大企业家——他们的理解和技能没被写下来、没被转成 markdown 和 tokens。所以模型训练不到。”
“代码训练数据里 90% 是垃圾。10% 是纯净神级代码。但 10% 统计权重太低,不能强化进模型权重里——这就是平均化的恶性循环。”
“如果你问 LLM ‘give me a business idea’——它会给你 比平均稍好一点的东西。我不会信任它给我商业 idea。但一旦我有了 idea——它可以帮我 double-check:你忘了考虑这个法律框架、忘了考虑这个商业要素。”
David 不喜欢 UBI(Universal Basic Income)。
“谁来控制 income?”
Mario 提议另一种:Universal Tokens(普惠 token)。
“每人每月发一些 token。你可以浪费它、不用它、转卖它、或者用它造东西。”
David 大爱这个 idea:
“这才是真正的去中心化——每个人都有 means of production。”
“我从 10 月起就只用 Pi。最多并行 4 个 terminal——不追求’10 个 worktree 并行’那种 hype。”
Mario 有一套严格的 prompt template:
“Pi 里有 30% 代码我没读过——比如 session 导出 HTML 的代码。我不在乎那种代码。”
但 Agent loop 本身——他全部背得出。因为那是产品核心。
“不再在乎 syntax。我可以让 Agent 写任何语言。但架构和系统级思维会变得更重要。”
“我警告年轻开发者:不要让 Agent 帮你设计系统。Agent 从互联网学的——而互联网上 90% 是我和其他老人写的烂代码。它会建议你照着那种烂架构来。用你自己的大脑做设计——让 Agent 帮你打字就好。”
“我之前 Anthropic API 月烧 $6K——用的是 Opus 4.6 fast mode(6 倍贵)。现在 4.7 没有 fast mode,我转向 GPT-5.5 + Codex,成本大幅下降。”
“Codex $200 套餐我从没碰到过限额——并行跑多个都没事。Claude Code 限额一两天就到了。”
David 给团队成员发不同限额的 API key: - 高水平员工:$500/周限额 - 新手员工:$50 总限额(不会爆超) - 每个 key 命名归属人,便于管理
| 概念 | 解释 |
|---|---|
| Pi Agent | Mario 自研的 minimal coding agent,pi.dev |
| Agentic Search | Anthropic Claude Code 的革命:给 Agent bash 自己探索代码 |
| Thinking Trace 丢失 Bug | Anthropic 静默 ship 的”1 小时清理”导致 session 退化 |
| Token-maxing | 团队膨胀后 feature 堆积导致质量下降 |
| Ralph Loop(真假) | 假 Ralph = 死循环;真 Ralph = Karpathy auto-research |
| Karpathy Auto-Research | 成功标准 + 客观函数 + 自循环 |
| Open Weights | DeepSeek、Kimi K2.6 等可自托模型 |
| Token Economics | 中国实验室”血洗”美国实验室的核心战场 |
| EU Inc Movement | 欧洲推动统一公司治理框架的倡议 |
| Universal Tokens | Mario 提出的”普惠 token”替代 UBI 设想 |
| Digital Producer vs. Consumer | 区分人群的根本维度 |
| Chop-pocalypse | 未来 5-10 年知识工作者的”砍头期” |
| Means of Production | 谁付得起 token,谁占优势 |
| Squishy Human Parts | 非技术的、关系/谈判/情感等”软组织”,软件人易忽视 |
| Cloud of Learned Things | LLM 训练数据的”可插值云” |
| Top 0.01% 训练数据缺失 | LLM 出不了大师的根本原因 |
| 资源 | 说明 |
|---|---|
| pi.dev | Mario 的 Pi Agent 官方网站 |
| Pi Agent Discord | “We shoot the shit there” |
| Mario Twitter | @badlogicgames |
| Kimi K2.6 | Mario 当下推荐的开源大模型 |
| DeepSeek V4 | 另一个 token 经济屠杀者 |
| Karpathy Auto-Research | “真 Ralph” 的范式来源 |
| OpenRouter | David 推荐的多模型 API 网关 |
| Codex $200 套餐 | David 的实战推荐 |
| Anthropic Postmortems | 那次”1 小时清理 thinking trace”的承认博客 |
| EU Inc Movement | 欧洲统一公司治理倡议 |
| Gemma 4 / 128GB MacBook 路径 | David 的本地推理硬件计划 |
“我希望 intelligence 能被全世界所有人负担得起,而不是一个 first-world 技术。中国实验室,bless them——他们正在做这件事。”
Mario Zechner 在这场对谈里既冷酷又乐观:
对中国 AI 开发者最直接的三条启示: 1. 跟着 Mario 的范式做 Pi-style minimal agent——别堆 feature,别让 Agent 替你做架构。 2. Open Weights 优先——DeepSeek、Kimi 已经够用,再加上自有 GPU 集群就是闭环。 3. 培养 Digital Producer 思维——做”创造者”,不要做”消费者”。
token 真的能让你致富——前提是你买得起、用得对、并且不被 hype 带偏。