Token 会让你致富——对话 Pi Agent 创造者 Mario Zechner

频道:@DavidOndrej · 时长:47:41

📺 @DavidOndrej ⏱ 47:41 🗓 2026-05-19

视频信息

项目 内容
视频标题 Tokens can make you rich – Mario Zechner
视频ID sqtX2OmgOF0
频道 @DavidOndrej
时长 47:41
主题 Pi Agent 创始人 Mario Zechner 谈 Agent 工程、Token 经济、欧洲 AI 现状与知识工作的未来
视频链接 https://www.youtube.com/watch?v=sqtX2OmgOF0

引言

“我觉得这会变成一个有钱人的游戏。掌握了’生产资料’(也就是付得起 token)的人,对其他人有压倒性优势。”

David Ondrej 这次请到了 Pi Agent (pi.dev) 的作者 Mario Zechner——20 年软件 + AI 老兵、Krypton 创业元老。Mario 是 Claude Code 的早期忠实粉丝,但因不堪 Anthropic “feature 堆积 + 反复改 harness” 的混乱,从 2026 年 10 月起完全转向自己开发的 Pi Agent。本教程提炼了这场对谈最干货的部分:Agent 工程哲学、token 经济学、open weights 模型崛起、知识工作未来、年轻人 vs. 老员工的 Chop-pocalypse、训练数据与”top 0.01%“问题。


第一阶段:Pi Agent 的诞生——为什么逃离 Claude Code?

Mario 的背景

Claude Code 的 Genius

Anthropic 的革命性创新:

“不再像 Cursor 那样索引代码库 + 喂 context,而是给 Agent 一个 bash terminal,让它自己探索代码。结果证明 LLM 极擅长用 bash 探索代码库。”

这就是Agentic Search 的诞生。

2026 年 7-8 月,Mario 开始不爽

“Claude Code 团队 token-maxed 了,feature 堆积如山,bug 一堆,system prompt 也改来改去。我逆向了它的 JavaScript——发现他们做了一堆愚蠢的事。”

2026 年 3 月 26 日的”删 thinking trace”事件

Anthropic 静默 ship 了一个改动:

会话 idle 超过 1 小时就清除旧的 thinking trace——为了降低 latency。”

Mario 的诊断:

“你的 Agent 跑了 1 小时,或者你去吃午饭回来——所有旧 thinking trace 没了。这等于在 session 中 lobotomy(脑叶切除)模型——拿走它生成的一半信息。”

Mario 的反应:自己造 Pi Agent

“我不需要 Anthropic 在背后偷偷改 system prompt、偷偷改 harness。我要完全控制我能控制的所有部分。”

10 月起 Mario 完全切换到 Pi,从此稳定。


第二阶段:Pi 的设计哲学——极简与可控

Pi 的核心信念

原则 含义
Minimal harness 不堆 feature;feature 多 = bug 多
Stable system prompt 你今天和明天的 Pi 是同一个
User in control 用户能控的部分全控
Efficient context 上下文越精简越聪明

“我做了 20 年软件——我要 efficient + control。否则软件就 suck。”

“模型变笨”的真实原因

Mario 反驳社区流传的”Anthropic 偷偷量化模型”阴谋论:

“我用 Pi 从没见过其它人在 Claude Code 上报告的 degradation。”

量化阴谋论的反驳

“如果你知道’让模型 quantized 运行’对基础设施意味着什么——那不是省钱的事,那是巨大的工程投入。”


第三阶段:Token 经济学——为什么这是 rich-man’s game

残酷现实

“200 美元一月对很多人是经济门槛。但在我们 AI 圈子,大家觉得 $200 是 bargain(白菜价)。”

为什么?

“因为大多数 AI 圈子的人是高收入软件工程师,年薪几十万美元。$200 对他们是 peanuts(花生米)。”

真正赢的是”会用杠杆 + 付得起 token”

“现在我每月在 Anthropic API 上跑出 $6K-10K 的 run rate。这种 token spend,普通人玩不起,但产出绝对值。”


第四阶段:Mario 见过的最大 “Unlock”——非技术人员用 Agent

Mario 老婆的故事

Mario 老婆是语言学家、非技术。她做的工作:

Mario 给了她 Claude Code + 两个晚上的训练,结果:

“她的科研产出 5 倍化。她对 Cloud Code 说:‘我知道输入数据长啥样、我知道输出该是啥样。你现在是我的 little programmer body。我不懂编程,相信你。给我写 Python 脚本把输入变成输出。’”

“代码不需要完美。代码可以是一坨 slop(垃圾)。只要能省时间,那就是 amazing。”

David 的呼应

David 公司 6 人团队:视频剪辑师、会计——这些完全非技术的人也在写内部工具:

“Mario 你 6 个人的团队,可以打 50 人甚至 100 人的旧组织——只要你会用 Agent。”

大企业的困境

“10-60 岁混编的传统企业?这个不行(doesn’t work)。年轻人能跑得动,老一代跟不上节奏。”


第五阶段:Ralph Loop 与”科学方法”的 Karpathy 范式

Mario 怒怼”假 Ralph Loop”

最烦的就是 hype。Ralph Loop 是 cargo culting(货物崇拜)。我从没见过那种’给一份 PRD + spec 文件,让 Agent 死循环到实现完成’的 Ralph 真的 work 过。”

但 Karpathy 的 Auto-Research 才是真 Ralph

“Karpathy 的 auto-research 才是科学的 Ralph:给模型具体的成功标准 + 客观函数——让模型能评估自己是否进步。这种 Ralph 真能用。”

差异点:

项目 假 Ralph 真 Ralph
成功标准 模糊的 spec 可测量的 objective function
反馈环 自我评估,容易自欺 客观函数评估
实际效果 “我从没见过 work” “scientific Ralph,真的 work”

Mario 在 AI Engineering Europe 大会的内幕

“私底下很多人对我说:‘这一套(dark factories 这些)都不 work,但我们还得卖。’ 我不明白为什么要这么做。”


第六阶段:Web3 难民、聪明人卖虚景、跟风韭菜

Mario 给 AI 圈子做了一个三层分类:

  1. Web3 难民:Web3 不赚钱了,跑到 AI——对技术一无所知
  2. 聪明但卖虚景的人:他们懂技术,但靠”卖未来”赚钱——不指责,但 Mario 看不下去。
  3. 跟风韭菜:不懂技术,跟着”嗓门最大”的人走——最终以 pain、tears、亏钱告终

“聪明的人会更聪明(the smart get smarter)。富的人会更富(the rich get richer)——因为可支配收入能投资到 token + 工具上。”


第七阶段:Open Weights 模型崛起——DeepSeek 与 Kimi K2.6

Mario 的转向

“我过去 3-4 天在用 Kimi K2.6。说实话——它真不错。我可以部署在我自己的小 GPU 集群上,成本跟 Anthropic 差不多,但智能水平够用。”

中国实验室的”血洗 token 经济学”

“中国实验室(DeepSeek、Kimi)正在血洗(fucking)美国实验室的 token 经济。我很喜欢——因为我知道 inference 阶段美国公司的毛利率。”

Mario 的预言

“如果我们的 intelligence 在未来 2-3 年就维持在现在的水平,我也满意。我会完全切换到 open weights 模型——它们已经追上来了。”

为什么个人/小公司还没大规模迁移?

David 问 Mario 答:

“要么是对中国的恐惧(China fearmongering),要么是 Anthropic / OpenAI 的品牌——尤其在企业市场。Anthropic 营销极强、品牌极好。但作为欧洲人,中美在数据隐私上对我都一样——都不信任。”


第八阶段:欧洲为什么没有 AI?

不是监管的问题

EU AI Act 没那么可怕。加州自己也有 AI 法规,而且加州各州都不一样,比欧盟 27 国统一一套法规还麻烦。”

真正的问题是法律框架 + 资本

  1. 法律框架碎片化:每个欧洲国家公司治理、股票、员工激励规则都不同——美国统一 Delaware 公司就完事了。
  2. 税务 / 投资框架:跨欧洲分支的投资、税收处理是 cluster fuck。
  3. 争议解决:欧洲没有”默认 Delaware 法院”这种统一惯例。

资本流向

“看看 AI 圈所有名字——大半是欧洲名字 + 中国名字。人才在逃往美国——那才是钱所在。”

EU Inc movement 在推进,但 Mario 悲观:

“I love the European Union, I hate the implementation. They will probably fuck that up too。”


第九阶段:未来 2-3 年——Apps 还会存在吗?

Mario 的双重判断

类型 命运
小型 app(饮食记录、健身追踪) 死定了,会被 personal Agent 内置
Spotify 这类 app 不会死——因为软件之外还有授权谈判、版权 mafia、人际关系这些 squishy human parts

软件人总觉得自己懂世界,因为他们能让电脑做事。但你去非软件公司工作就会发现:世界比 IT 人想的复杂得多。”

Mario 自己的实践

他在 Slack 里跑一个 Pi 实例做饮食追踪:拍菜的照片让 Pi 估算 calories。

“餐厅给的 calories 一般写得比实际少。Agent 至少没有 hidden agenda(隐藏议程)。”

David 的呼应

David 自己用 OpenClaw 做饮食追踪: - 一个 CSV 记 calories - 一个 markdown 文件存”approved meals” - 一句”50 grams of blueberries”,Agent 知道你买的 blueberries 是哪种、宏量营养素是什么

“这不能跟 App Store 上任何 app 比——intelligence 是唯一稀缺资源。”


第十阶段:Chop-pocalypse 与”老人 + 年轻人双输”

Mario 的预言

“未来 5-10 年会有一段 ‘chop-pocalypse’(砍头大灾)——直到达到新均衡。”

谁会被砍?

40-50+ 岁知识工作者:不会用 Agent 的就被淘汰。

Junior 们也惨

“Senior + Agent 现在可以替代两个 Junior。Junior 找不到工作——不止软件,所有知识工作领域都一样。”

David 反驳:年轻人有 neuroplasticity

“年轻人不就是用 AI 长大的吗?应该是优势?”

Mario 的反驳:digital native 是个伪命题

“我教过 12-16 岁的孩子。他们不是 digital native,他们是 digital consumer(数字消费者)。他们刷 TikTok 很溜,但不会用 phone 上的 Canva 创作图片。”

关键区分

类型 行为
Digital Producer / Creator 创造东西的人——任何时代都赢
Digital Consumer 消费内容的人——任何时代都被动

任何有动力的人都能做出好东西。任何随波逐流的人都会失败。这不是年龄问题,是态度问题。

Mario 的另一个观点

Junior + Agent + Senior 导师 = perfect。我合作的公司就这么干,work 得很好。但很多公司认为 ‘Junior 是 drain(拖累),不要了’——这是愚蠢的。”


第十一阶段:训练数据的天花板——为什么 LLM 出不了好 architecture

Mario 的数学论证

“从数学上讲,模型学到了一坨’云’(cloud of learned things)。它能在云内插值(interpolate)——产生新组合。但云之外它做不了。”

适用区 vs. 不适用区

适用 LLM 不适用 LLM
实现一个简单 feature 设计系统架构
改 bug 给我一个独特的商业 idea
重构小块代码 提出真正原创的研究方向

为什么?训练数据不存在

“feature 实现的训练数据多得是——Codex / Claude Code sessions、GitHub commits。但’设计系统架构’的过程从来没被编码成 tokens。”

Top 0.01% 的悲剧

“顶尖 0.01% 的人——伟大软件设计师、伟大作曲家、伟大企业家——他们的理解和技能没被写下来、没被转成 markdown 和 tokens。所以模型训练不到。”

Mario 的关键洞察

“代码训练数据里 90% 是垃圾。10% 是纯净神级代码。但 10% 统计权重太低,不能强化进模型权重里——这就是平均化的恶性循环。”

业务 idea 的悖论

“如果你问 LLM ‘give me a business idea’——它会给你 比平均稍好一点的东西我不会信任它给我商业 idea。但一旦我有了 idea——它可以帮我 double-check:你忘了考虑这个法律框架、忘了考虑这个商业要素。”


第十二阶段:Universal Tokens——比 UBI 更好的未来

David 不喜欢 UBI(Universal Basic Income)。

谁来控制 income?

Mario 提议另一种:Universal Tokens(普惠 token)

每人每月发一些 token。你可以浪费它、不用它、转卖它、或者用它造东西。”

David 大爱这个 idea:

这才是真正的去中心化——每个人都有 means of production。”


第十三阶段:Mario 自己的工作流

Workflow

“我从 10 月起就只用 Pi。最多并行 4 个 terminal——不追求’10 个 worktree 并行’那种 hype。”

Prompt 模板库

Mario 有一套严格的 prompt template

真正的 workflow loop

  1. 把 GitHub issue / PR 喂给模板 prompt
  2. 离开,去开新 session 做另一个 issue
  3. 等第一个 issue 的分析回来,再决定怎么 implement
  4. 简单 feature → Agent 自动写 + 自动 manual 测试指南
  5. 重构 → Mario 自己手写
    • “Agent 修局部,全局就爆炸”
  6. 类型 / 接口 / API 改 → 也是手写
    • 保持自己对代码理解

30% 代码 Mario 从未读过

“Pi 里有 30% 代码我没读过——比如 session 导出 HTML 的代码。我不在乎那种代码。”

Agent loop 本身——他全部背得出。因为那是产品核心。


第十四阶段:Architecture & System Design——年轻人警告

最重要的技能

“不再在乎 syntax。我可以让 Agent 写任何语言。但架构和系统级思维会变得更重要。”

警告年轻人

“我警告年轻开发者:不要让 Agent 帮你设计系统。Agent 从互联网学的——而互联网上 90% 是我和其他老人写的烂代码。它会建议你照着那种烂架构来用你自己的大脑做设计——让 Agent 帮你打字就好。”


第十五阶段:Token 优化与 Codex $200 套餐

David 的真实数据

“我之前 Anthropic API 月烧 $6K——用的是 Opus 4.6 fast mode(6 倍贵)。现在 4.7 没有 fast mode,我转向 GPT-5.5 + Codex,成本大幅下降。”

Codex $200 套餐我从没碰到过限额——并行跑多个都没事。Claude Code 限额一两天就到了。”

OpenRouter 的真实用法

David 给团队成员发不同限额的 API key: - 高水平员工:$500/周限额 - 新手员工:$50 总限额(不会爆超) - 每个 key 命名归属人,便于管理


核心要点速查表

概念 解释
Pi Agent Mario 自研的 minimal coding agent,pi.dev
Agentic Search Anthropic Claude Code 的革命:给 Agent bash 自己探索代码
Thinking Trace 丢失 Bug Anthropic 静默 ship 的”1 小时清理”导致 session 退化
Token-maxing 团队膨胀后 feature 堆积导致质量下降
Ralph Loop(真假) 假 Ralph = 死循环;真 Ralph = Karpathy auto-research
Karpathy Auto-Research 成功标准 + 客观函数 + 自循环
Open Weights DeepSeek、Kimi K2.6 等可自托模型
Token Economics 中国实验室”血洗”美国实验室的核心战场
EU Inc Movement 欧洲推动统一公司治理框架的倡议
Universal Tokens Mario 提出的”普惠 token”替代 UBI 设想
Digital Producer vs. Consumer 区分人群的根本维度
Chop-pocalypse 未来 5-10 年知识工作者的”砍头期”
Means of Production 谁付得起 token,谁占优势
Squishy Human Parts 非技术的、关系/谈判/情感等”软组织”,软件人易忽视
Cloud of Learned Things LLM 训练数据的”可插值云”
Top 0.01% 训练数据缺失 LLM 出不了大师的根本原因

8 个实用启示

  1. 把 $200/月 Codex 套餐当作”means of production”——这是 2026 年最有杠杆的支出。
  2. 建立严格的 prompt template 库——别每次手敲 prompt。
  3. 重构 + 类型 + 架构继续手写——Agent 局部修、全局炸。
  4. Junior + Agent + Senior 导师是最优组合——别 fire Junior。
  5. Open Weights 模型已经够用——DeepSeek / Kimi 适合大量场景。
  6. 非技术员工 是最大 unlock——video 剪辑师、会计也能写内部工具。
  7. 小公司 6 人 + Agent 可以打 50-100 人传统组织——前提是真的把 Agent 配到位。
  8. Universal Tokens 思维:每天问自己”这些 token 能产出什么”。

10 个常见误区

  1. “Claude Code 是 SOTA 编程 Agent”——错,它的 harness 频繁改动让产品不稳。
  2. “Anthropic 在量化模型”——错,那是 harness 变化 + 心理学。
  3. “Ralph Loop 万能”——错,只有 Karpathy 式 auto-research 才是真 Ralph
  4. “免费 Agent 配置就够”——错,$200/月是 means of production 入场券
  5. “Junior 无用”——错,Senior+Agent+Junior 的三人组才是最优。
  6. “AI 出原创 idea”——错,云外它一无所知;适合 double-check,不适合原创。
  7. “LLM 能取代知识工作者”——错,能取代很多 task,但取代不了”协调人”角色。
  8. “EU AI Act 是欧洲落后的元凶”——错,是法律框架 + 资本碎片化
  9. “App Store 还会主导未来”——错,personal Agent 内置一切小 app 的功能
  10. “年轻人天然是 digital native”——错,他们是 digital consumer,不是 producer

12 个关键要点

  1. Pi Agent 是对 Claude Code 不稳定的反抗——control over what you can control。
  2. Agentic Search(Anthropic 贡献)是 Agent 编程范式的转折点。
  3. token 是新时代的 means of production——付得起的人占优。
  4. 5x 产出来自非技术员工的”agent-fication”,不是来自顶尖工程师。
  5. 小团队 + Agent > 大组织 + 流程——传统组织反应跟不上。
  6. Ralph Loop 的真假之分:客观函数 = 真,spec iteration = 假。
  7. 中国实验室在血洗 token 经济:DeepSeek / Kimi 是真威胁。
  8. 欧洲的问题是法律框架,不是监管也不是冒险精神。
  9. Architecture / System Design 是稀缺技能:训练数据天花板决定 LLM 出不了大师。
  10. Junior + Agent + Senior 是最优组合——别砍 Junior pipeline。
  11. Universal Tokens 是比 UBI 更去中心化的设想。
  12. 判断的本质:是 Digital Producer 还是 Digital Consumer——这决定一切。

额外资源

资源 说明
pi.dev Mario 的 Pi Agent 官方网站
Pi Agent Discord “We shoot the shit there”
Mario Twitter @badlogicgames
Kimi K2.6 Mario 当下推荐的开源大模型
DeepSeek V4 另一个 token 经济屠杀者
Karpathy Auto-Research “真 Ralph” 的范式来源
OpenRouter David 推荐的多模型 API 网关
Codex $200 套餐 David 的实战推荐
Anthropic Postmortems 那次”1 小时清理 thinking trace”的承认博客
EU Inc Movement 欧洲统一公司治理倡议
Gemma 4 / 128GB MacBook 路径 David 的本地推理硬件计划

结论

“我希望 intelligence 能被全世界所有人负担得起,而不是一个 first-world 技术。中国实验室,bless them——他们正在做这件事。”

Mario Zechner 在这场对谈里既冷酷又乐观:

对中国 AI 开发者最直接的三条启示: 1. 跟着 Mario 的范式做 Pi-style minimal agent——别堆 feature,别让 Agent 替你做架构。 2. Open Weights 优先——DeepSeek、Kimi 已经够用,再加上自有 GPU 集群就是闭环。 3. 培养 Digital Producer 思维——做”创造者”,不要做”消费者”。

token 真的能让你致富——前提是你买得起、用得对、并且不被 hype 带偏。