Hermes Agent 突破 10 万 GitHub Stars —— Browser Harness 让 Agent 接近 AGI

频道:@DavidOndrej · 时长:32:44

📺 @DavidOndrej ⏱ 32:44 🗓 2026-05-19

视频信息

项目 内容
视频标题 Hermes Agent has 100,000+ GitHub stars
视频ID 4Sln_6K2z8c
频道 @DavidOndrej
时长 32:44
主题 全面解析 Hermes Agent 现状,并用全新 Browser Harness 在 Hostinger VPS 上配置一个”近 AGI 级”的浏览器自动化系统
视频链接 https://www.youtube.com/watch?v=4Sln_6K2z8c

引言

“我的名字是 David Andre,这个视频是全网最清晰的 Hermes Agent 解释——它是什么、能做什么、怎么用。”

Hermes Agent 在两个月内冲到 GitHub 100,000+ stars,是历史上最快达到这一里程碑的项目。OpenClaw 同期在衰退。David 在本期视频用 Hermes + 全新的 Browser Harness(一个让 Agent “无所不能”的浏览器自动化工具)演示了两个实战案例:抓取 Hacker News + 抓取自己 YouTube 频道并生成视频缩略图网格。两个任务都需要点击、抓取、保存、生成图像——而且 Hermes 创建了新 skill 让下次更快

第一阶段:为什么大家都在迁移到 Hermes

1.1 GitHub Stars 增长曲线

David 展示对比数据: - Hermes Agent:过去三个月持续指数增长 - OpenClaw:3 月底见顶后稳步下滑

Google Trends 显示 “Hermes Agent” 搜索量仍在爬升,OpenClaw 全球搜索量已经下降。

1.2 史上最快 100k 项目

“Hermes Agent 是 GitHub 历史上最快达到 10 万 stars 的项目。”

主要原因: - 团队迭代速度疯狂 - 20 天内 5 次主要版本发布 - 741 次合并 PR - 每天约 37 个 PR

1.3 三个真实用例

1)越狱 Gemma 4 - Ply 用 Hermes + 单个 skill(Obliterus) - 只用 8 条人类 prompt,Agent 自己搞清楚怎么让 Gemma 4 回答任何问题 - 这是个相当激进的案例,但展示 Hermes 自学能力

2)中文教学视频自动生成(Adam) - 让 Hermes 写完整 HTML - 生成中文 TTS - 渲染 9:16 vertical 1080p 视频 - 输出完整 MP4 文件 - 用例:营销 + 语言学习

3)Hermes 创意黑客松参赛作品 - 创建了真实雕塑作品的图像 - 不是 AI slop,而是有”品牌感”的动画 GIF - 展示 Hermes 处理视觉创作的能力

第二阶段:Browser Harness 是什么

2.1 让 Hermes 接近 AGI 的关键拼图

“Browser Harness 是新发布的 GitHub repo。很多人错过了,因为它只有几天。stars 不到 2,000,但我不指望它继续保持这么 underground。”

定义(官方原文):

“The simplest, thinnest, self-healing harness that gives AI models complete freedom to complete any browser task.”

换句话说:如果 Agent 用默认 library 完不成,它可以自己创建新函数、写新 skill 来完成。

2.2 信心十足的承诺

“Browser Harness 团队(Browser Use 背后的人)说:第一个找到 Browser Harness 完不成的任务的人,可以获得一台全新 Mac Mini。”

2.3 Browser Use 的本质

让 Agent 看、点击、输入任何网站——就像人类一样。例如: - 上 Twitter 发推 - 上 Amazon 购物 - 抓 Hacker News - 上 LinkedIn 找 leads

第三阶段:配置 VPS(Hostinger)

3.1 为什么 VPS 必须

“我们要 Agent 24/7 运行。最佳和最便宜的选择是 Hostinger。他们甚至有专门为 Hermes Agent 准备的 landing page。”

配置选项: - 时长:12 个月或 24 个月(24 月折扣最大) - 优惠码David 多 10% 折扣 - 位置:选离你最近的 - 套餐:KVM2,可同时跑多个 Agent

3.2 完成购买与部署

  1. Hostinger 面板找到刚买的 VPS
  2. KVM2 plan 24 月
  3. Setup → Confirm location → Next
  4. 关键:不要选 OS,选 Application → 选 Hermes Agent
  5. 设置用户名 + 密码(务必保存)
  6. Deploy
  7. ~2-3 分钟完成

第四阶段:进入 Hermes Web UI

4.1 启动 Hermes Container

部署完成后,Hostinger 面板显示两个 Docker container。点 Hermes 那个的 Open: - 用 Hostinger 显示的凭证登录 - 默认用户名 Hermes

4.2 Quick Setup

4.3 验证 Hermes 工作

输入 hey,Hermes 回复,确认 Open Router + Opus 4.7 全部正常。

第五阶段:安装 Browser Harness

5.1 用 SSH 连 VPS

David 强调 SSH 比 Hostinger web terminal 更稳: - Hostinger 面板复制 SSH 一键命令 - 终端粘贴 - 输入密码(屏幕不显示)

如果密码忘了:面板 → Change → Generate New → 复制保存。

5.2 跟随官方 install.md

# Step 1: clone repo
git clone <browser-harness-repo>

# Step 2: cd into folder
cd browser-harness

# Step 3: 安装 UV(如果没有)
curl -LsSf https://astral.sh/uv/install.sh | sh
# reload shell

# Step 4: install
uv tool install .

5.3 用 AI 解决 UV 缺失

“如果你不知道 UV 怎么装,直接打开任何 AI agent 像 Claude 问:how do I install UV on my Hostinger VPS? Browse the web. Give me step by step. Be very concise.”

20 秒解决。核心要点:不要被任何阻碍卡住——任何 DevOps 问题都问 AI。

5.4 单一 gist 整合所有命令

David 把所有终端命令集中到一个 GitHub gist(在视频下方链接),免去你逐个复制: - 注释明确说明每个命令做什么 - 完全免费访问

第六阶段:选择浏览器执行方式

6.1 两种选择

  1. Browser Use Cloud(推荐入门):
    • 完全免费起步
    • 可视化看到 Agent 点击
    • 适合学习与调试
  2. VPS Headless Chromium
    • Hermes installer 自动包含 headless Chrome
    • 隐私更好,不依赖外部 API
    • VPS 是数据中心 IP,可能被反爬

6.2 注册 Browser Use Cloud

  1. Google browser use cloud → 第一个链接
  2. 创建账号(免费)
  3. 右上 API key → 给 label 比如 YouTube Hermes browser harness
  4. 设置到期日(7 天或永不)
  5. 复制 key(不要分享

第七阶段:把 Hermes 装到 root 级

7.1 为什么不在 Docker container 里

“Hostinger 把 Hermes 装在 Docker container 里非常安全。但我们要装 Browser Harness 让它访问整个 VPS,所以要在 root 级再装一份 Hermes。”

操作: 1. Hermes 官方 GitHub repo 找一行 installer 2. SSH 粘贴运行 3. 自动安装所有依赖(Linux 检查 + UV + Python + Git + Node.js + 甚至 headless Chromium)

7.2 配置全局 Hermes

hermes init quick
# Provider: Open Router
# Key: <same key>
# Model: Opus 4.7
# Messaging: no

存储 Browser Use API key:

hermes config set browser_use_api_key <你的key>

第八阶段:验证 Browser Harness Skill 加载

启动 Hermes,问:

Do you see the browser-harness skills?

如果回答”否”: - Ctrl+C 杀进程 - 重新跑两条相关安装命令(在 gist 里) - 再启动

应看到 67 个 skills,其中包含 Browser Harness 相关 skill。

第九阶段:实战 1 —— 抓取 Hacker News

9.1 Prompt

Go to Hacker News and grab the top 15 Hacker News posts. For each: title, score, author, comment count, link URL. Save it inside /temporary folder as show-hacker-news.json. Before you finish, contribute what you learned about scraping news.

最后一句的”contribute what you learned”触发 Hermes 的自我改进机制

9.2 自动找到已有 skill

Hermes 检查 domain-skills 文件夹,发现已有一个 hacker-news skill。这就是 Hermes 的自进化体现:之前有人或它自己跑过类似任务时建好了。

9.3 跑完结果

9.4 Agent 贡献新 skill

/exit 退出 Hermes,检查 domain-skills/show-news.md: - 4 个新发现的 gotcha: - 不显示 “show HN” 前缀 - 相对 URL 用于 self-posts - 零评论的 anchor 怪异 - 分页 off-by-one - 引用了已有的 scraping.md - 包含可工作的 Python recipe - 最后一段标记 /ask 类似行为给未来 Agent 用

“这是 proactive knowledge building。Agent 不只是完成单个任务,它在 build collective knowledge。”

第十阶段:实战 2 —— 抓 YouTube 频道生成缩略图网格

10.1 Prompt

Visit my YouTube channel and get the 12 most recent YouTube videos including titles, save it as a PNG file in a single grid.

David 认为这个任务难度更高: - 大多数普通人未必能在不写代码情况下完成 - 涉及多步:导航、识别 12 个最新视频、抓取缩略图、组合为 PNG 网格

10.2 实时 self-healing

Hermes 发现: - 尝试连接本地 Chrome → 失败 - 自我诊断根因 - 切换到 admin.pystart_remote_demon - 真正现场 self-heal

10.3 Smart Discovery

Hermes 发现 YouTube 在 HTML 中嵌入了一个 1MB 的 JSON blob 叫 ytInitialData。 - 不需要点击或滚动 - 直接从 HTML 提取 - 一次性获取所有 30 个视频

10.4 自动权限确认

Hermes 标记某条命令为危险: - David 说 “add to permanent allow list” - 让未来同类操作不再询问

10.5 自检最终结果

“Does this look like a clean 4x3 grid?”

Hermes 在交付前自检确认,避免浪费用户时间。

10.6 创建 147 行新 skill

任务完成后,Hermes 贡献新 skill: - URL 模式 - 精确 JSON path - 工作的 JavaScript 提取片段 - 2 个 gotcha(consent 弹窗 & shorts 区域) - 完整 playbook

“想想你公司里有几个员工能解决一个新颖问题并写成 SOP 文档给其他人用?大部分员工从不创造新流程。但 Hermes + Browser Harness 能做到。”

10.7 检查 PNG 输出

用 SCP 把文件拷回 MacBook:

scp root@<VPS>:~/david-andre-12-most-recent.png ~/Downloads/

打开文件——就是 12 个 David YouTube 视频的 4x3 缩略图网格。完全靠自然语言驱动一个全新 Agent 体系完成。

第十一阶段:为什么称之为”近 AGI”

11.1 自我改进 + 自我修复 + 自我贡献

Browser Harness + Hermes Agent 是两层自进化: - Browser Harness:自我修复的浏览器自动化层 - Hermes Agent:自我改进、能创建 skill 的 Agent 层

“这是目前 AI Agent 在 web 上做事的最佳设置。”

11.2 浏览器是最后的 bottleneck

“浏览器是人类操作互联网的接口,是这些 Agent 必须 crack 的最后一个领域。一旦 crack,Agent 会变得超级强大。这就是我说它接近 AGI 的原因。”

11.3 比”普通员工”更强

“Hermes Agent + Browser Harness 已经比你公司能雇到的普通员工更强大。如果你看不到它 2-3 月后的发展,可能 AI 行业不适合你。”

第十二阶段:实操注意事项

12.1 安全

12.2 调试

12.3 持久化技能

核心要点速查表

概念 解释
Hermes Agent 史上最快 100k stars 的开源 Agent
Browser Harness 让 AI 完成任何浏览器任务的自修复框架
Browser Use 浏览器自动化底层库
Browser Use Cloud 可视化云端浏览器(免费起步)
domain-skills Hermes 按网站/任务分类的 skill 库
Self-healing Agent 失败后自动诊断并切换方案
Smart Discovery 发现网站底层 JSON/API 替代点击操作
Hostinger VPS 推荐宿主,KVM2 + Hermes landing page
hermes config set 安全存储 secret 的命令
domain-skills/<site>.md 网站专属 playbook,每次任务自动更新

8 个实用启示

  1. 永远在 VPS 上跑 Agent:本机不安全也不能 24/7。
  2. 第一个失败的任务最有价值:Hermes 会写 skill 让以后类似任务秒过。
  3. 任何 DevOps 问题问 AI:UV 装不上?Claude 30 秒帮你解决。
  4. prompt 里加 “contribute what you learned”:触发 Hermes 创建 skill。
  5. prompt 里加 “be very concise”:Opus 4.7 默认啰嗦,要明确节制。
  6. Browser Use Cloud 调试 +1:能看到点击过程,比黑盒强 10 倍。
  7. 危险命令选 “add to permanent allow list”:减少未来打断。
  8. 用 SCP 把 VPS 结果拉回本机:脚本化部分文件传输。

10 个常见误区

  1. 以为 OpenClaw 还在更新:3 月底已见顶下滑。
  2. 以为 Hermes 是普通 chatbot:它能 ssh、写 skill、操作浏览器。
  3. 以为 Browser Harness 等同 Browser Use:Harness 是更高一层的自修复框架。
  4. 以为 Hermes 必须放在 Docker container:root 级安装才能访问整个 VPS。
  5. 以为 API key 没有泄漏风险:要设 $30 限额 + 录视频后 rotate。
  6. 以为终端密码不显示是出错:完全正常的 *nix 行为。
  7. 以为 1M JSON blob 不能用:Hermes 直接抓 ytInitialData 完美绕过 UI。
  8. 以为 skill 创建是噱头:实际上让 Agent 几小时内变成专家。
  9. 以为人手任务一定比 Agent 快:抓 Hacker News + 截图 + 排版至少 30 分钟。
  10. 以为这是几年后的事:Hermes 才两个月,再等几个月会更夸张。

12 个关键要点

  1. Hermes Agent 是 GitHub 史上最快达到 100k stars 的项目
  2. 20 天 5 次主要版本、741 PR、约每天 37 PR
  3. OpenClaw 在 3 月底见顶后持续衰退
  4. Browser Harness 是让 Agent 接近 AGI 的关键工具
  5. Browser Harness 团队悬赏 Mac Mini 给第一个找出失败用例的人
  6. Hermes Agent = 大脑,Browser Use = 手
  7. Hostinger 优惠码 David 多 10% 折扣
  8. 必须把 Hermes 装在 root 级,不是 Docker 容器内
  9. domain-skills/ 是 Hermes 的自学习数据库
  10. Hermes 在跑任务时会 self-heal、自检结果、贡献 skill
  11. Hacker News 任务约 5 分钟 + 写新 skill
  12. YouTube 缩略图任务展示 self-heal + smart discovery + 创建 147 行 skill

额外资源

资源 说明
Hermes Agent GitHub 官方 repo + installer
Browser Harness GitHub 自修复浏览器框架
Browser Use Cloud 可视化云端浏览器
Hostinger VPS KVM2 + Hermes landing page
Open Router 模型路由
David 的命令 gist 所有需要的终端命令一站式
The New Society 3 周 AI 编码精通课程
Hermes 招聘(Katowice 办公室) YouTube Strategist 全职

结论

“看这个 PNG 文件——12 个最新 YouTube 视频,一个 4x3 网格,由 single AI agent 制作。给一个普通人这个任务,他能不能做?要花多久?平均一个上电脑的人要几个小时。这就是为什么我说接近 AGI——Hermes Agent 已经比你公司大部分员工更强。”

Hermes Agent 在两个月内达到 100k stars 不是侥幸,而是 自学习 + 多平台接入 + 极速迭代 的复合优势。Browser Harness 把它推上下一个台阶:现在 Agent 能在任何网站做任何事,且每完成一次都让自己变得更强。如果你还在用 ChatGPT 一问一答地干活,你已经被一个能 self-heal 的 Agent 网络甩到看不见尾灯。立刻配置 Hermes + Browser Harness + Hostinger VPS,进入这个 stack。