Skills
把 ego-browser 包装成 Agent 直接可用的工作流,并通过 Experience 沉淀站点经验。
ego-browser skill 让各种 AI Agent(Claude Code、Codex 等)使用你的 ego lite 浏览器:复用你的登录状态执行各类网页任务,借助 ego lite 的任务空间机制,你随时可以监看、接管,也可以继续不受干扰地浏览自己的页面。
这个 skill 与 ego lite 浏览器绑定,使用前需要先安装 ego lite。
与其他方案的区别
-
能用你自己的 Agent。 Codex、Claude Code、OpenClaw、Hermes 等任何 Agent 都能通过 ego lite 复用你的登录态直接操作网页。Comet 这类 AI 浏览器只能由内置 Agent 驱动,你自己的 Agent 无法接入,也没法作为工具嵌入到你的任务流里。
-
独立的 Agent 工作空间。 ego lite 给 Agent 划出隔离的 Space,你在前台正常浏览,Agent 在后台并行工作,互不抢占。你可以随时看到哪个 Space 有任务在跑,并选择接管或终止。如果你用过 Agent-Browser 这类桥接 Chrome 的方案,应该见过窗口和标签页满天飞的场面,ego lite 从根本上解决了这个问题。
-
Code base,而非 CLI base。 ego lite 向 Agent 暴露的能力(Snapshot、Click、页面 JS 注入、底层 CDP 等)不是命令行形式,而是封装成一个个 JS 函数直接调用。为此我们把 Node.js 集成进了 ego lite(安装包仅增加 10MB)。这样 Agent 可以用它最擅长的方式(写代码)把多步操作组合在一次输出中完成,而不是陷入「调两个命令、看一下输出、再调两个命令」的循环。在我们的内部 benchmark 中,同等任务下任务完成时间缩短 20-50%。
-
高质量的网页 Snapshot。 ego lite 对 Chromium 内核做了深度定制,可以稳定生成页面快照——也就是文本模型用于「看」和「操作」网页的视图。复杂 iframe 嵌套这种其他方案频繁失败的场景,ego lite 也能处理。
-
越用越快的经验积累(即将推出)。 Agent 执行浏览器任务的时间和成本大部分耗在试错上。skill 内置经验积累机制,把每次成功操作和试错过程沉淀为可复用的 tool 与 workflow。在相似任务上,Agent 会越来越熟,复杂任务最高可实现 5 倍提速。该功能正在小范围内测中,将在后续版本释出。
适用场景
任何需要在浏览器中完成的工作都可以交给 skill 试一下:CRM、收件箱、ATS、记账工具、社交账号、订票网站、内部 admin panel 等。详细示例参见 Agent 网页任务实战。
安全提示
ego lite 给了 Agent 真实的浏览器操作能力,包括读取页面内容和执行操作。请确保你使用的 Agent 来自可信来源。