ego lite とは
ego lite は何か、誰のためのものか、既存のブラウザ自動化ツールとどう違うのか。
ego lite は、あなたと AI エージェントが一緒に仕事をするために設計されたブラウザです。エージェントはそれぞれの Space で並列にタスクを動かし、Chrome のログイン状態をあなたと共有しますが、あなたが今使っているタブには触れません。同じ作業がより速く、しかも消費トークンを抑えて終わります。
どの Agent CLI でも ego-browser スキル経由で ego lite に接続できます。Claude Code、OpenAI Codex、Cursor、Continue、Gemini CLI、Hermes Agent、OpenClaw、Opencode、あるいは自作の Agent でも構いません。
主な機能
ここでは概要だけ紹介します。各機能の詳細は「機能紹介」セクションの個別ページにあります。
Space
Space は、ego lite ブラウザの中に切り出された独立した作業領域です。新しいウィンドウでも、別の Chrome Profile でも、ヘッドレスモードでもありません。同じブラウザの中のパーティションで、エージェントはここで作業し、あなたが使っているタブには手を出しません。
人とエージェントは同じブラウザを共有します。エージェントは自分の Space で動き、あなたは自分のタブを使い続け、互いにフォーカスを奪い合うことはありません。Space にはいつでも切り替えられて、エージェントが何をしているかを確認したり、操作を引き継いだり、タスクを止めたりできます。
Space には複数のタスクを同時に走らせられます。本数はマシンの性能次第で、1 Space に対して 1 エージェントまたは 1 タスクが基本です。これまで 1 つのブラウザの中で順番待ちにならざるを得なかった作業も、今は並列で動かせます。Claude Code が 10 個の Space で 10 件のリードを補完し、Codex が別の 5 つの Space で 5 サイトの競合データを収集している間も、あなたは自分のタブで作業を続けられます。これらのタスクはタブ・snapshot・ref・ブラウザ状態のどれでも衝突せず、あなたのタブにも影響しません。
→ Space
Snapshot
ego lite は Chromium カーネルを深くカスタマイズしており、テキストモデルがウェブページを「見て」「操作する」ために使う高品質なページスナップショット(Snapshot)を生成します。典型的なページはコンパクトな accessibility tree としてエージェントに渡され、各要素に短い ref が付きます。1 ページ全体で 200〜400 トークン程度に収まり、生の HTML と比べて大幅に節約できます。
ログインページに対して snapshotText() を呼ぶと、こんな出力が返ってきます。
Page: Example - Log in
URL: https://example.com/login
@1 [heading] "Log in"
@2 [form]
@3 [input type="email"] placeholder="Email"
@4 [input type="password"] placeholder="Password"
@5 [button type="submit"] "Continue"
@6 [link] "Forgot password?"
エージェントは即座に @3 がメール入力欄、@5 が送信ボタンだと把握し、ref を使って操作します。fill('@3', '...')、click('@5') といった具合です。CSS セレクタを推測する必要はなく、クラス名がローテーションしても壊れません。
Snapshot は素の Chrome に JavaScript shim を被せて作るのではなく、Chromium エンジンの内部で生成されます。そのため、shim 系のツールがそっと取りこぼしがちな場面でも安定して扱えます。深くネストした iframe、shadow DOM、Stripe checkout・Salesforce embed・Intercom パネル・React portal で動的にマウントされるサードパーティ SDK コンポーネントなどがその代表です。
→ Snapshot
ego-browser
AI エージェントはこれを使ってブラウザを操作します。ナビゲーション、観察、操作、出力をすべて 1 つの Node.js heredoc にまとめ、一度に実行します。
ego-browser nodejs <<'EOF'
await useOrCreateTaskSpace('follow-ego-agent')
await openOrReuseTab('https://x.com/ego_agent', { wait: true })
await snapshotText()
await click('@92') // @92 は snapshot から返ってきた Follow ボタン
cliLog('Done.')
EOF
heredoc 1 つ、往復 1 回で終わります。「コマンドを実行 → 出力を見る → 次のコマンド」を繰り返す必要はありません。4 つの複雑なタスクで Vercel の agent-browser と比較した社内ベンチマークでは、ego lite はどのタスクでも所要時間が最大 245% 短くなり、トークン消費も明らかに少なく済みました。タスクが複雑になるほど差は広がります。
経験の蓄積(近日公開)
無事に終わったタスクは、再利用できる成果物(tool または workflow)に整理され、ドメインごとに分類されます。次に同じサイトでタスクを走らせると、エージェントは検証済みの解を直接読み込み、試行錯誤の段階を飛ばします。社内テストでは、複雑なタスクの 2 回目の実行は 1 回目に対して最大 5 倍速くなることが確認されています。これは ego-browser の単発実行で得られる優位に上乗せされる効果です。
→ Skills
プライバシー
閲覧データはすべて手元のマシンに残ります。Chrome から移行したパスワード、cookie、履歴、ブックマーク、拡張機能、Profile はどこにもアップロードされません。ページの内容はあなた自身のエージェントが読み取り、操作します。ego lite が受け持つのはブラウザとブリッジの部分だけで、「考える」と「読む」はエージェントの仕事です。
インストール時に ego lite が記録するのは 1 点だけです。Chrome データの移行を選んだかどうか、それだけです。
アカウント登録は不要、メールアドレスも収集しません。ログインが必要なクラウドセッションもありません。
対応プラットフォームと価格
現状は macOS のみ。Windows と Linux はロードマップに入っています。
ダウンロードは無料です。サブスクリプションなし、タスクごとの課金なし、クラウドセッションの計測もありません。お手元の Agent CLI と自前のモデル API キーを使うだけで動きます。
さらに読む
ego lite を作った理由と、どう設計したかは、こちらのブログ記事をご覧ください: A Browser for You and Your AI Agents to Work in Parallel。