ego (lite) is just a browser, ego is your personal agent across devices.
Join waitlist
日本語

Agent ウェブタスク実践

Agent にウェブタスクをどう指示するか、いつ止めさせるか、終わったあとどう確認するか。

llms.txt

このページではまず ego lite が何のためにあるのかを整理し、そのあと自然言語のプロンプトから構造化された結果までの間に何が起きているかを 1 つのタスクで端から端まで追います。

ego lite は、エージェントがあなたの代わりにウェブで仕事をする場所です。ログインが必要なところ——CRM、受信トレイ、ATS、会計ツール、ソーシャル、予約、社内 admin——なら、エージェントは最初から最後まで動かせます。あなたの自然言語プロンプトを読み、ego-browser nodejs heredoc を 1 本書き、Space の中で実行し、あなたが使っているタブには触れません。

録画済みのデモは lite.ego.app/use-cases にあります。このページ末尾の Expedia 予約タスクは、その中の 1 本を順を追って見ていくものです。

始める前に

  1. ego lite がインストール済みであることを確認してください。クイックスタート を参照。

  2. ego-browser skill が登録されている Agent CLI を少なくとも 1 つ: Claude Code、OpenAI Codex、Cursor、Gemini CLI、Opencode。

  3. Agent CLI で次のように入力します:

    /ego-browser <自然言語でタスクを記述>
    

    エージェントは ego-browser skill のコンテキストを読み込み、対応する heredoc を自分で書きます。あなたの仕事はやりたいことを記述するだけです。

ego lite で何ができるか

ログイン済みのブラウザでできることは、エージェントが 1 つまたは複数の Space の中であなたの代わりに実行できます。

  • ソーシャルメディア。 ツイートへの返信、自分のノートを引用しての quote-tweet、投稿のドラフト作成と予約投稿、エンゲージメントデータの取得、メンションの監視、アカウント活動のスクレイピング。X、LinkedIn、Threads、Reddit、Instagram、Facebook、すべて動きます。「ログインしないと読めない・操作できない」かつ「public API では取れない」場面は、ego lite が埋めます。

  • 求職と採用。 LinkedIn、Wellfound、YC startup jobs での求人検索。結果を絞り込み、Apply で ATS(AshbyHQ、Greenhouse、Lever、Workday)に入り、履歴書をアップロードし、模擬回答を入れ、Submit の手前で止めてあなたの確認を待ちます。

  • 不動産・金融・買い物。 Redfin、Zillow、Apartments.com で実際の条件で絞り、住宅ローン・購入力計算機を回し、構造化データをローカル markdown に落とします。Amazon の比較、Costco の一括発注、API を絞り込んでいる証券会社の管理画面も同じ流儀です。

  • 予約系。 航空券、ホテル、レストランのフロー全体を、模擬の乗客・客データで決済画面の手前まで進めます。下の Expedia walkthrough がその完全な例です。

  • SaaS の管理画面。 HubSpot、Salesforce、Notion、Airtable、Linear、Stripe dashboard、GA4、Search Console、Mixpanel。レポート取得、ダッシュボードのリフレッシュ、フィールドの一括更新、送信のスケジュール。public API が制限されていたり、不完全だったり、有料だったりする場面を ego lite が埋めます。

  • 社内ツール。 自社の管理画面、ステージング、QA フロー。SSO の向こう側にあって自動化フレームワークが届かないところでも、ego lite は普段のブラウザの実ログインを継承するのでそのまま通り抜けます。

このあとの walkthrough では、1 つのタスクをプロンプトから結果まで追い、裏側で何が起きているかを示します。


Expedia 片道航空券予約: 全工程の解剖

Expedia 米国版で動く実タスクです。来週金曜の JFK→MIA 片道便を検索し、直行便でフィルタし、価格昇順で並べ替え、Delta または American Airlines が運航する最安値を選び、模擬の乗客情報で予約フォームを支払いページ直前まで埋め、便名・出発時刻・税込総額を Agent CLI に返します。プロンプトから結果までで 14 ステップのブラウザ操作。

まず動画を見て、そのあとに続く 2 セクションで「このタスクのどこが難しいか」「ego lite はどう乗り切るか」を読んでください。

Prompt:

Search Expedia for a one-way flight next Friday from New York (JFK) to Miami (MIA). Apply the "Nonstop" filter and sort results by "Price (Lowest to Highest)." Choose the cheapest flight operated by either Delta Air Lines or American Airlines, then proceed to the passenger information page. Use the following mock data to fill out the passenger form:

Stop before the payment page. Then provide:

  • Flight number
  • Departure time
  • Total price including taxes and fees.

録画動画:

エージェントはこのプロンプトを 1 本の ego-browser nodejs heredoc に翻訳し、前面のタブには触れない Space で実行し、最後に構造化された cliLog を返します: American Airlines AA 655, 5:35am, $188.40。決済の 1 歩手前で止めた状態です。

このタスクのどこが難しいか

Expedia を選んだのは、現代ウェブの「あるあるな厄介ポイント」を 1 つの 14 ステップフローに同時に詰め込んでくれるからです。CRM、ATS、社内 admin、日々使う SaaS でもまったく同じ落とし穴を踏みます。ここでは 5 つが同時に重なっています。

  1. 日付ピッカー。各日付セルには aria-labeldata 属性もなく、表示されている数字しかありません。
  2. 「Nonstop」フィルタ。aria-label にリアルタイムの便数と現在の最安値("12 Nonstop flights from $189")が入っており、文字列を決め打ちした selector は次の料金改定で死にます。
  3. 並び替えのドロップダウン。開いた状態で DOM レベルの JS click が一度でも走ると閉じてしまいます。
  4. 「Bundle & Save」のアップセル modal。中の「No thanks」リンクには安定したアクセシビリティ ref が無く、しかも特定の運賃タイプでしか出ません。
  5. Trip Summary と Checkout の間に挟まる「Continue without choosing seats?」強制選択 modal。処理しないとフロー全体が無言で止まります。

どれも珍しいものではありません。Notion、Linear、Airbnb、Salesforce、LinkedIn、Stripe dashboard。火曜の朝に開くツールはどれも下回りは同じです。React、制御された入力、modal 駆動のフロー、毎週 A/B テストされるレイアウト。少し複雑なタスクを選べば、この 5 つのうちいくつかにはほぼ必ず当たります。

Expedia が特別なのは、これら 5 つを 1 つの 14 ステップフローに同時に詰めてくれて、しかも丸ごと録画できる点だけです。だから選びました。ego lite が Expedia で耐えれば、日常のリストのほとんどでも耐えます。

ego lite はそれぞれをどう倒すか

5 つの痛点それぞれに、具体的なアーキテクチャの選択が対応しています:

  1. セマンティクスがない日付セル。 ego-browser の snapshot はカスタム Chromium エンジンの kernel 層で生成されるので、セマンティクス的に貧弱な要素でも安定した loc= と正しい親子構造が取れます。snapshot で足りない場面では、エージェントが同じ heredoc 内で js(String.raw\...`) に入り、DOM を直接照会して正しいセルを特定します(.uitk-month-double-lefttd.innerText === '5'` の組み合わせ)。2 つのレイヤーを 1 本のスクリプトで処理し、往復は発生しません。
  2. 値が変わる aria-label。 selector は部分一致をサポートしているので(input[aria-label*="Nonstop flights"])、Expedia が料金を変えるたびに失効するような完全一致文字列に依存しません。
  3. JS click で閉じてしまうドロップダウン。 click('@N') は CDP 経由で本物のマウス座標を送るだけで、DOM の click イベントは飛ばさないので、開いた状態を 2 回のクリックの間に潰しません。1 本の heredoc に @N の click を 2 つ書けばよいだけです。開いて、選ぶ。
  4. 安定 ref が無い modal。 ref で行けない場合、エージェントは js() の中でリンクの getBoundingClientRect() を計算し、座標で click([x, y]) を打ちます。同じ click() helper が CSS セレクタ・ref・viewport 座標・要素相対オフセットを全部受け取ります。
  5. 強制選択 modal。 kernel 層のスナップショットは [role="dialog"][aria-modal="true"] のようなオーバーレイを安定して見ます。React portal でメインツリーの外にマウントされた modal も同様です。スクリプトは modal の存在を把握し、中の「Continue to Checkout」を見つけてクリックします。

これら 5 つの対応の根っこにあるのは同じ選択です。CLI ベースではなく、コードベース。 エージェントは 1 本の完全なスクリプトを書き、一度に走らせ、同じ heredoc の中でセマンティック ref、ページ内 JavaScript、生 CDP の 3 層を自由に切り替えます。「コマンドを打って、出力を見て、また別のコマンドを打つ」というループに落ちず、14 ステップを 14 ラウンドのモデル叩き合いに変換しません。

この選択を支える要素は他にもあります:

  • 本物の Chrome ログイン状態。 普段の Chrome のブックマーク、cookie、拡張機能、ログイン、Profile が初回起動時にワンクリックで移行されます。空っぽの headless Chromium から始める必要も、「先に Chrome を閉じてください」もありません。「headless」というだけで発火しがちな強めのボット対策にも引っかかりません。
  • 独立した Space。 Expedia の 14 ステップの間、前面のタブは一切動きません。ポップアップがフォーカスを奪うことも、タブが新しいウィンドウに飛んでいくことも、選択中のテキストの上をクリックしてしまうこともありません。
  • 自分のエージェント。 Claude Code、OpenAI Codex、Cursor、Gemini CLI、Opencode、すべて同じ ego-browser skill から ego lite を動かします。特定のモデルにも、特定のアシスタント UX にも縛られません。

Expedia の walkthrough はあくまで 1 つのタスクです。同じアーキテクチャを同じやり方で、このページ冒頭にあるすべてのカテゴリに展開できます。


今日やるはずだったことで試す

ego lite が自分に合うかを判断する最短ルートは、今日の TODO に乗っている何か 1 つを実際に投げてみることです。

まだインストールしていない場合

好きな方法を選んでください。

または、任意の Agent CLI のターミナルで:

curl -fsSL https://lite.ego.app/install.sh | sh

どちらの方法でも、ego lite ブラウザと ego-browser helper がインストールされ、マシン上のすべての Agent CLI に skill が登録されます。初回起動で質問されるのは 1 つだけです。ブラウザのデータを移行しますか?続いて対応するブラウザを選んで確定すれば、ログイン、cookie、拡張機能、Profile がワンクリックで全部引き継がれます。

すでにインストール済みの場合

Agent CLI を開き、/ego-browser のあとにやりたいことを書いてください。

最初の一手に迷ったら、下の 5 つから 1 つを貼り付けてください。

ソーシャルメディア

/ego-browser Pull every mention of my X account from the last 24 hours, sort by engagement, and draft a reply to each. Queue the drafts, don't post anything.

求職と採用

/ego-browser Search LinkedIn for remote "product manager" jobs posted in the last week. For the top 10, pull company, title, and salary range into a markdown table.

不動産・買い物

/ego-browser Search Zillow for 2-bedroom rentals in Seattle under $3000/month that allow pets. List address, rent, square footage, and link as a table.

予約系

/ego-browser Search Expedia for hotels near Miami Beach next Saturday night, 4 stars and up, under $200. Sort by rating, list the top 5, and stop before booking.

SaaS 管理画面

/ego-browser Log into my Salesforce, group this quarter's pipeline by stage, and export the total amount and deal count per stage to markdown.

貼り付けて Enter を押したら、ego lite の Space パネルを開き、エージェントが働く様子を眺めてください。