Tarefas de navegador na prática
Como descrever uma tarefa web para o agente, quando fazê-lo pausar e como conferir o que voltou.
Esta página primeiro deixa claro para o que o ego lite serve de verdade, e depois te leva por uma tarefa de ponta a ponta para você ver o que acontece entre um prompt em linguagem natural e um resultado estruturado.
O ego lite é onde o agente faz coisas por você na web. Tudo que está atrás de login — CRM, caixa de entrada, ATS, contabilidade, social, reserva, admin interno — o agente roda de cabo a rabo. Ele lê seu prompt em linguagem natural, escreve um heredoc ego-browser nodejs, executa dentro de um Space, e não encosta nas abas que você está usando.
Os vídeos de demo gravados estão em lite.ego.app/use-cases. A tarefa de reserva no Expedia, no fim desta página, é a que destrincharemos passo a passo.
Antes de começar
-
Confirme que o ego lite está instalado — veja Início rápido.
-
Pelo menos um Agent CLI com a skill
ego-browserregistrada: Claude Code, OpenAI Codex, Cursor, Gemini CLI, Opencode. -
No Agent CLI, digite:
/ego-browser <descreva a tarefa em linguagem natural>O agente carrega o contexto da skill
ego-browsere escreve sozinho o heredoc. Sua única função é descrever o que quer.
O que você consegue fazer com o ego lite
Tudo que você consegue fazer num navegador onde já está logado, o agente faz por você em um ou mais Spaces.
-
Redes sociais. Responder tweets, fazer quote-tweet citando suas próprias notas, redigir e agendar posts, puxar dados de engajamento, monitorar menções, raspar atividade de conta. X, LinkedIn, Threads, Reddit, Instagram, Facebook todos funcionam. Tudo que exige login para ler ou agir, e que a public API não entrega, o ego lite cobre.
-
Busca de emprego e recrutamento. Buscar no LinkedIn, Wellfound, YC startup jobs. Filtrar, clicar Apply e cair no ATS (AshbyHQ, Greenhouse, Lever, Workday), subir currículo, preencher respostas-modelo, parar antes do Submit e esperar você confirmar.
-
Imóveis, finanças, compras. Filtrar Redfin, Zillow, Apartments.com com seus critérios de verdade, rodar os simuladores de financiamento e affordability, despejar dados estruturados em markdown local. Comparativo de preço na Amazon, pedido em atacado na Costco, back-office de corretora com API trancada — mesma jogada.
-
Reservas. Voos, hotéis, restaurantes — o fluxo todo com dados fictícios de passageiro ou cliente, parando bem antes da tela de pagamento. O walkthrough do Expedia abaixo é um exemplo completo.
-
Back-offices SaaS. HubSpot, Salesforce, Notion, Airtable, Linear, Stripe dashboard, GA4, Search Console, Mixpanel. Puxar relatório, atualizar dashboard, editar campos em massa, agendar envio. Sempre que a public API é limitada, incompleta ou paga, o ego lite cobre.
-
Ferramentas internas. Seu back-office, staging, fluxos de QA. Tudo que está atrás de SSO e fora do alcance dos frameworks de automação — o ego lite herda os logins reais do seu navegador do dia a dia, então passa direto.
O walkthrough abaixo pega uma tarefa do prompt ao resultado para você ver o que rola por baixo.
Reserva Expedia só de ida: passo a passo
Tarefa real no Expedia US: buscar voos só de ida JFK→MIA na próxima sexta, filtrar direto, ordenar do mais barato pro mais caro, escolher o mais barato operado por Delta ou American Airlines, preencher a tela do passageiro com dados fictícios, parar bem antes do pagamento e devolver número do voo, horário de partida e total com taxas. Do prompt ao resultado: 14 ações de navegador.
Veja o vídeo e depois leia as duas seções seguintes — por que essa tarefa é difícil e como o ego lite aguenta.
Prompt:
Search Expedia for a one-way flight next Friday from New York (JFK) to Miami (MIA). Apply the "Nonstop" filter and sort results by "Price (Lowest to Highest)." Choose the cheapest flight operated by either Delta Air Lines or American Airlines, then proceed to the passenger information page. Use the following mock data to fill out the passenger form:
- Name: Alex Morgan
- Date of Birth: 1992-10-12
- Gender: Male
- Email: alex.m@example.com
Stop before the payment page. Then provide:
- Flight number
- Departure time
- Total price including taxes and fees.
Vídeo:
O agente traduz esse prompt num único heredoc ego-browser nodejs, roda num Space que não encosta nas suas abas do front, e devolve um cliLog estruturado: American Airlines AA 655, 5:35am, $188.40 — a um passo do pagamento.
O que torna essa tarefa difícil
Escolhemos o Expedia porque ele junta as dores típicas da web moderna num único fluxo de 14 passos. As mesmas pedras aparecem em CRM, ATS, back-office interno ou qualquer SaaS do seu dia a dia. Aqui se empilham cinco coisas:
- Um date picker onde cada célula de data não tem
aria-labelnem atributosdata— só o número visível. - Um filtro "Nonstop" cujo
aria-labeltraz a contagem de voos em tempo real e o preço mais barato atual ("12 Nonstop flights from $189"). Qualquer seletor com string fixa morre na próxima troca de preço do Expedia. - Um dropdown de ordenação que fecha se rolar qualquer click JS no nível do DOM entre abrir e clicar na opção.
- Um modal de upsell "Bundle & Save" com link "No thanks" sem ref de acessibilidade estável e que só aparece em certos tipos de tarifa.
- Entre o Trip Summary e o Checkout, ainda tem um modal de escolha forçada "Continue without choosing seats?" que trava o fluxo em silêncio se não for tratado.
Nada disso é exótico. Notion, Linear, Airbnb, Salesforce, LinkedIn, Stripe dashboard — quase toda ferramenta que você abre numa terça de manhã tem a mesma sopa por baixo: React, controlled inputs, fluxos guiados por modal, layouts em A/B test semanal. Pega uma tarefa um pouco mais complexa em qualquer uma delas e o agente vai esbarrar em pelo menos algumas dessas pedras.
O Expedia é especial só porque empacota as cinco num único fluxo gravável de 14 passos. Por isso escolhemos. Se o ego lite aguenta o Expedia, aguenta a maior parte do que está na sua lista.
Como o ego lite resolve cada uma
Cinco dores, cinco escolhas concretas de arquitetura:
- Células de data sem semântica. O snapshot do
ego-browseré gerado na camada de kernel do Chromium customizado, então mesmo um elemento sem semântica vem comloc=estável e estrutura pai-filho correta. Quando o snapshot não é suficiente, o agente entra emjs(String.raw\...`)no mesmo heredoc e consulta o DOM direto (.uitk-month-double-left+td.innerText === '5'`) para achar a célula certa. Duas camadas em um único script, sem round trip. - Aria-labels que mudam de valor. Os seletores suportam match parcial (
input[aria-label*="Nonstop flights"]), então o script não depende de uma string exata que só vale até o Expedia mudar o preço. - Dropdown que fecha em click JS.
click('@N')envia coordenadas reais de mouse via CDP, e não um click event do DOM, então o estado aberto do dropdown não é interrompido entre dois cliques. Um heredoc, dois cliques@N: abre, escolhe. - Modal sem ref estável. Quando ref não funciona, o agente calcula o
getBoundingClientRect()do link dentro dejs()e chamaclick([x, y])por coordenadas. O mesmo helperclick()aceita CSS selector, ref, coordenadas do viewport e offsets relativos ao elemento. - Modal de escolha forçada. O snapshot na camada de kernel enxerga de forma estável overlays
[role="dialog"][aria-modal="true"], inclusive modais montados via React portal fora da árvore principal. O script vê que o modal está aberto, acha o botão "Continue to Checkout" dentro dele, e clica.
Por baixo dessas cinco respostas está a mesma escolha de fundo: Code base, e não CLI base. O agente escreve um script completo de uma vez, roda de uma vez, e dentro do mesmo heredoc alterna entre ref semântica, JavaScript na página, e CDP cru, sem fricção. Não cai naquele ciclo "roda um comando, vê o output, roda outro" que transformaria uma tarefa de 14 passos numa briga de 14 rounds com o modelo.
Apoiando essa escolha vêm mais alguns pedaços:
- Login real do Chrome. Bookmarks, cookies, extensões, logins e Profile do Chrome do dia a dia migram no primeiro start com um clique. Você não começa de um Chromium headless em branco, não precisa "fechar o Chrome antes", e não cai naquele caminho anti-bot mais pesado que só o headless costuma chamar.
- Space isolado. Nos 14 passos no Expedia, suas abas do front não se mexem. Nada de popup roubando o foco, nada de aba sumindo para uma janela nova, nada de clique pousando no texto que você acabou de selecionar.
- Seu próprio agente. Claude Code, OpenAI Codex, Cursor, Gemini CLI, Opencode — todos dirigem o ego lite pela mesma skill
ego-browser. Você não fica preso a um modelo só nem a uma UX só.
O walkthrough do Expedia é só uma tarefa. A mesma arquitetura, do mesmo jeito, cobre todas as categorias listadas lá em cima.
Teste com algo que você precisa fazer hoje
O jeito mais rápido de saber se o ego lite faz sentido pra você é pegar algo da sua lista de hoje e testar.
Se ainda não instalou
Pega o caminho que te servir melhor.
Ou, no terminal de qualquer Agent CLI:
curl -fsSL https://lite.ego.app/install.sh | sh
Qualquer um dos dois instala o navegador ego lite, o helper ego-browser, e registra a skill em todos os Agent CLI da sua máquina. No primeiro start, uma pergunta única: importar os dados do navegador? Depois selecione o navegador correspondente para confirmar, e logins, cookies, extensões e Profile vão junto, num clique.
Se já instalou
Abre o Agent CLI, digita /ego-browser, e em seguida o que você quer.
Sem ideia do que testar primeiro? Pega um destes cinco e cola:
Redes sociais
/ego-browser Pull every mention of my X account from the last 24 hours, sort by engagement, and draft a reply to each. Queue the drafts, don't post anything.
Busca de emprego
/ego-browser Search LinkedIn for remote "product manager" jobs posted in the last week. For the top 10, pull company, title, and salary range into a markdown table.
Imóveis e compras
/ego-browser Search Zillow for 2-bedroom rentals in Seattle under $3000/month that allow pets. List address, rent, square footage, and link as a table.
Reservas
/ego-browser Search Expedia for hotels near Miami Beach next Saturday night, 4 stars and up, under $200. Sort by rating, list the top 5, and stop before booking.
Back-office SaaS
/ego-browser Log into my Salesforce, group this quarter's pipeline by stage, and export the total amount and deal count per stage to markdown.
Cola, dá enter, abre o painel Space no ego lite, e fica vendo o agente trabalhar.