Qué es ego lite
Qué es ego lite, para quién, y en qué se diferencia de las herramientas de automatización de navegador que ya existen.
ego lite es un navegador pensado para que tú y tus agentes de IA trabajen juntos. Los agentes ejecutan tareas en paralelo, cada uno en su propio Space, comparten contigo los inicios de sesión de Chrome y no tocan las pestañas que estás usando. Las mismas tareas terminan más rápido y con menos tokens.
Cualquier Agent CLI se puede conectar a ego lite a través de la skill ego-browser: Claude Code, OpenAI Codex, Cursor, Continue, Gemini CLI, Hermes Agent, OpenClaw, Opencode, o un agente propio.
Funciones principales
Un panorama rápido aquí; cada función tiene su propia página en la sección "Funciones".
Space
Un Space es un área de trabajo aislada dentro de ego lite. No es una ventana nueva, ni otro perfil de Chrome, ni un modo headless. Es una partición dentro del mismo navegador, donde el agente trabaja sin tocar las pestañas que estás usando.
Tú y el agente comparten el mismo navegador. El agente trabaja en su Space, tú sigues en tus pestañas, y ninguno le roba el foco al otro. Puedes entrar a un Space cuando quieras para ver qué está haciendo el agente, tomar el control, o detener la tarea.
Un Space puede ejecutar varias tareas en paralelo; cuántas depende de la potencia de tu máquina, a razón de un Space por agente o por tarea. Lo que antes había que pasar en fila por un solo navegador, ahora corre en simultáneo: Claude Code enriquece 10 leads en 10 Spaces, Codex hace scraping de 5 sitios de la competencia en otros 5, y tú sigues trabajando en tus propias pestañas. Estas tareas no chocan en pestañas, snapshots, refs ni estado del navegador, y ninguna toca las tuyas.
→ Space
Snapshot
ego lite viene con un kernel Chromium profundamente personalizado, que genera snapshots de página de alta calidad: la vista que los modelos de texto usan para "ver" y "operar" una página web. Una página típica llega al agente como un accessibility tree compacto, y cada elemento lleva una ref corta. Una página entera suele caber en 200 a 400 tokens, mucho menos que el HTML crudo.
Llamar a snapshotText() sobre una pantalla de login devuelve algo así:
Page: Example - Log in
URL: https://example.com/login
@1 [heading] "Log in"
@2 [form]
@3 [input type="email"] placeholder="Email"
@4 [input type="password"] placeholder="Password"
@5 [button type="submit"] "Continue"
@6 [link] "Forgot password?"
El agente reconoce de inmediato que @3 es el campo de email y @5 es el botón de enviar, y opera por refs: fill('@3', '...'), click('@5'). No hace falta adivinar selectores CSS y la rotación de class name no rompe nada.
El snapshot se genera dentro del motor Chromium, y no a través de una capa de JavaScript encima del Chrome de fábrica. Por eso maneja sin problemas casos que las herramientas basadas en shim dejan pasar en silencio: iframes muy anidados, shadow DOM, y componentes de SDK de terceros como Stripe checkout, Salesforce embed, panel de Intercom o React portals montados dinámicamente.
→ Snapshot
ego-browser
Así es como el agente de IA maneja el navegador. Navegación, observación, acción y salida quedan todos dentro de un único heredoc de Node.js, ejecutado de una sola vez:
ego-browser nodejs <<'EOF'
await useOrCreateTaskSpace('follow-ego-agent')
await openOrReuseTab('https://x.com/ego_agent', { wait: true })
await snapshotText()
await click('@92') // @92 es el botón Follow que devolvió el snapshot
cliLog('Done.')
EOF
Un heredoc, una ida y vuelta, en lugar de "corre un comando, lee la salida, corre otro, lee más salida". En nuestro benchmark interno sobre cuatro tareas complejas (frente al agent-browser de Vercel), ego lite fue hasta un 245 % más rápido en cada una y gastó bastantes menos tokens. Cuanto más compleja la tarea, mayor la diferencia.
Acumulación de experiencia (próximamente)
Cada tarea que termina bien se destila en un artefacto reutilizable: un tool o un workflow, archivado por dominio. La próxima vez que el agente ejecute una tarea en el mismo sitio, carga la solución ya validada y se ahorra la fase de prueba y error. En pruebas internas, la segunda corrida de una tarea compleja llega a ser hasta 5× más rápida que la primera, además de la ganancia que ya da ego-browser en una sola ejecución.
→ Skills
Privacidad
Todos tus datos de navegación quedan en tu equipo. Contraseñas, cookies, historial, marcadores, extensiones y Profile importados desde Chrome no se suben a ningún lado. El contenido de las páginas lo lee y opera tu propio agente. ego lite se ocupa solo del navegador y el puente; pensar y leer es trabajo del agente.
En la instalación, ego lite registra una sola cosa: si elegiste o no importar los datos de Chrome.
No hay que crear cuenta, no recolectamos email, y no hay sesión en la nube a la que iniciar sesión.
Plataformas y precio
Por ahora, macOS. Windows y Linux están en el roadmap.
Descarga gratis. Sin suscripción, sin cobro por tarea, sin medición de sesión en la nube. Usas tu propio Agent CLI y tus propias claves de API.
Para seguir leyendo
Por qué construimos ego lite y cómo lo pensamos, en este post del blog: A Browser for You and Your AI Agents to Work in Parallel.