Checklist de implementación GEO: 22 items
El checklist de implementación GEO tiene 22 items en 6 capas: (1) acceso de crawlers de IA via robots.txt, (2) descubrimiento via llms.txt y sitemap, (3) meta tags con Open Graph y fechas de artículo, (4) schema JSON-LD, (5) estructura de contenido en pirámide invertida, (6) optimización de Core Web Vitals.
Checklist de implementación GEO: 22 items
El checklist de implementación GEO tiene 22 items en 6 capas: (1) acceso de crawlers de IA via robots.txt, (2) descubrimiento via llms.txt y sitemap, (3) meta tags con Open Graph y fechas de artículo, (4) schema JSON-LD, (5) estructura de contenido en pirámide invertida, (6) optimización de Core Web Vitals.
Usa este checklist al auditar un sitio existente o lanzar uno nuevo. Los items están ordenados por impacto — complétalos en secuencia para el máximo efecto.
Capa 1: Acceso de crawlers de IA
| # | Tarea | Impacto |
|---|---|---|
| 1 | robots.txt con los 8 crawlers de IA explícitamente permitidos (GPTBot, OAI-SearchBot, ClaudeBot, Claude-User, Claude-SearchBot, PerplexityBot, Google-Extended, BingBot) | Crítico |
| 2 | SSR o SSG activo — nunca CSR puro para contenido indexable | Crítico |
Por qué es crítico: Un sitio que bloquea a los crawlers de IA o sirve solo JavaScript del lado cliente es invisible para todos los sistemas generativos, independientemente de la calidad del contenido. Soluciona esto primero.
Capa 2: Descubrimiento
| # | Tarea | Impacto |
|---|---|---|
| 3 | llms.txt en la raíz del sitio con descripción del sitio y todas las páginas principales | Crítico |
| 4 | Sitemap XML con <lastmod> en todos los URLs | Crítico |
| 22 | Sitemaps segmentados por tipo de contenido (blog, guías, productos) | Medio |
Por qué importa: Aunque los crawlers de IA puedan acceder a tu sitio, necesitan encontrar tus páginas. llms.txt provee un mapa curado y legible para humanos. El sitemap XML provee un índice legible por máquinas con señales de recencia.
Capa 3: Meta Tags
| # | Tarea | Impacto |
|---|---|---|
| 5 | <title> específico + <meta name="description"> como respuesta directa (≤160 chars) | Crítico |
| 6 | Open Graph completo: og:type, og:title, og:description, og:url, og:site_name, og:image, og:locale | Alto |
| 7 | article:published_time + article:modified_time en todas las páginas de artículo | Alto |
| 8 | <link rel="canonical"> en cada página | Alto |
Detalle clave sobre fechas: La recencia es una dimensión de puntuación primaria en los algoritmos de citación de IA. Las páginas sin article:published_time no reciben señal de frescura. Actualiza article:modified_time cada vez que revises el contenido.
Capa 4: Schema Markup (JSON-LD)
| # | Tarea | Impacto |
|---|---|---|
| 9 | Schema JSON-LD Article con publisher + fechas en todas las páginas de contenido | Crítico |
| 10 | Schema FAQPage en páginas con secciones de preguntas | Alto |
| 11 | Schema HowTo en tutoriales y guías paso a paso | Medio |
| 12 | Schema BreadcrumbList para jerarquía del sitio | Medio |
Dato: Schema Markup aumenta la extracción precisa de información del 16% al 54% (Semrush, estudio de 10.000 páginas). Las páginas con JSON-LD correcto tienen 2.5x más probabilidades de aparecer en respuestas generadas por IA.
Capa 5: Estructura de Contenido
| # | Tarea | Impacto |
|---|---|---|
| 13 | Pirámide invertida: respuesta en las primeras 1-2 oraciones después de cada H2 | Crítico |
| 14 | Answer capsules de 40-60 palabras al inicio de las secciones | Alto |
| 15 | Estadísticas con cita de fuente | Alto |
| 16 | Citas directas de expertos nombrados | Alto |
| 17 | Jerarquía semántica H1→H2→H3, un concepto por heading | Alto |
| 18 | HTML semántico: <article>, <time>, <cite>, <address> | Medio |
| 19 | Anchor text descriptivo en links internos — sin “clic aquí” | Medio |
Fuente de investigación: El estudio GEO de Princeton/Georgia Tech (2023) cuantificó el impacto: estadísticas citadas +40%, citas de expertos +37%, referencias a fuentes externas +30%.
Capa 6: Performance
| # | Tarea | Impacto |
|---|---|---|
| 20 | LCP < 2.5s, INP < 200ms, CLS < 0.1 | Alto |
| 21 | Menciones de marca externa en publicaciones del sector | Medio |
Sobre Core Web Vitals: No son un acelerador — son un umbral mínimo. Un sitio lento puede ser excluido de citas de IA aunque tenga excelente contenido. Un sitio rápido no gana ventaja por la velocidad sola, pero un sitio lento pierde citas.
Orden de prioridad para sitios nuevos
Si empiezas desde cero, implementa en este orden:
- robots.txt (tarda 5 minutos, desbloquea todo lo demás)
- SSR/SSG (decisión arquitectónica — hazlo antes de construir contenido)
- Meta tags base (title, description, canonical en cada página)
- Schema JSON-LD Article (añade a la plantilla de página para que aplique en todas partes)
- article:published_time (añade a la plantilla de artículo)
- llms.txt (crea una vez, actualiza al añadir páginas)
- Estructura de contenido (aplica pirámide invertida y answer capsules al escribir)
- Open Graph (añade a la plantilla de página)
- Schema FAQPage/HowTo (añade a tipos de página específicos)
- Core Web Vitals (optimiza una vez que la base técnica está en su lugar)
Template de auditoría
Para sitios existentes, usa este flujo de auditoría:
Paso 1: Verificar robots.txt
→ curl https://misitio.com/robots.txt | grep -E "GPTBot|ClaudeBot|Perplexity"
→ Esperado: Allow: / para cada bot
Paso 2: Verificar llms.txt
→ curl https://misitio.com/llms.txt
→ Esperado: Archivo Markdown con descripción del sitio y lista de páginas
Paso 3: Verificar meta tags en una página de muestra
→ Ver fuente → buscar article:published_time
→ Esperado: fecha ISO 8601
Paso 4: Verificar schema en una página de muestra
→ Google Rich Results Test: https://search.google.com/test/rich-results
→ Esperado: Schema Article válido detectado
Paso 5: Verificar Core Web Vitals
→ PageSpeed Insights: https://pagespeed.web.dev
→ Esperado: LCP < 2.5s, INP < 200ms, CLS < 0.1
Referencia completa de 22 items
- robots.txt con los 8 crawlers de IA permitidos
- SSR o SSG (sin CSR puro)
- llms.txt en la raíz del sitio
- Sitemap XML con lastmod
- Title + meta description en cada página
- Open Graph completo
- article:published_time + article:modified_time
- URL canónica en cada página
- Schema JSON-LD Article (todas las páginas de contenido)
- Schema FAQPage (donde aplique)
- Schema HowTo (tutoriales)
- Schema BreadcrumbList
- Estructura de contenido en pirámide invertida
- Answer capsules (40-60 palabras)
- Estadísticas citadas
- Citas de expertos nombrados
- Jerarquía semántica de headings
- Elementos HTML semánticos
- Anchor text descriptivo
- Core Web Vitals (LCP, INP, CLS)
- Menciones de marca externa
- Sitemaps segmentados