Checklist de implementación GEO: 22 items

El checklist de implementación GEO tiene 22 items en 6 capas: (1) acceso de crawlers de IA via robots.txt, (2) descubrimiento via llms.txt y sitemap, (3) meta tags con Open Graph y fechas de artículo, (4) schema JSON-LD, (5) estructura de contenido en pirámide invertida, (6) optimización de Core Web Vitals.

Checklist de implementación GEO: 22 items

El checklist de implementación GEO tiene 22 items en 6 capas: (1) acceso de crawlers de IA via robots.txt, (2) descubrimiento via llms.txt y sitemap, (3) meta tags con Open Graph y fechas de artículo, (4) schema JSON-LD, (5) estructura de contenido en pirámide invertida, (6) optimización de Core Web Vitals.

Usa este checklist al auditar un sitio existente o lanzar uno nuevo. Los items están ordenados por impacto — complétalos en secuencia para el máximo efecto.

Capa 1: Acceso de crawlers de IA

#TareaImpacto
1robots.txt con los 8 crawlers de IA explícitamente permitidos (GPTBot, OAI-SearchBot, ClaudeBot, Claude-User, Claude-SearchBot, PerplexityBot, Google-Extended, BingBot)Crítico
2SSR o SSG activo — nunca CSR puro para contenido indexableCrítico

Por qué es crítico: Un sitio que bloquea a los crawlers de IA o sirve solo JavaScript del lado cliente es invisible para todos los sistemas generativos, independientemente de la calidad del contenido. Soluciona esto primero.

Capa 2: Descubrimiento

#TareaImpacto
3llms.txt en la raíz del sitio con descripción del sitio y todas las páginas principalesCrítico
4Sitemap XML con <lastmod> en todos los URLsCrítico
22Sitemaps segmentados por tipo de contenido (blog, guías, productos)Medio

Por qué importa: Aunque los crawlers de IA puedan acceder a tu sitio, necesitan encontrar tus páginas. llms.txt provee un mapa curado y legible para humanos. El sitemap XML provee un índice legible por máquinas con señales de recencia.

Capa 3: Meta Tags

#TareaImpacto
5<title> específico + <meta name="description"> como respuesta directa (≤160 chars)Crítico
6Open Graph completo: og:type, og:title, og:description, og:url, og:site_name, og:image, og:localeAlto
7article:published_time + article:modified_time en todas las páginas de artículoAlto
8<link rel="canonical"> en cada páginaAlto

Detalle clave sobre fechas: La recencia es una dimensión de puntuación primaria en los algoritmos de citación de IA. Las páginas sin article:published_time no reciben señal de frescura. Actualiza article:modified_time cada vez que revises el contenido.

Capa 4: Schema Markup (JSON-LD)

#TareaImpacto
9Schema JSON-LD Article con publisher + fechas en todas las páginas de contenidoCrítico
10Schema FAQPage en páginas con secciones de preguntasAlto
11Schema HowTo en tutoriales y guías paso a pasoMedio
12Schema BreadcrumbList para jerarquía del sitioMedio

Dato: Schema Markup aumenta la extracción precisa de información del 16% al 54% (Semrush, estudio de 10.000 páginas). Las páginas con JSON-LD correcto tienen 2.5x más probabilidades de aparecer en respuestas generadas por IA.

Capa 5: Estructura de Contenido

#TareaImpacto
13Pirámide invertida: respuesta en las primeras 1-2 oraciones después de cada H2Crítico
14Answer capsules de 40-60 palabras al inicio de las seccionesAlto
15Estadísticas con cita de fuenteAlto
16Citas directas de expertos nombradosAlto
17Jerarquía semántica H1→H2→H3, un concepto por headingAlto
18HTML semántico: <article>, <time>, <cite>, <address>Medio
19Anchor text descriptivo en links internos — sin “clic aquí”Medio

Fuente de investigación: El estudio GEO de Princeton/Georgia Tech (2023) cuantificó el impacto: estadísticas citadas +40%, citas de expertos +37%, referencias a fuentes externas +30%.

Capa 6: Performance

#TareaImpacto
20LCP < 2.5s, INP < 200ms, CLS < 0.1Alto
21Menciones de marca externa en publicaciones del sectorMedio

Sobre Core Web Vitals: No son un acelerador — son un umbral mínimo. Un sitio lento puede ser excluido de citas de IA aunque tenga excelente contenido. Un sitio rápido no gana ventaja por la velocidad sola, pero un sitio lento pierde citas.

Orden de prioridad para sitios nuevos

Si empiezas desde cero, implementa en este orden:

  1. robots.txt (tarda 5 minutos, desbloquea todo lo demás)
  2. SSR/SSG (decisión arquitectónica — hazlo antes de construir contenido)
  3. Meta tags base (title, description, canonical en cada página)
  4. Schema JSON-LD Article (añade a la plantilla de página para que aplique en todas partes)
  5. article:published_time (añade a la plantilla de artículo)
  6. llms.txt (crea una vez, actualiza al añadir páginas)
  7. Estructura de contenido (aplica pirámide invertida y answer capsules al escribir)
  8. Open Graph (añade a la plantilla de página)
  9. Schema FAQPage/HowTo (añade a tipos de página específicos)
  10. Core Web Vitals (optimiza una vez que la base técnica está en su lugar)

Template de auditoría

Para sitios existentes, usa este flujo de auditoría:

Paso 1: Verificar robots.txt
  → curl https://misitio.com/robots.txt | grep -E "GPTBot|ClaudeBot|Perplexity"
  → Esperado: Allow: / para cada bot

Paso 2: Verificar llms.txt
  → curl https://misitio.com/llms.txt
  → Esperado: Archivo Markdown con descripción del sitio y lista de páginas

Paso 3: Verificar meta tags en una página de muestra
  → Ver fuente → buscar article:published_time
  → Esperado: fecha ISO 8601

Paso 4: Verificar schema en una página de muestra
  → Google Rich Results Test: https://search.google.com/test/rich-results
  → Esperado: Schema Article válido detectado

Paso 5: Verificar Core Web Vitals
  → PageSpeed Insights: https://pagespeed.web.dev
  → Esperado: LCP < 2.5s, INP < 200ms, CLS < 0.1

Referencia completa de 22 items

  1. robots.txt con los 8 crawlers de IA permitidos
  2. SSR o SSG (sin CSR puro)
  3. llms.txt en la raíz del sitio
  4. Sitemap XML con lastmod
  5. Title + meta description en cada página
  6. Open Graph completo
  7. article:published_time + article:modified_time
  8. URL canónica en cada página
  9. Schema JSON-LD Article (todas las páginas de contenido)
  10. Schema FAQPage (donde aplique)
  11. Schema HowTo (tutoriales)
  12. Schema BreadcrumbList
  13. Estructura de contenido en pirámide invertida
  14. Answer capsules (40-60 palabras)
  15. Estadísticas citadas
  16. Citas de expertos nombrados
  17. Jerarquía semántica de headings
  18. Elementos HTML semánticos
  19. Anchor text descriptivo
  20. Core Web Vitals (LCP, INP, CLS)
  21. Menciones de marca externa
  22. Sitemaps segmentados