Checklist de implementación GEO: 22 items

El checklist de implementación GEO tiene 22 items en 6 capas: (1) acceso de crawlers de IA via robots.txt, (2) descubrimiento via llms.txt y sitemap, (3) meta tags con Open Graph y fechas de artículo, (4) schema JSON-LD, (5) estructura de contenido en pirámide invertida, (6) optimización de Core Web Vitals.

Usa este checklist al auditar un sitio existente o lanzar uno nuevo. Los items están ordenados por impacto — complétalos en secuencia para el máximo efecto.

Capa 1: Acceso de crawlers de IA

#	Tarea	Impacto
1	robots.txt con los 8 crawlers de IA explícitamente permitidos (GPTBot, OAI-SearchBot, ClaudeBot, Claude-User, Claude-SearchBot, PerplexityBot, Google-Extended, BingBot)	Crítico
2	SSR o SSG activo — nunca CSR puro para contenido indexable	Crítico

Por qué es crítico: Un sitio que bloquea a los crawlers de IA o sirve solo JavaScript del lado cliente es invisible para todos los sistemas generativos, independientemente de la calidad del contenido. Soluciona esto primero.

Capa 2: Descubrimiento

#	Tarea	Impacto
3	llms.txt en la raíz del sitio con descripción del sitio y todas las páginas principales	Crítico
4	Sitemap XML con `<lastmod>` en todos los URLs	Crítico
22	Sitemaps segmentados por tipo de contenido (blog, guías, productos)	Medio

Por qué importa: Aunque los crawlers de IA puedan acceder a tu sitio, necesitan encontrar tus páginas. llms.txt provee un mapa curado y legible para humanos. El sitemap XML provee un índice legible por máquinas con señales de recencia.

Capa 3: Meta Tags

#	Tarea	Impacto
5	`<title>` específico + `<meta name="description">` como respuesta directa (≤160 chars)	Crítico
6	Open Graph completo: og:type, og:title, og:description, og:url, og:site_name, og:image, og:locale	Alto
7	article:published_time + article:modified_time en todas las páginas de artículo	Alto
8	`<link rel="canonical">` en cada página	Alto

Detalle clave sobre fechas: La recencia es una dimensión de puntuación primaria en los algoritmos de citación de IA. Las páginas sin article:published_time no reciben señal de frescura. Actualiza article:modified_time cada vez que revises el contenido.

Capa 4: Schema Markup (JSON-LD)

#	Tarea	Impacto
9	Schema JSON-LD Article con publisher + fechas en todas las páginas de contenido	Crítico
10	Schema FAQPage en páginas con secciones de preguntas	Alto
11	Schema HowTo en tutoriales y guías paso a paso	Medio
12	Schema BreadcrumbList para jerarquía del sitio	Medio

Dato: Schema Markup aumenta la extracción precisa de información del 16% al 54% (Semrush, estudio de 10.000 páginas). Las páginas con JSON-LD correcto tienen 2.5x más probabilidades de aparecer en respuestas generadas por IA.

Capa 5: Estructura de Contenido

#	Tarea	Impacto
13	Pirámide invertida: respuesta en las primeras 1-2 oraciones después de cada H2	Crítico
14	Answer capsules de 40-60 palabras al inicio de las secciones	Alto
15	Estadísticas con cita de fuente	Alto
16	Citas directas de expertos nombrados	Alto
17	Jerarquía semántica H1→H2→H3, un concepto por heading	Alto
18	HTML semántico: `<article>`, `<time>`, `<cite>`, `<address>`	Medio
19	Anchor text descriptivo en links internos — sin “clic aquí”	Medio

Fuente de investigación: El estudio GEO de Princeton/Georgia Tech (2023) cuantificó el impacto: estadísticas citadas +40%, citas de expertos +37%, referencias a fuentes externas +30%.

Capa 6: Performance

#	Tarea	Impacto
20	LCP < 2.5s, INP < 200ms, CLS < 0.1	Alto
21	Menciones de marca externa en publicaciones del sector	Medio

Sobre Core Web Vitals: No son un acelerador — son un umbral mínimo. Un sitio lento puede ser excluido de citas de IA aunque tenga excelente contenido. Un sitio rápido no gana ventaja por la velocidad sola, pero un sitio lento pierde citas.

Orden de prioridad para sitios nuevos

Si empiezas desde cero, implementa en este orden:

robots.txt (tarda 5 minutos, desbloquea todo lo demás)
SSR/SSG (decisión arquitectónica — hazlo antes de construir contenido)
Meta tags base (title, description, canonical en cada página)
Schema JSON-LD Article (añade a la plantilla de página para que aplique en todas partes)
article:published_time (añade a la plantilla de artículo)
llms.txt (crea una vez, actualiza al añadir páginas)
Estructura de contenido (aplica pirámide invertida y answer capsules al escribir)
Open Graph (añade a la plantilla de página)
Schema FAQPage/HowTo (añade a tipos de página específicos)
Core Web Vitals (optimiza una vez que la base técnica está en su lugar)

Template de auditoría

Para sitios existentes, usa este flujo de auditoría:

Paso 1: Verificar robots.txt
  → curl https://misitio.com/robots.txt | grep -E "GPTBot|ClaudeBot|Perplexity"
  → Esperado: Allow: / para cada bot

Paso 2: Verificar llms.txt
  → curl https://misitio.com/llms.txt
  → Esperado: Archivo Markdown con descripción del sitio y lista de páginas

Paso 3: Verificar meta tags en una página de muestra
  → Ver fuente → buscar article:published_time
  → Esperado: fecha ISO 8601

Paso 4: Verificar schema en una página de muestra
  → Google Rich Results Test: https://search.google.com/test/rich-results
  → Esperado: Schema Article válido detectado

Paso 5: Verificar Core Web Vitals
  → PageSpeed Insights: https://pagespeed.web.dev
  → Esperado: LCP < 2.5s, INP < 200ms, CLS < 0.1

Referencia completa de 22 items

robots.txt con los 8 crawlers de IA permitidos
SSR o SSG (sin CSR puro)
llms.txt en la raíz del sitio
Sitemap XML con lastmod
Title + meta description en cada página
Open Graph completo
article:published_time + article:modified_time
URL canónica en cada página
Schema JSON-LD Article (todas las páginas de contenido)
Schema FAQPage (donde aplique)
Schema HowTo (tutoriales)
Schema BreadcrumbList
Estructura de contenido en pirámide invertida
Answer capsules (40-60 palabras)
Estadísticas citadas
Citas de expertos nombrados
Jerarquía semántica de headings
Elementos HTML semánticos
Anchor text descriptivo
Core Web Vitals (LCP, INP, CLS)
Menciones de marca externa
Sitemaps segmentados