Saltar al contenido principal

RAG

Retrieval Augmented Generation

RAG (Retrieval Augmented Generation) es una arquitectura de IA que combina recuperación de información externa con generación de lenguaje. Cuando ChatGPT "busca en internet" o Perplexity muestra fuentes citadas, están usando RAG. Esta tecnología es el corazón del GEO porque determina qué contenido será recuperado y citado por los LLMs.

Cómo funciona RAG: el proceso completo

Paso 1: Query del usuario

El usuario hace una pregunta. El sistema determina si necesita información externa basándose en la naturaleza de la pregunta (hechos recientes, datos específicos, verificación).

Paso 2: Recuperación (Retrieval)

El sistema busca información relevante en su índice o en la web. Puede usar:

  • Vector search: Convierte la query en un embedding y busca documentos semánticamente similares
  • Web search: Ejecuta búsquedas en motores como Bing o Google
  • Hybrid search: Combina búsqueda semántica con keywords tradicionales

Paso 3: Ranking y selección

De los resultados recuperados, el sistema selecciona los más relevantes. Aquí influyen factores como:

  • Relevancia semántica con la query
  • Autoridad del dominio
  • Frescura del contenido
  • Cost of Retrieval: qué tan fácil es extraer la información

Paso 4: Augmentation (Inyección en contexto)

Los documentos seleccionados se inyectan en el prompt del LLM, típicamente como: "Basándote en la siguiente información: [documentos recuperados], responde a: [query del usuario]"

Paso 5: Generation (Generación)

El LLM genera una respuesta coherente que sintetiza la información recuperada, idealmente citando las fuentes utilizadas.

RAG en diferentes plataformas

Plataforma Implementación RAG Citaciones
ChatGPT (Browse) Búsqueda web activada manualmente o automáticamente Links inline, no siempre consistentes
Perplexity RAG nativo en cada query Citas numeradas, siempre presentes
Google AI Overviews Integración con índice de Google Cards de fuentes debajo
Claude Documentos subidos + (próximamente) web Referencias al documento
Microsoft Copilot Búsqueda Bing integrada Footnotes numerados

Optimización para RAG: fundamentos del GEO

Si entiendes RAG, entiendes por qué el GEO funciona como funciona. Para que tu contenido sea recuperado y citado:

1. Ser indexable por crawlers de IA

Asegúrate de que GPTBot, ClaudeBot y otros crawlers puedan acceder a tu contenido. Revisa tu robots.txt y configura llms.txt.

2. Optimizar para vector search

Los sistemas RAG usan embeddings semánticos. Tu contenido debe:

  • Tener definiciones claras cerca del inicio
  • Usar terminología consistente con las queries de usuarios
  • Estructurar información en chunks lógicos de 200-500 palabras

3. Reducir el Cost of Retrieval

Facilita que el sistema extraiga la información necesaria:

  • Headings descriptivos (H2, H3) que contengan la pregunta implícita
  • Primera oración de cada sección = resumen de esa sección
  • Datos estructurados con Schema Markup

4. Establecer autoridad

RAG prioriza fuentes confiables. Construye señales de autoridad:

  • Menciones en otras fuentes autoritativas (Surround Sound)
  • Datos verificables y citados
  • Información de autor y organización (Brand Entity)

Métricas de rendimiento RAG para GEO

  • Retrieval rate: ¿Con qué frecuencia tu contenido es recuperado para queries relevantes?
  • Citation rate: Cuando es recuperado, ¿con qué frecuencia es citado en la respuesta final?
  • Position in citations: ¿Eres la primera fuente citada o la última?
  • Quote accuracy: ¿El LLM representa tu información correctamente?

El futuro de RAG

RAG está evolucionando hacia sistemas más sofisticados:

  • Multi-hop RAG: Múltiples rondas de recuperación para preguntas complejas
  • Agentic RAG: El modelo decide cuándo y qué buscar dinámicamente
  • RAG con memoria: Contexto persistente entre sesiones

Para estar preparado, el Método CITA de Agencia GEO incorpora principios de optimización RAG desde la fase de Contenido hasta la Amplificación externa.