Saltar al contenido principal

Cost of Retrieval

Costo de Recuperación

Cost of Retrieval (Costo de Recuperación) es un concepto del framework de Koray Tuğberk GÜBÜR que mide el esfuerzo que un LLM necesita para extraer información útil de un documento. Un Cost of Retrieval bajo significa que el contenido está tan bien estructurado que el LLM puede fácilmente identificar y extraer la información relevante. Reducir este "costo" aumenta la probabilidad de citación.

El concepto detrás de Cost of Retrieval

Cuando un sistema RAG recupera documentos para responder una pregunta, no todos los documentos son igual de útiles. Algunos documentos:

  • Tienen la respuesta enterrada en párrafos de texto irrelevante
  • Requieren que el LLM infiera conexiones no explícitas
  • Usan terminología inconsistente con la query
  • Carecen de estructura clara que facilite la extracción

Estos documentos tienen un "alto costo de recuperación" — el LLM tiene que trabajar más para extraer la información útil. En contraste, documentos con estructura clara, definiciones explícitas y organización lógica tienen un "bajo costo de recuperación".

Factores que aumentan el Cost of Retrieval

Problemas de estructura

  • Falta de headings: Texto en bloques sin H2/H3 que dividan secciones
  • Párrafos largos: Más de 150 palabras sin breaks
  • Información dispersa: La misma información fragmentada en múltiples lugares
  • Navegación confusa: Estructura no jerárquica

Problemas de contenido

  • Definiciones implícitas: Nunca dices explícitamente "X es Y"
  • Jerga sin explicar: Términos técnicos sin definición
  • Respuestas indirectas: No respondes la pregunta directamente
  • Exceso de marketing: Fluff que diluye la información útil

Problemas técnicos

  • Contenido en imágenes: Texto importante que no es text-based
  • JavaScript-heavy: Contenido que requiere rendering
  • PDFs no optimizados: Sin estructura de texto extraíble

Cómo reducir el Cost of Retrieval

1. Estructura piramidal invertida

Cada sección debe comenzar con la conclusión/respuesta, seguida de detalles. El LLM puede extraer la información clave de las primeras oraciones sin procesar todo el contenido.

2. Patrón definición + contexto

Para cada concepto importante, usa el patrón:

[Término] es [categoría] que [función/característica principal].
[Contexto adicional].
[Ejemplos o aplicaciones].

3. Headings como preguntas

Usa headings que reflejen las preguntas que los usuarios hacen:

  • ❌ "Información sobre precios"
  • ✅ "¿Cuánto cuesta [servicio]?"

4. Chunks de 200-500 palabras

Los sistemas RAG dividen documentos en chunks. Estructura tu contenido en secciones que funcionen como unidades independientes de 200-500 palabras.

5. Respuestas directas primero

Antes de explicar el "por qué", da el "qué". Los LLMs pueden extraer la respuesta directa sin procesar la explicación completa.

6. Listas y tablas para datos

Información comparativa o listados es más fácil de extraer en formato estructurado que en prosa.

7. Schema Markup

Los datos estructurados con Schema Markup tienen el Cost of Retrieval más bajo posible — la información ya está en formato parseable.

Cost of Retrieval en diferentes tipos de contenido

Tipo de contenido Cost of Retrieval típico Cómo optimizar
FAQ estructurada Muy bajo Añadir FAQPage Schema
Artículo editorial Medio-alto Añadir resumen ejecutivo, headings claros
Página de producto Medio Specs en tablas, Product Schema
Caso de estudio Alto Key metrics upfront, resultados en bullets
Blog post narrativo Muy alto Añadir TL;DR, extraer insights en boxes

Information Responsiveness: el concepto relacionado

Information Responsiveness es el inverso del Cost of Retrieval — mide qué tan bien tu contenido "responde" a las necesidades de información. Un contenido con alta Information Responsiveness tiene bajo Cost of Retrieval.

Cost of Retrieval en el Método CITA

En la fase "C" (Contenido) del Método CITA de Agencia GEO, optimizamos activamente para reducir el Cost of Retrieval:

  • Auditoría de estructura de contenido existente
  • Reestructuración con pirámide invertida
  • Implementación de patrones definición + contexto
  • Optimización de headings para queries comunes
  • Desarrollo de Quality Nodes con estructura óptima