El concepto detrás de Cost of Retrieval
Cuando un sistema RAG recupera documentos para responder una pregunta, no todos los documentos son igual de útiles. Algunos documentos:
- Tienen la respuesta enterrada en párrafos de texto irrelevante
- Requieren que el LLM infiera conexiones no explícitas
- Usan terminología inconsistente con la query
- Carecen de estructura clara que facilite la extracción
Estos documentos tienen un "alto costo de recuperación" — el LLM tiene que trabajar más para extraer la información útil. En contraste, documentos con estructura clara, definiciones explícitas y organización lógica tienen un "bajo costo de recuperación".
Factores que aumentan el Cost of Retrieval
Problemas de estructura
- Falta de headings: Texto en bloques sin H2/H3 que dividan secciones
- Párrafos largos: Más de 150 palabras sin breaks
- Información dispersa: La misma información fragmentada en múltiples lugares
- Navegación confusa: Estructura no jerárquica
Problemas de contenido
- Definiciones implícitas: Nunca dices explícitamente "X es Y"
- Jerga sin explicar: Términos técnicos sin definición
- Respuestas indirectas: No respondes la pregunta directamente
- Exceso de marketing: Fluff que diluye la información útil
Problemas técnicos
- Contenido en imágenes: Texto importante que no es text-based
- JavaScript-heavy: Contenido que requiere rendering
- PDFs no optimizados: Sin estructura de texto extraíble
Cómo reducir el Cost of Retrieval
1. Estructura piramidal invertida
Cada sección debe comenzar con la conclusión/respuesta, seguida de detalles. El LLM puede extraer la información clave de las primeras oraciones sin procesar todo el contenido.
2. Patrón definición + contexto
Para cada concepto importante, usa el patrón:
[Término] es [categoría] que [función/característica principal].
[Contexto adicional].
[Ejemplos o aplicaciones]. 3. Headings como preguntas
Usa headings que reflejen las preguntas que los usuarios hacen:
- ❌ "Información sobre precios"
- ✅ "¿Cuánto cuesta [servicio]?"
4. Chunks de 200-500 palabras
Los sistemas RAG dividen documentos en chunks. Estructura tu contenido en secciones que funcionen como unidades independientes de 200-500 palabras.
5. Respuestas directas primero
Antes de explicar el "por qué", da el "qué". Los LLMs pueden extraer la respuesta directa sin procesar la explicación completa.
6. Listas y tablas para datos
Información comparativa o listados es más fácil de extraer en formato estructurado que en prosa.
7. Schema Markup
Los datos estructurados con Schema Markup tienen el Cost of Retrieval más bajo posible — la información ya está en formato parseable.
Cost of Retrieval en diferentes tipos de contenido
| Tipo de contenido | Cost of Retrieval típico | Cómo optimizar |
|---|---|---|
| FAQ estructurada | Muy bajo | Añadir FAQPage Schema |
| Artículo editorial | Medio-alto | Añadir resumen ejecutivo, headings claros |
| Página de producto | Medio | Specs en tablas, Product Schema |
| Caso de estudio | Alto | Key metrics upfront, resultados en bullets |
| Blog post narrativo | Muy alto | Añadir TL;DR, extraer insights en boxes |
Information Responsiveness: el concepto relacionado
Information Responsiveness es el inverso del Cost of Retrieval — mide qué tan bien tu contenido "responde" a las necesidades de información. Un contenido con alta Information Responsiveness tiene bajo Cost of Retrieval.
Cost of Retrieval en el Método CITA
En la fase "C" (Contenido) del Método CITA de Agencia GEO, optimizamos activamente para reducir el Cost of Retrieval:
- Auditoría de estructura de contenido existente
- Reestructuración con pirámide invertida
- Implementación de patrones definición + contexto
- Optimización de headings para queries comunes
- Desarrollo de Quality Nodes con estructura óptima