Ir al contenido

Vocabulario mínimo

Estos seis términos los vas a escuchar mil veces, en este curso, en papers, en docs de frameworks, en stackoverflow. Y te juro que si los entendés bien acá, el resto del camino se vuelve fácil.

Esta es página de referencia. Volvela a leer cuando algo te suene confuso.

Un pedazo manejable de texto. Una página de PDF cruda no le sirve al sistema — es muy larga. Entonces la partís en pedazos de unos 200-800 tokens (~150-600 palabras).

¿Por qué importa el tamaño? Si el chunk es muy chico, perdés contexto. Si es muy grande, el LLM se distrae con info irrelevante. Chunking es uno de los hyperparámetros más importantes de un RAG.

Un vector numérico (típicamente 384, 768 o 1536 dimensiones) que representa el significado semántico de un texto.

La magia: textos parecidos en significado tienen embeddings cercanos en el espacio vectorial. “El perro corre” y “El can va rápido” terminan cerca, aunque no compartan palabras.

Lo genera un modelo de embeddings (no es el LLM — es un modelo distinto, más chico).

Una base de datos especializada en buscar vectores por similitud. Le decís “tengo este vector, dame los más parecidos” y te los devuelve rápido, aunque tengas millones.

Ejemplos: Qdrant, Pinecone, Weaviate, Chroma, pgvector. Para corpus chicos, hasta un array en memoria sirve.

El componente que ejecuta la búsqueda. Toma la query, la convierte a embedding, le pega al vector store, y devuelve los chunks más relevantes.

En frameworks abstractos (LangChain, LlamaIndex), el retriever es una clase con su propia API. En los simples (Vercel AI SDK), es literalmente una función que hace tres cosas en orden.

Cuántos chunks recuperás por query. K = 3 trae los 3 más parecidos. K = 10 trae 10.

Tradeoff clásico: K bajo = poco contexto pero limpio. K alto = más contexto pero ruido. Empezá con K = 5 y ajustá midiendo.

La métrica que usa el vector store para decidir qué tan parecidos son dos vectores. Casi siempre es cosine similarity — mide el ángulo entre los vectores, va de -1 (opuestos) a 1 (idénticos).

Con el vocabulario claro, la próxima página responde una pregunta de diseño importante: ¿por qué este curso te enseña RAG corriendo 100% local? Privacidad, costo, control — vas a ver.