Vocabulario mínimo

Por qué esta página

Estos seis términos los vas a escuchar mil veces, en este curso, en papers, en docs de frameworks, en stackoverflow. Y te juro que si los entendés bien acá, el resto del camino se vuelve fácil.

Esta es página de referencia. Volvela a leer cuando algo te suene confuso.

Chunk

Un pedazo manejable de texto. Una página de PDF cruda no le sirve al sistema — es muy larga. Entonces la partís en pedazos de unos 200-800 tokens (~150-600 palabras).

¿Por qué importa el tamaño? Si el chunk es muy chico, perdés contexto. Si es muy grande, el LLM se distrae con info irrelevante. Chunking es uno de los hyperparámetros más importantes de un RAG.

Embedding

Un vector numérico (típicamente 384, 768 o 1536 dimensiones) que representa el significado semántico de un texto.

La magia: textos parecidos en significado tienen embeddings cercanos en el espacio vectorial. “El perro corre” y “El can va rápido” terminan cerca, aunque no compartan palabras.

Lo genera un modelo de embeddings (no es el LLM — es un modelo distinto, más chico).

Vector store

Una base de datos especializada en buscar vectores por similitud. Le decís “tengo este vector, dame los más parecidos” y te los devuelve rápido, aunque tengas millones.

Ejemplos: Qdrant, Pinecone, Weaviate, Chroma, pgvector. Para corpus chicos, hasta un array en memoria sirve.

Retriever

El componente que ejecuta la búsqueda. Toma la query, la convierte a embedding, le pega al vector store, y devuelve los chunks más relevantes.

En frameworks abstractos (LangChain, LlamaIndex), el retriever es una clase con su propia API. En los simples (Vercel AI SDK), es literalmente una función que hace tres cosas en orden.

Top-k

Cuántos chunks recuperás por query. K = 3 trae los 3 más parecidos. K = 10 trae 10.

Tradeoff clásico: K bajo = poco contexto pero limpio. K alto = más contexto pero ruido. Empezá con K = 5 y ajustá midiendo.

Similarity (cosine similarity)

La métrica que usa el vector store para decidir qué tan parecidos son dos vectores. Casi siempre es cosine similarity — mide el ángulo entre los vectores, va de -1 (opuestos) a 1 (idénticos).

Lo que viene

Con el vocabulario claro, la próxima página responde una pregunta de diseño importante: ¿por qué este curso te enseña RAG corriendo 100% local? Privacidad, costo, control — vas a ver.