🎁 Nueva guía gratis - Tokens y contexto: cómo afectan tu trabajo directamente.  Leerla ahora →

Guía gratis · Fundamentos

Tokens y contexto: cómo afectan tu trabajo directamente

Guía práctica sobre qué son los tokens y las ventanas de contexto, y qué cambios concretos en tu forma de trabajar mejoran inmediatamente la calidad de los resultados.

FundamentosContextoInstrucciones30 días de IA5 min de lectura · Publicado en junio 2026
Comparte:

Tokens y contexto: cómo afectan tu trabajo directamente

Por qué estás aquí

Probablemente has notado que la IA a veces te da datos incorrectos, inventa fuentes, o te responde algo que suena correcto pero no lo es. La razón no es un error de diseño: está en cómo el modelo procesa la información, no en palabras completas, sino en fragmentos que se llaman tokens. La ventana de contexto determina la cantidad de texto, en tokens, que el modelo puede considerar o "recordar" en un momento dado. Entender ambos conceptos cambia cómo organizas tu trabajo con la IA y cuánto confías en lo que te devuelve.


Qué es un token

Un token no es una palabra. Es el fragmento mínimo de texto que el modelo procesa. Dependiendo del idioma y la estructura de la palabra, un token puede ser:

  • Una palabra completa corta: "la", "el", "de" = 1 token cada una
  • La primera sílaba de una palabra larga: "tra-" de "trabajo" = 1 token
  • Un símbolo o puntuación: "." "," "¿" = 1 token
  • Un número: "2026" = 1-2 tokens

Regla práctica para español: 100 palabras = aproximadamente 130 a 150 tokens. El español genera más tokens que el inglés por la misma cantidad de contenido, porque las palabras largas con morfología compleja se fragmentan más.

Por qué importa el conteo de tokens

Los modelos tienen un límite de cuántos tokens pueden procesar en total, en ambas direcciones: lo que entra (tu instrucción + el documento que pegaste) y lo que sale (la respuesta). Ese límite se llama ventana de contexto. Para el trabajo del día a día, nunca vas a llegar a ese límite. El problema aparece cuando acumulas muchos mensajes en el mismo hilo durante días, o cuando pegas documentos completos de una sola vez.


Qué pasa cuando se llena la ventana de contexto

Esto es lo que la mayoría no sabe: cuando una conversación acumula muchos mensajes, los más antiguos empiezan a "caerse" fuera de la ventana. El modelo no puede acceder a ellos.

El síntoma: a mitad de una conversación larga, el modelo "olvida" instrucciones que diste al principio, repite información que ya procesaste, o da respuestas inconsistentes con lo que acordaste antes.

El error más común: usar la misma conversación para todo durante días. El contexto se llena, la calidad baja, y la persona cree que el modelo "está mal" cuando en realidad la conversación simplemente lleva demasiada historia.


Las tres reglas prácticas que cambian los resultados

Regla 1: Una tarea importante = una conversación nueva

Cuando empiezas una tarea nueva o un proyecto diferente, abre una conversación nueva. No acumules todo en el mismo hilo.

Si usas Proyectos (una carpeta de instrucciones permanentes dentro del modelo), el contexto del Proyecto está siempre disponible aunque la conversación sea nueva. Eso resuelve el problema de tener que "re-explicar" quién eres cada vez.

Regla 2: Pega solo la sección relevante, no el documento completo

Si tienes un documento largo (un contrato, un presupuesto de proveedor, un informe, un correo extenso) y necesitas trabajar con una sección específica, pega solo esa sección más una oración de contexto. No pegues el documento completo. Consumes tokens innecesariamente y el modelo presta menos atención a la parte que importa.

(Adapta el rol y el tipo de documento a tu propio trabajo.)

Regla 3: El pedido concreto va al final, el contexto al principio

Los modelos ponderan la información de forma no uniforme. Las instrucciones al final del mensaje tienen más peso que las del principio. El patrón que funciona:

[Contexto sobre quién eres y qué estás haciendo]
[Información o documento relevante]
[El pedido específico, siempre al final]

Por qué la IA alucina: la explicación completa

Las alucinaciones no son errores de programación. Son la consecuencia directa de cómo funciona el modelo: no busca la verdad, genera la continuación que parece más probable.

Cuando el modelo no tiene suficiente información sobre algo específico, elige la respuesta que parece más probable según todo lo que ha aprendido, no la que es verdad. A veces esa respuesta es correcta. A veces inventa un nombre de autor, una fecha, una estadística, o una fuente que suena plausible pero no existe.

Las tres situaciones de mayor riesgo de alucinación:

  1. Preguntas sobre eventos recientes que el modelo no conoce (su conocimiento tiene fecha de corte)
  2. Nombres propios muy específicos: personas, empresas, publicaciones con poca presencia en texto de entrenamiento
  3. Estadísticas precisas sin fuente. El modelo puede generar un número convincente pero incorrecto

Cómo evitarlo? para cualquier dato que vayas a usar en un documento importante, pídele al modelo que cite la fuente. Si no puede citar fuente, el dato requiere verificación externa antes de usar.

Importante: para cualquier estadística o dato específico que incluyas en la respuesta,
cita la fuente. Si no tienes certeza de la fuente, indica explícitamente
"esto requiere verificación" en lugar de presentarlo como hecho.

Comparte:

Lectura adicional

¿Quieres dos ideas de IA todos los días?

Gratis, en Instagram, en español, FACILITOOOO y para todos. Solo cosas que funcionan de verdad.

sigueme @heypiili