Gratis

Tokens: qué son y cómo usarlos bien

Por qué Claude para a mitad de la conversación — y 5 hábitos para hacer el doble con los mismos tokens.

Claude Prompts Productividad

Esto es para ti si...

Claude te cortó a mitad de una respuesta

y no entendiste por qué pasó

Usas mucho la IA pero sientes que se "cansa"

en conversaciones largas

Quieres exprimir más cada sesión

sin pagar más ni abrir mil pestañas

¿Qué es un token?

No es una palabra. No es un carácter. Es algo intermedio.

Un token es el pedazo mínimo de texto que la IA procesa. Aproximadamente ¾ de una palabra en español. Algunos ejemplos:

"Hola"

1 token — palabra corta y común

"inteligencia artificial"

3 tokens — dos palabras, una compuesta

~750

Media página de texto

~500 palabras ≈ 750 tokens en español

~1500

Una página completa

~1000 palabras ≈ 1500 tokens en español

Lo más importante

Los tokens se cuentan en los dos sentidos: lo que tú escribes (input) y lo que la IA responde (output). Ambos suman al total. Y cada vez que mandas un mensaje, el historial completo de la conversación se vuelve a contar desde el principio.

¿Por qué Claude para a mitad?

No es un bug. Es la memoria de trabajo de la IA.

Cada modelo tiene una ventana de contexto — el máximo de tokens que puede tener "en mente" al mismo tiempo. Es como la memoria de trabajo de una persona: puedes tener mucho en la cabeza, pero no todo.

200K

Claude Sonnet — ventana de contexto

equivale a unas 500 páginas de texto. Enorme, pero tiene límite.

128K

ChatGPT 4o — ventana de contexto

más pequeña que Claude. Se "olvida" antes en conversaciones largas.

Por qué Claude es diferente

Claude es el único modelo que te avisa cuando se está quedando sin tokens, en lugar de seguir respondiendo con información inventada. Que se detenga no es una falla — es honestidad.

5 hábitos para gastar menos tokens

Haz el doble con la misma ventana de contexto.

Conversaciones cortas y focalizadas

Una conversación por tema. No acumules 10 temas distintos en el mismo chat.

Cuando termines una tarea, abre un chat nuevo para la siguiente

No pegues el mismo texto dos veces

Cada vez que pegas un documento, esos tokens se cuentan. Si ya lo pegaste, no lo repitas.

Sube el archivo una vez y haz todas las preguntas sobre ese documento en el mismo chat

Pide respuestas cortas cuando no necesitas detalle

Las respuestas largas también consumen tu contexto.

"Dame solo los 3 puntos clave" o "Responde en máximo 100 palabras"

Pide un resumen antes de que se llene

Cuando una conversación ya está larga, pide un resumen del estado actual antes de que Claude pare.

"Resúmeme en 150 palabras todo lo que hemos definido" — luego pega ese resumen en un chat nuevo

Da contexto al inicio, no en cada mensaje

El contexto que pones al principio del chat se reutiliza. No lo repitas en cada prompt.

Un buen primer mensaje con rol + objetivo + restricciones vale más que 10 mensajes con contexto repetido

Prompts que te salvan cuando el contexto se llena

Copia. Pega. Úsalos justo cuando los necesites.

→

Antes de que se acabe el contexto

"Antes de continuar, resúmeme en 200 palabras todo lo que hemos definido hasta ahora."

Pega ese resumen al inicio del chat nuevo para continuar sin perder nada

→

Para retomar en un chat nuevo

"Contexto: [pega el resumen]. Continuamos desde aquí. Lo siguiente que necesito es..."

Claude entiende inmediatamente y sigue donde lo dejaste

→

Cuando necesitas una respuesta corta

"Responde en máximo 3 bullets. Sin introducción ni conclusión."

Reduce el output a la mitad o menos sin perder la información útil

→

Para un documento largo

"Voy a subir un documento. Espera mis preguntas antes de responder."

Evita que Claude genere una respuesta larga antes de que hayas pedido algo específico

¿Cuándo realmente necesitas el plan de pago?

La respuesta honesta de Capi.

→

Si usas Claude 1-2 veces al día

El plan gratis alcanza. Los límites diarios se renuevan y son generosos si no lo usas masivamente.

→

Si lo usas para trabajar todos los días

El plan Pro ($20/mes) vale la pena. Límites mucho más altos y acceso al modelo más potente.

→

Si tienes Plan Pro y aun así llegas al límite

El problema no es el plan — es el flujo. Aplicar los 5 hábitos de arriba resuelve esto sin gastar más.

La opinión de Capi

Los tokens no son el enemigo. Son solo el idioma en el que la IA mide el trabajo. Una vez que entiendes cómo funcionan, dejas de chocar con los límites y empiezas a diseñar tus conversaciones con más intención — y eso lo cambia todo.

¿Te sirvió? Compártelo con alguien que lo necesite.

Y si quieres implementar todo esto en tu trabajo o empresa, agenda un diagnóstico gratis.

Agendar diagnóstico gratis

Ver todos los recursos en La Bóveda