🎁 Nueva guía gratis - Razonamiento extendido: los casos donde cambia el resultado.  Leerla ahora →

Guía gratis · Razonamiento

Razonamiento extendido: los casos donde cambia el resultado

Guía con criterios concretos para decidir cuándo activar el razonamiento extendido, los tipos de tarea donde la diferencia de resultado es significativa, y cómo instruir al modelo para que use esa capacidad con profundidad real.

Comparte:

Razonamiento extendido: los casos donde cambia el resultado

Por qué estás aquí

Los modelos más avanzados tienen un modo que la mayoría no usa bien: el razonamiento extendido. No es simplemente "pensar más". Es un proceso diferente donde el modelo genera pasos internos de análisis antes de darte la respuesta final. Puede cambiar completamente la calidad del resultado en ciertos tipos de tarea, y puede ser un gasto de tiempo y créditos en otros. Este documento te da el criterio para distinguir cuándo es cuándo.


Qué es el razonamiento extendido y qué lo diferencia de una respuesta normal

En una respuesta normal, el modelo recibe tu instrucción y genera la respuesta directamente. El proceso interno no es visible y es relativamente lineal.

En razonamiento extendido, el modelo genera primero un "borrador de pensamiento" interno, que en algunos modelos puedes ver y en otros no, donde examina el problema desde múltiples ángulos, cuestiona supuestos, considera alternativas, y llega a la respuesta final después de ese proceso. El resultado puede ser significativamente diferente.

La analogía: es la diferencia entre pedirle una opinión a alguien en el momento, y pedirle que tome una noche para pensarlo y te diga qué concluye.


Los modelos que tienen razonamiento extendido

ModeloModo de razonamientoCómo activarlo
Claude Sonnet 5 / Fable 5 / Opus 4.8Adaptive thinkingActivo por defecto en todos estos modelos; ajustable con el parámetro de esfuerzo
Claude Opus 4.5 / Haiku 4.5Extended thinking manualInterruptor en la interfaz antes de enviar
ChatGPT GPT-5.5 / GPT-5.5-proRazonamiento incorporadoEs el modo por defecto de estos modelos
Gemini 2.5 Pro / 2.5 FlashThinking modeActivo por defecto; ajustable con el nivel de razonamiento (minimal, low, medium, high)
Gemini 3 Flash / 3 ProThinking modeActivo por defecto con nivel alto

Una distinción importante en Claude: los modelos más nuevos (Sonnet 5, Fable 5, Opus 4.8) usan adaptive thinking, lo que significa que razonan de forma automática según la complejidad de la tarea, sin que tengas que activar nada. Los modelos anteriores (Opus 4.5, Haiku 4.5) usan extended thinking manual, que sí requiere activarlo explícitamente.

El costo: todos estos modos consumen más tokens (el equivalente a créditos de uso) y son más lentos. En Gemini y en los modelos Claude con extended thinking manual, el razonamiento usa más créditos por conversación. En ChatGPT, los modelos GPT-5.5 son planes más caros o consumen más de tu cuota mensual.


Cuándo activarlo: los casos donde el resultado cambia

1. Análisis estratégico de situaciones complejas

Ejemplo: evaluar si vale la pena aceptar un cliente con condiciones inusuales, o decidir entre dos estrategias con factores que se compensan mutuamente.

Por qué funciona: el razonamiento extendido pondera los factores en lugar de darte la respuesta estadísticamente más probable. Cuando hay múltiples variables interdependientes, la diferencia es notoria.

2. Revisión crítica de tu propio trabajo

Ejemplo: pedirle que encuentre los puntos débiles de una propuesta que estás a punto de enviar, o las objeciones que un cliente podría tener a tu presentación.

Por qué funciona: sin razonamiento extendido, los modelos tienden a ser agradables: a confirmar que lo que escribiste está bien. Con razonamiento extendido, el análisis crítico es más honesto y más profundo.

3. Problemas estructurales que requieren coherencia interna

Ejemplo: diseñar el flujo completo de onboarding de un cliente con múltiples etapas y dependencias, o armar un plan de proyecto con recursos limitados.

Por qué funciona: el razonamiento extendido produce estructuras más coherentes porque el modelo verifica la lógica interna antes de presentar el resultado.

4. Preguntas estratégicas sin respuesta obvia

Ejemplo: "¿Cuál es el mayor riesgo que no estoy viendo en esta estrategia de precios?" o "¿Por qué podría perder este cliente en los próximos seis meses?"

Por qué funciona: en preguntas donde no hay una respuesta correcta única, el razonamiento extendido explora más opciones antes de comprometerse con una.


Cuándo NO activarlo

Estos casos no mejoran con razonamiento extendido:

  • Redactar un email (fluidez y tono, no análisis)
  • Resumir un documento (tarea mecánica de extracción)
  • Hacer una lista de ideas para contenido
  • Responder una pregunta factual
  • Formatear o editar texto existente
  • Traducir

En todos estos casos, el razonamiento extendido solo agrega tiempo de espera y consume más tokens sin producir mejor resultado.


La instrucción que extrae más valor del razonamiento extendido

Activar el modo no es suficiente. Necesitas decirle al modelo qué hacer con esa capacidad adicional.

Antes de responder, tómate el tiempo de analizar este problema en profundidad.

Paso 1, Supuestos: ¿cuáles son los supuestos implícitos en cómo formulé la pregunta?
¿Hay algo que estoy asumiendo que podría no ser verdad?

Paso 2, Perspectivas incómodas: ¿cuáles son los ángulos que me darían la respuesta
más honesta, aunque sea la que menos quiero escuchar?

Paso 3, Respuesta final: dame la conclusión que más me ayude a tomar una buena decisión.
Formato: primero tu razonamiento en 3-4 oraciones, luego la recomendación concreta
en una sola línea. No me tranquilices, clarifica.

Esta instrucción le indica explícitamente que use el razonamiento para cuestionar, no para confirmar.


Un ejemplo concreto: con y sin razonamiento extendido

Pregunta: "Tengo una cliente que paga bien pero tarda 60 días en pagar y genera mucho desgaste en el equipo. ¿La mantengo?"

Sin razonamiento extendido: Respuesta probable: "Depende de cuánto representa del ingreso total, del costo del desgaste, y de si puedes reemplazarla. Analiza el ROI de la relación."

Con razonamiento extendido y la instrucción de arriba: El modelo examina factores que probablemente no mencionaste: el costo de oportunidad de ese desgaste en proyectos más valiosos, el patrón de clientes similares (si el desgaste es una señal de que hay un problema de fit desde el inicio), el riesgo de que los 60 días pasen a ser 90, y la pregunta de si "paga bien" es suficiente compensación cuando el costo no monetario es alto. La respuesta es más incómoda y más útil.


El criterio final: ¿requiere esta tarea deliberación?

Si la respuesta correcta necesita que alguien piense antes de responder, no solo que recupere información o aplique un patrón conocido: activa el razonamiento extendido.

Si es recuperación o aplicación de patrón: respuesta normal.


Referencias

  1. Anthropic. *Extended thinking with Claude.* docs.anthropic.com/en/docs/build-with-claude/extended-thinking
  2. OpenAI. *Learning to reason with LLMs.* openai.com/index/learning-to-reason-with-llms
  3. Snell, C. et al. *Scaling LLM Test-Time Compute Optimally.* arXiv:2408.03314
  4. Anthropic: Extended thinking documentation
  5. OpenAI: o1 model card
Comparte:

Lectura adicional

¿Quieres dos ideas de IA todos los días?

Gratis, en Instagram, en español, FACILITOOOO y para todos. Solo cosas que funcionan de verdad.

sigueme @heypiili