¿La IA no piensa realmente? Científicos revelan el secreto detrás de las cadenas de razonamiento

Recientemente, los grandes modelos de razonamiento (LRM) como OpenAI o1 y DeepSeek R1 han asombrado al mundo con su aparente capacidad de pensar como humanos. Sin embargo, un nuevo trabajo científico publicado por investigadores de la Universidad de Arizona, liderados por Subbarao Kambhampati, pone en duda estas percepciones. Según los científicos, las largas «cadenas de pensamiento» (Chain of Thought — CoT) de las redes neuronales no son procesos cognitivos reales, sino simples manipulaciones estadísticas. Así lo informa Ixbt.com en su noticia.
Según los investigadores, las secuencias lógicas generadas por los sistemas de inteligencia artificial (IA) modernos crean en el usuario la ilusión convincente de que está ocurriendo un proceso intelectual. En realidad, estos modelos basados en la arquitectura Transformer solo predicen estadísticamente el siguiente token (fragmento de palabra) basándose en el contexto anterior. Considerar este proceso equivalente al mecanismo de conclusión lógica humana se considera científicamente incorrecto.
El momento «Eureka»: una simple imitación
El trabajo científico presta especial atención al uso por parte de los modelos de IA de expresiones llamadas «Aha-moment», es decir, frases como «Ah, ahora lo entiendo», sugiriendo que han comprendido el problema. Los científicos afirman que esto no es un cambio cualitativo en los cálculos internos de la red neuronal, sino una simple imitación del estilo humano en los datos de entrenamiento. Desde un punto de vista técnico, estos sistemas están optimizados solo para la respuesta final correcta, y las cadenas intermedias no pasan por ninguna verificación semántica.Según ixbt.com, los investigadores utilizaron tareas matemáticas, como salir de laberintos y encontrar la ruta más corta, para probar sus hipótesis. Durante los experimentos se registró un resultado inesperado: los modelos continuaron encontrando la respuesta correcta incluso cuando la cadena de explicaciones lógicas era deliberadamente incorrecta o confusa. Esto demuestra que el sistema no «lee» sus propios razonamientos, sino que los utiliza simplemente como un patrón estadístico adicional.
Otro caso interesante se observó en el experimento llamado «no-maze instances». En este, se le dio a la IA una tarea de laberinto extremadamente simple, sin ningún obstáculo. A pesar de ello, los modelos generaron varias páginas de «razonamientos». Este caso anula la idea de que la longitud del razonamiento represente la potencia de cálculo o la complejidad. Los textos largos son simplemente un artefacto estadístico debido a que los problemas complejos en la base de entrenamiento vienen con explicaciones largas.
El «teatro del razonamiento» y sus riesgos
Los científicos advierten al campo de la inteligencia artificial sobre la trampa del «teatro del razonamiento». Las explicaciones convincentes presentadas por los sistemas pueden despertar una falsa confianza (false trust) en los usuarios. Esto es especialmente peligroso en campos como la medicina, la ingeniería y el derecho, ya que el ser humano no puede físicamente verificar en tiempo real decenas de páginas de cadenas lógicas generadas por la máquina.Los autores de la investigación proponen el enfoque LLM-Modulo como alternativa. En este, los modelos de lenguaje se utilizan únicamente como generadores de hipótesis, y su exactitud es verificada mediante algoritmos externos matemáticamente rigurosos. La conclusión principal es que se debe dejar de antropomorfizar los modelos de IA y evaluar su calidad no por su «discurso interno», sino por sus resultados que puedan ser verificados independientemente.

















Comentarios 0
…