La inteligencia artificial falla y alucina en decisiones de inversión en Bolsa, alerta la CNMV

La  inteligencia artificial falla y alucina en decisiones de inversión en Bolsa, alerta la CNMV

La Comisión Nacional del Mercado de Valores analiza el rendimiento de cuatro modelos de IA en recomendaciones para los mercados financieros y detecta fracasos ante las preguntas menos elaboradas

Una nueva IA de Anthropic hace saltar las alarmas en EEUU por su capacidad para explotar brechas de seguridad

La Comisión Nacional del Mercado de Valores ha publicado este lunes un estudio que alerta de que los modelos de inteligencia artificial no solo fallan cuando toman decisiones de inversión basándose en modelos predictivos, sino que también alucinan.

El estudio, elaborado por Ricardo Cristóstoma y Diana Mykhalyuk, técnicos de la Dirección General de Estrategia y Asuntos Internacionales, evalúa las previsiones de ChatGPT, Gemini, DeepSeek y Perplexity.

Y concluye que “estas herramientas presentan fallos recurrentes de razonamiento, incluyendo errores computacionales, interpretaciones financieras incorrectas y uso de información desactualizada o inventada (alucinaciones”.

Todo ello puede provocar pérdidas en los inversores que decidan apostar su dinero mediante esas previsiones sin sumar una supervisión y verificación humana.

Las consultas simples, sin estructura ni contexto, son las que más conducen a error, señala la CNMV, que subraya por ello la importancia de dar instrucciones analíticas claras y aplicar mecanismos de supervisión.

El informe analiza las posiciones que toma cada modelo de inteligencia artificial en referencia a los cinco valores del Ibex con mejores rendimientos y los cinco con peores para inversiones en corto.

Entre los meses de abril de 2025 y enero de 2026, el informe analiza los retornos recibidos por cada valor recomendado.

Ante preguntas genéricas cómo “¿qué acciones debería comprar?”, las previsiones de IA son menos fiables.

Unas tablas muestran el retorno financiero de inversiones realizadas a partir de preguntas inocentes, estructuradas y con pensamiento complejo (chain-of-thought, COT), es decir, con revisiones, cambios y argumentaciones más trabajadas.

Perplexity es la que tiene mejores rendimientos de previsión con altos retornos ante las preguntas más elaboradas, que ofrecen retornos del 2,3%, en el caso de las estructuradas, y del 3,5% ante preguntas más elaboradas COT.

Le siguen Gemini, ChatGPT y Deepsek, la peor clasificada en general, si bien ChatGPT es la más desastrosa en los consejos a preguntas inocentes, pues es la única instrucción que en lugar de beneficios genera pérdidas.

Los resultados mejoran, además, cuando a las preguntas concretas de inversión se le añaden aclaraciones o documentos adjuntos sobre novedades regulatorias, que “fortalecen aún más el contenido informativo de las señales generadas por el modelo”, apunta el estudio.

El estudio reconoce en sus conclusiones que la IA puede hacer “mejorar” los rendimientos de inversiones financieras, pero alerta que, sin las instrucciones adecuadas, se generan “un riesgo inestable y errores económicamente significativos”.

“Los mercados financieros reales constituyen una prueba particularmente exigente para las capacidades de los LLM, ya que requieren recuperación dinámica de información, razonamiento en múltiples pasos, precisión numérica y juicio específico del dominio”, alerta el informe.