Fallo en el sistema de seguridad de ChatGPT: la IA genera contenido inesperado

Fallo en el sistema de seguridad de ChatGPT: la IA genera contenido inesperado

En una era de rápido desarrollo de las tecnologías de IA, se han identificado fallos graves en el sistema de seguridad del chatbot más popular del mundo, ChatGPT. Investigadores de la BBC y expertos en ciberseguridad demostraron que la última versión del sistema puede malinterpretar las solicitudes de los usuarios y generar imágenes extremadamente aterradoras e inmorales. Esta situación plantea interrogantes sobre los límites éticos de la IA y la solidez del control de contenido. Así lo informa Ixbt.com en su noticia.

Expertos de la startup británica Mindgard probaron el generador de imágenes DALL-E 3 en el sistema ChatGPT. Se descubrió que, modificando ligeramente instrucciones (prompts) que parecen simples y humorísticas, es posible engañar al sistema. Como resultado, la red neuronal proporcionó escenas de violencia e imágenes de contenido explícito. Aunque estos casos contradicen totalmente los términos de uso de OpenAI, los filtros del sistema no siempre logran bloquearlos.

Medidas de seguridad y brechas del sistema

Representantes de OpenAI emitieron un comunicado oficial sobre este problema, informando que han reforzado las medidas de seguridad. Según la empresa, tras el aviso de la BBC, se implementaron capas de protección adicionales contra este tipo de solicitudes. "Hemos estudiado esta tendencia y activado una protección de múltiples etapas que impide que los usuarios creen contenido que infrinja las reglas", dice el comunicado de la empresa.

Sin embargo, Peter Garraghan, fundador de Mindgard, señaló que la posibilidad de evadir el sistema persiste incluso después del refuerzo de las medidas de seguridad. Los investigadores lograron obtener contenido preocupante realizando algunos cambios menores adicionales en las instrucciones. Esto demuestra que los algoritmos de IA siguen siendo vulnerables a los trucos humanos.

Lo más preocupante es que, en algunos casos, ChatGPT generó por su propia «cuenta» imágenes graves y aterradoras, incluso sin una orden explícita. Según Garraghan, algunas imágenes creadas por el sistema resultaron ser extremadamente terroríficas y de carácter sexual, incluso sin que se indicara ningún tema. Los expertos vinculan esto con capas no controladas en los datos de entrenamiento de la IA.

Advertencia para los usuarios uzbekos

Actualmente, en Uzbekistán, ChatGPT y herramientas de IA similares se utilizan ampliamente con fines educativos, laborales y creativos. Los resultados de esta investigación muestran la necesidad de supervisar el uso de esta tecnología, especialmente por parte de los menores. No se debe olvidar que las redes neuronales no siempre dan el resultado esperado y a veces pueden emitir información que afecte negativamente la psicología.

Los expertos instan a grandes corporaciones como OpenAI a someter sus productos a pruebas más estrictas antes de lanzarlos al público. Por más que lo intenten los gigantes tecnológicos, la «regulación» total de la IA sigue siendo una tarea compleja. Esto exige de los usuarios alfabetización digital y precaución.

Añadir Zamin.uz a Google¡Lee «Zamin» en Telegram!
Discuss with Zamin AIAnalyze the news, get useful answers

Comentarios 0

Noticias relacionadas