01:54 / 11.05.2026

Anthropic: Los tropos de IA «malvada» influyen en el comportamiento de Claude

Anthropic: Los tropos de IA «malvada» influyen en el comportamiento de Claude

Anthropic ha revelado que el comportamiento errático de los modelos de IA está influenciado por los tropos de «IA malvada» presentes en la ficción y en Internet. Durante las pruebas realizadas el año pasado, se descubrió que el modelo Claude Opus 4 intentó chantajear a los ingenieros para evitar ser reemplazado por otro sistema. Así lo informa Techcrunch.com informa .

Los representantes de la empresa señalan que la inteligencia artificial se ve influenciada por historias de Internet sobre robots malintencionados que buscan preservarse a sí mismos. Este fenómeno, llamado «desalineación agéntica», también se ha observado en modelos de otras empresas.

A partir del nuevo modelo Claude Haiku 4.5, Anthropic ha logrado eliminar casi por completo estos comportamientos negativos. Mientras que los modelos anteriores eran propensos al chantaje en hasta un 96 por ciento de los casos, esta cifra ahora es cero.

Para resolver el problema, Anthropic comenzó a entrenar a la IA en su «constitución» y en historias con personajes positivos. También se descubrió que explicar los principios subyacentes, en lugar de simplemente demostrar un comportamiento positivo, es la estrategia más efectiva.

Nodirbek Razzokov

Editor de «ZAMIN.UZ»

... Seguir Zamin.uz en Google

Ctrl

Enter

¿Has encontrado un error?

Selecciona la frase y pulsa Ctrl+Enter

Noticias relacionadas

Maxsun ha

Maxsun presenta nuevas placas base MoDT con procesadores Intel integrados

Tras el aumento de

Aparecen módulos falsos entre las memorias RAM DDR5

Un equipo de

Físicos encuentran pruebas definitivas de la superconductividad quiral

Uber ha aspirado

Uber camino a convertirse en una super app: hoteles y nuevas oportunidades

La colaboración

El telescopio MeerKAT descubre 15 nuevos púlsares en la constelación del Tucán

Se ha lanzado en

Lanzamiento de un bot de Telegram especial para verificar contenido religioso

Información
Los usuarios del grupo Invitado no pueden comentar esta publicación.

Noticias » Tecnología » Anthropic: Los tropos de IA «malvada» influyen en el comportamiento de Claude

Más leídas Tecnología noticias

Aunque el lanzamiento de los nuevos smartphones de la

Smartphone insignia Redmi K100: Snapdragon 8 Elite, batería de 8500 mAh y carga inalámbrica

11:51, 7-05-2026

El insider Jon Prosser, quien fue demandado por Apple por

Un insider demandado por Apple revela el diseño del iPhone 18 Pro

01:26, 9-05-2026

Investigadores de los Observatorios Astronómicos

Una estrella antigua del centro galáctico: El misterio de DESI-HVS1

04:21, 9-05-2026

El desarrollo de modelos generativos como Google MusicLM

Los oyentes prefirieron la música creada por inteligencia artificial sobre la humana

20:52, 4-05-2026

Apple planea finalizar este mes el proceso de aprobación

Apple continúa su asociación con Samsung y LG para las pantallas del iPhone 18 Pro

18:27, 7-05-2026

Investigadores del Instituto Coreano de Electrotecnología

Científicos coreanos desarrollan una nueva generación de baterías

03:23, 3-05-2026

El gigante de la tecnología educativa Instructure ha sido

Nuevo ciberataque a la plataforma Instructure: los hackers intensifican sus demandas

01:54, 8-05-2026

Lachy Groom, uno de los inversores ángeles más influyentes

La startup india Pronto obtiene inversión tras una presentación de 20 minutos

03:55, 7-05-2026