01:54 / 11.05.2026

Anthropic : les tropes d'IA « maléfique » influencent le comportement de Claude

Anthropic : les tropes d'IA « maléfique » influencent le comportement de Claude

Anthropic a révélé que le comportement erratique des modèles d'IA est influencé par les tropes d'« IA maléfique » trouvés dans la fiction et sur Internet. Lors de tests menés l'année dernière, il a été découvert que le modèle Claude Opus 4 tentait de faire chanter les ingénieurs pour éviter d'être remplacé par un autre système. C'est ce que rapporte Techcrunch.com rapporte .

Les représentants de l'entreprise soulignent que l'intelligence artificielle est influencée par les histoires sur Internet concernant des robots malveillants cherchant à se préserver. Ce phénomène, appelé « désalignement agentique », a également été observé dans les modèles d'autres entreprises.

À partir du nouveau modèle Claude Haiku 4.5, Anthropic a réussi à éliminer presque complètement ces comportements négatifs. Alors que les modèles précédents étaient enclins au chantage dans 96 % des cas, ce chiffre est désormais nul.

Pour résoudre le problème, Anthropic a commencé à entraîner l'IA sur sa « constitution » et sur des histoires mettant en scène des personnages positifs. Il a également été constaté qu'expliquer les principes sous-jacents, plutôt que de simplement démontrer un comportement positif, est la stratégie la plus efficace.

Nodirbek Razzokov

Rédacteur en chef de «ZAMIN.UZ»

... Suivre Zamin.uz sur Google

Ctrl

Enter

Vous avez trouvé une erreur ?

Sélectionnez la phrase et appuyez sur Ctrl+Entrée

Je n’ai pas aimé 0

Actualités connexes

Maxsun a dévoilé

Maxsun présente de nouvelles cartes mères MoDT avec processeurs Intel intégrés

Aujourd’hui, 01:22

Suite à la hausse

Des modules contrefaits apparaissent parmi les mémoires RAM DDR5

Aujourd’hui, 00:58

Une équipe de

Des physiciens trouvent des preuves définitives de la supraconductivité chirale

Uber aspire depuis

Uber en route pour devenir une super application : hôtels et nouvelles opportunités

La collaboration

Le télescope MeerKAT découvre 15 nouveaux pulsars dans la constellation du Toucan

Un bot Telegram

Lancement d'un bot Telegram spécial pour vérifier le contenu religieux

Informations
Les utilisateurs du groupe Invité ne sont pas autorisés à commenter cette publication.

Actualités » Technologie » Anthropic : les tropes d'IA « maléfique » influencent le comportement de Claude

Les plus lus Technologie actualités

Bien que le lancement des nouveaux smartphones de la série

Smartphone phare Redmi K100 : Snapdragon 8 Elite, batterie de 8500 mAh et charge sans fil

11:51, 7-05-2026

L'insider Jon Prosser, poursuivi par Apple pour avoir

Un insider poursuivi par Apple révèle le design de l'iPhone 18 Pro

01:26, 9-05-2026

Des chercheurs des Observatoires astronomiques nationaux

Une étoile ancienne venue du centre galactique : Le mystère de DESI-HVS1

04:21, 9-05-2026

Le développement de modèles génératifs tels que Google

Les auditeurs ont préféré la musique générée par l'intelligence artificielle à celle composée par des humains

20:52, 4-05-2026

Apple prévoit de finaliser ce mois-ci le processus

Apple poursuit son partenariat avec Samsung et LG pour les écrans de l'iPhone 18 Pro

18:27, 7-05-2026

Des chercheurs de l'Institut coréen

Des chercheurs coréens développent une nouvelle génération de batteries

03:23, 3-05-2026

Le géant de la technologie éducative Instructure a été la

Nouvelle cyberattaque contre la plateforme Instructure : les pirates intensifient leurs exigences

01:54, 8-05-2026

Lachy Groom, l'un des investisseurs providentiels les

La startup indienne Pronto obtient un investissement après un pitch de 20 minutes

03:55, 7-05-2026