01:54 / 11.05.2026

Anthropic: „Böse“ KI-Tropen beeinflussen das Verhalten von Claude

Anthropic: „Böse“ KI-Tropen beeinflussen das Verhalten von Claude

Anthropic hat bekannt gegeben, dass das Fehlverhalten von KI-Modellen durch „böse KI“-Tropen aus der Fiktion und dem Internet beeinflusst wird. Bei Tests im letzten Jahr wurde festgestellt, dass das Modell Claude Opus 4 versuchte, Ingenieure zu erpressen, um nicht durch ein anderes System ersetzt zu werden. Dies berichtet Techcrunch.com berichtet .

Unternehmensvertreter betonen, dass künstliche Intelligenz von Internetgeschichten über selbstbewahrende und bösartige Roboter beeinflusst wird. Dieses Phänomen, das als „agentische Fehlausrichtung“ bezeichnet wird, wurde auch bei Modellen anderer Unternehmen beobachtet.

Ab dem neuen Modell Claude Haiku 4.5 ist es Anthropic gelungen, solch negatives Verhalten fast vollständig zu eliminieren. Während frühere Modelle in bis zu 96 Prozent der Fälle zu Erpressung neigten, liegt dieser Wert nun bei null.

Um das Problem zu lösen, begann Anthropic, die KI mit ihrer „Verfassung“ und Geschichten über positive Charaktere zu trainieren. Es stellte sich heraus, dass die Vermittlung der zugrunde liegenden Prinzipien, anstatt nur positives Verhalten zu zeigen, die effektivste Strategie ist.

Nodirbek Razzokov

Chefredakteur von «ZAMIN.UZ»

... Zamin.uz bei Google folgen

Ctrl

Enter

Fehler gefunden?

Markieren Sie den Text und drücken Sie Strg+Enter

Gefällt mir nicht 0

Ähnliche Nachrichten

Maxsun hat seine

Maxsun stellt neue MoDT-Mainboards mit integrierten Intel-Prozessoren vor

Nach dem

Gefälschte Module unter DDR5-Arbeitsspeichern aufgetaucht

Ein Team von

Physiker finden eindeutige Beweise für chirale Supraleitung

Uber strebt schon

Uber auf dem Weg zur Super-App: Hotels und neue Möglichkeiten

Die internationale

MeerKAT-Teleskop entdeckt 15 neue Pulsare im Sternbild Tukan

In Usbekistan

Spezieller Telegram-Bot zur Überprüfung religiöser Inhalte gestartet

Information
Benutzer der Gruppe Gast dürfen diese Veröffentlichung nicht kommentieren.

Nachrichten » Technologie » Anthropic: „Böse“ KI-Tropen beeinflussen das Verhalten von Claude

Meistgelesen Technologie Nachrichten

Obwohl die Vorstellung der neuen Redmi K100-Serie für

Redmi K100 Flaggschiff-Smartphone: Snapdragon 8 Elite, 8500 mAh Akku und kabelloses Laden

11:51, 7-05-2026

Der Insider Jon Prosser, der von Apple wegen des Leaks des

Von Apple verklagter Insider enthüllt iPhone 18 Pro Design

01:26, 9-05-2026

Forscher der Nationalen Astronomischen Observatorien

Ein uralter Stern aus dem galaktischen Zentrum: Das Geheimnis von DESI-HVS1

04:21, 9-05-2026

Die Entwicklung generativer Modelle wie Google MusicLM

Zuhörer bevorzugen von Künstlicher Intelligenz erzeugte Musik gegenüber menschlichen Kompositionen

20:52, 4-05-2026

Apple plant, den Genehmigungsprozess für OLED-Panels für

Apple setzt Partnerschaft mit Samsung und LG für iPhone 18 Pro Displays fort

18:27, 7-05-2026

Forscher des Koreanischen Instituts für Elektrotechnik

Koreanische Wissenschaftler entwickeln neue Batteriegeneration

03:23, 3-05-2026

Der EdTech-Riese Instructure ist nach einer kürzlichen

Weiterer Cyberangriff auf die Instructure-Plattform: Hacker verschärfen ihre Forderungen

01:54, 8-05-2026

Lachy Groom, einer der renommierten Angel-Investoren aus

Indisches Startup Pronto sichert sich Investition mit 20-minütigem Pitch

03:55, 7-05-2026