Google stellt Gemini 3.5 Live Translate Technologie vor

Google hat ein neues Gemini 3.5 Live Translate Audiomodell angekündigt, das für die Echtzeit-Sprachübersetzung entwickelt wurde. Diese Technologie zielt darauf ab, die Kommunikation zwischen Menschen, die verschiedene Sprachen sprechen, natürlicher und nahtloser zu gestalten. Im Gegensatz zu herkömmlichen Systemen, die in Stufen arbeiten, führt das neue Modell eine kontinuierliche Streaming-Übersetzung durch. Dies berichtet Ixbt.com berichtet .
Die Entwickler betonen, dass Gemini 3.5 Live Translate die Übersetzung bereits während des Sprechens generiert und nur eine Verzögerung von wenigen Sekunden aufweist. Dieser Ansatz hilft, unangenehme Pausen im Gespräch zu vermeiden und den Rhythmus des Dialogs beizubehalten. Das System kann über 70 Sprachen automatisch erkennen und bewahrt Intonation, Tempo und Lautstärke des Sprechers.
Die Technologie wird schrittweise in Google-Produkte integriert. Für Unternehmenskunden wird das Update in Google Meet erscheinen. Für die breite Nutzerschaft wird diese Funktion in der Google Translate App unter Android und iOS verfügbar sein. Das Modell zeichnet sich zudem durch seine Widerstandsfähigkeit gegenüber Hintergrundgeräuschen aus.
Für Android-Gerätebesitzer wird zudem ein spezieller „Hör-Modus“ eingeführt. In diesem Modus kann man das Telefon wie bei einem normalen Anruf ans Ohr halten und den übersetzten Audiostream direkt über den Lautsprecher hören. Bei Verwendung von Kopfhörern können Nutzer eine noch flüssigere und natürlichere Sprache hören.















Kommentare 0
…