OpenAI bringt GPT-5-Intelligenz in Echtzeit-Sprachmodelle

openai-bringt-gpt-5-intelligenz-in-echtzeit-sprachmodelle

OpenAI hat mit GPT-Realtime-2 ein neues Sprachmodell vorgestellt, das über die API verfügbar ist. Was das Modell von seinen Vorgängern unterscheidet, ist die Tatsache, dass es erstmals GPT-5-Niveau beim Denken und Schlussfolgern in Echtzeit-Sprachinteraktionen mitbringt. Das klingt erstmal technisch trocken, ist aber eigentlich ein ziemlich großer Schritt für alle, die Sprachagenten entwickeln.

Bisher sind Sprachassistenten oft eher reaktiv – man stellt eine Frage, bekommt eine Antwort. Mit GPT-Realtime-2 sollen Sprachagenten komplexere Aufgaben direkt im Gesprächsverlauf lösen können, also wirklich mitdenken, während das Gespräch läuft, nicht nur auf vorgefertigte Muster zurückgreifen.

Zusammen mit GPT-Realtime-2 hat OpenAI zudem zwei weitere Modelle veröffentlicht: GPT-Realtime-Translate für Echtzeit-Übersetzung und GPT-Realtime-Whisper für Audio-Transkription. Alle drei sind als Streaming-Modelle über die API abrufbar.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies