Ab Herbst für alle Plus-Nutzer
ChatGPT: Neuer Audio-Modus erreicht Plus-Nutzer
OpenAI, das Unternehmen hinter dem KI-Chatbot ChatGPT, hat mit der Einführung des neuen, erweiterten Audio-Modus begonnen. Der neue Sprachmodus wird zur Stunde für eine begrenzte Anzahl von ChatGPT Plus-Nutzern bereitgestellt.
Ab Herbst für alle Plus-Nutzer
Die neue Funktion, die OpenAI im Rahmen einer beeindruckenden Demo Anfang Juni vorstellte, soll natürlichere Echtzeit-Gespräche ermöglichen, bei denen Nutzer die KI jederzeit unterbrechen können. Zudem soll der Chatbot in der Lage sein, Emotionen wahrzunehmen und auf diese zu reagieren.
Wie OpenAI in einer Mitteilung auf dem Kurznachrichten-Portal X.com bekanntgegeben hat, werden Nutzer, die an dieser Alpha-Phase teilnehmen, per E-Mail und über eine Nachricht in der mobilen ChatGPT-App informiert. Das Unternehmen plant, den erweiterten Audio-Modus bis zum Herbst schrittweise für alle Plus-Nutzer verfügbar zu machen. Zudem sollen später auch Video- und Bildschirmfreigabe-Funktionen integriert werden.
Seit der ersten Demonstration des erweiterten Sprachmodus arbeitet OpenAI eigenen Angaben zufolge daran, die Sicherheit und Qualität der Sprachunterhaltungen zu verbessern. Dabei wurde die Sprachfähigkeit des Modells GPT-4o mit über 100 externen Testern in 45 verschiedenen Sprachen geprüft.
Sicherheitsbericht kommt im August
Zur Wahrung der Privatsphäre der Nutzer wurde das Modell so trainiert, dass es nur in vier voreingestellten Stimmen sprechen kann. Zusätzlich wurden Systeme entwickelt, die verhindern sollen, dass das Modell in anderen als diesen voreingestellten Stimmen antwortet.
OpenAI plant, Anfang August einen detaillierten Bericht über die Fähigkeiten, Einschränkungen und Sicherheitsbewertungen von GPT-4o zu veröffentlichen.
Der erweiterte Sprachmodus könnte eine wichtige Entwicklung in der Nutzung von KI-gesteuerten Sprachassistenten darstellen und endlich liefern, was Siri, Alexa und der Google Assistent seit Jahren versprechen. Insbesondere durch die Möglichkeit der Echtzeit-Interaktion und emotionaler Reaktionen. Wie sich diese Funktionen in der Praxis bewähren, wird sich im Laufe der weiteren Tests und nach der vollständigen Einführung zeigen.
Ich freu mich:)
hat jemand schon Zugang bekommen?
Leider noch nicht. Kann mit vorstellen, dass ausschließlich US Accounts genommen werden.
Bei mir geht es in der iPhone App via Kopfhörer-Button neben der Eingabezeile. Gerade gab es aber Verbindungsfehler. Mal geht es mal nicht
Das ist die „normale“ Sprachfunktion, nicht die neue.
Ist ist die Neue. Man kann hier ja keine Screenshots posten. Ich nutze es schon den Tag über. Habe mich gerade im Media Markt von ChatGPT über Kameras informieren lassen. Alles als natürliches Gespräch
Man kann auch weiter mit ihm sprechen, wenn man die App verlässt. Erster Eindruck ist sehr gut
Man spricht von „100+“ Teilnehmern. Die Chancen stehen nicht so gut.
Am Mac geht es bei mir auch. Habe die Stimmen durchgetestet und sie sprechen manche Worte mit englischem Akzent aus. Das Gespräch bricht auch nicht ab, wenn man es im Hintergrund laufen lässt bedeutet man, kann nach 1-2 Minuten einfach die nächste Frage stellen ohne bei klicken zu müssen. Also man kann einfach im Workflow bleiben und spricht mit ChatGPT wenn man bspw. den nächsten Schritt erklärt haben will
Nein. Es gibt leider auch keine Infos. Die ersten Tests liefen mit nur rund 100 Nutzern, ab jetzt wird es dann wohl sehr langsam ausgerollt.
Für alle Plus-Nutzer übrigens bis „Ende Herbst“. Kann also noch bis Dezember für die meisten brauchen. Und die Video- und Bildschirmerkennung, die sie damals in der Demo gezeigt haben, kommt ohnehin erst viel später. Aber immerhin scheint alles auch bei uns zu kommen, anders als Apple Intelligence, wovon bisher nicht bekannt ist, ob das jemals nach Europa kommen wird.
Bei mir geht es in der iPhone App
Huch das sollte an paceros
@ifun
Ihr solltet vielleicht mal klarstellen das es bisher ja auch schon eine Sprachfunktion gab und sich diese natürlich von der neuen Version signifikant unterscheidet. Die meisten Nutzer gehen davon aus das dies schon die neue Version ist, was nicht der Fall ist. Das Interface hat sich entsprechend auch geändert.
Absolut richtig. Viele feiern hier die alte Version im Glauben, das sei das neue Sprachmodell.