TestFlight-Download schon verfügbar
MacWhisper: Spracherkennungs-App kommt vom Mac aufs iPhone
Vor rund eineinhalb Jahren erschien MacWhisper als eine der ersten Anwendungen, die das von OpenAI veröffentlichte Spracherkennungsmodell Whisper einfach nutzbar machten und Anwendern damit die Möglichkeit boten, Audioaufnahmen oder gesprochene Texte in Windeseile transkribieren zu lassen. Seitdem wurde die App regelmäßig aktualisiert, ist inzwischen in Version 8.5 im Mac App Store verfügbar und hat mit AI Transcription, Aiko und dem Klassiker Audio Hijack zuletzt immer mehr Konkurrenz bekommen.
Umfangreiche Mac-Anwendung
Die Einsatzmöglichkeiten für MacWhisper sind vielfältig. Nutzer können die schlichte Anwendung dafür einsetzen, Audioaufnahmen von Vorlesungen oder Meetings durchsuchbar zu machen oder Untertitel für Filme zu erstellen. Ein wesentlicher Vorteil der Anwendung ist, dass sämtliche Transkriptionen direkt auf dem Mac durchgeführt werden. Weder ist nach dem initialen Download der KI-Modelle eine Internetverbindung zur Spracherkennung nötig, noch verlassen irgendwelche sensitive Daten das eigene System.
Die Nutzung der App ist unkompliziert: Audioaufnahmen können direkt in der App gemacht und in Text umgewandelt werden. Alternativ lassen sich Dateien per Drag-and-Drop in das App-Fenster ziehen. Unterstützte Formate sind unter anderem .mp3, .m4a und .mp4. Die Transkription erfolgt vergleichsweise schnell – als Richtwert gilt das 15-fache der tatsächlichen Dauer der Audioaufnahme. Die Ergebnisse können als Text auf dem Bildschirm angezeigt oder im PDF- beziehungsweise HTML-Format exportiert werden.
iOS-Version per TestFlight nutzbar
Wie Entwickler Jordi Bruin jetzt angekündigt hat, wird MacWhisper bald auch für iOS verfügbar sein. Zwar dauerte die Entwicklung der iOS-App länger als geplant, nun steht aber eine erste Vorabversion über TestFlight zur Verfügung, und die Freigabe im App Store soll in den kommenden Tagen erfolgen. Ähnlich wie bei der macOS-Version sollen auch bei der iOS-App alle Funktionen durch eine einmalige Zahlung freigeschaltet werden.
Das Spracherkennungsmodell Whisper bietet Unterstützung für mehr als 100 Sprachen und verfügt über eine automatische Erkennung der Eingabesprache.
- TestFlight-Download: Whisper-App für iOS
Alternativ kann die Sprache auch manuell ausgewählt werden. Die Basisversion wird in der Mac-Ausgabe kostenlos angeboten, lediglich für den Zugriff auf die leistungsfähigeren Sprachmodelle Medium- und Large, die präzisere Ergebnisse liefern sollen, wird der Kauf der Pro-Version vorausgesetzt.
Zum Nachlesen:
- Kostenlos, offline, mehrsprachig: iPhone-App schreibt Gesprochenes mit
Gibts eine Alternative mit Sprechererkennung? Das ist die einzige Funktion, die ich bei MacWhisper vermisse.
Just Press Records immer eine Empfehlung
Die Transkription von Just Press Record ist katastrophal schlecht
Bin mal gespannt, ob das so gut wird wie die Sprache-zu-Text-Erkennung via ChatGPT-App. Das funktioniert mit meiner Stimme am besten.
Ich las neulich über ein MurMur… nutzt das jemand?
Während MacWhisper meine Vorstellung erfülllt und ich es gern und oft verwende, scheint mir die Whisper-App für iPhone und iPad noch ziemlich fern von einer Gebrauchsfähigkeit entfernt zu sein. Das Teilen von Audiodateien zu Whisper ist nur aus Apples Files-App (Dateien) möglich, nicht aus anderen Apps und schon gar nicht durch Verweis auf eine Datei im Internet. Nach dem Aufruf einer Audiodatei zeigt Whisper eine Zeitlang die Meldung »Specializing« und stürzt dann ab.