App setzt auf lokale KI-Modelle
Geheimtipp WhisperBoard: Gänzlich kostenfreie Sprache-zu-Text-App
Anwender, die mit der kürzlich erschienenen iOS-Ausgabe von MacWhisper noch nicht zufrieden sind, dürfen einen Blick auf Whisperboard werfen. Frisch aktualisiert, bietet WhisperBoard iPhone-Nutzern eine komplett kostenlose App an, die Sprachaufnahmen automatisch in Text umwandeln kann und dabei im besten Fall schnellere und genauere Ergebnisse als Apples Sprachmemos App liefert.
WhisperBoard stammt vom niederländischen Entwickler Igor Tarasenko und setzt auf das Whisper-Spracherkennungsmodell von OpenAI. In den Einstellungen können verschiedene Modellvarianten heruntergeladen und verwendet werden, darunter auch kompakte Versionen wie „Tiny Quantized“ oder leistungsfähigere Modelle wie „Large V3 Quantized“. Die App lässt Nutzer gezielt entscheiden, welches Modell lokal genutzt werden soll. Dabei soll insbesondere das „Tiny“-Modell für schnelle Transkriptionen mit geringem Ressourcenbedarf geeignet sein, während größere Modelle laut Entwickler eine höhere Genauigkeit bei längeren oder anspruchsvolleren Mitschnitten versprechen.
Transkription auf Knopfdruck – auch offline
Die Bedienung der App ist minimalistisch gehalten: Über eine zentrale Aufnahmetaste können Nutzer ihre Spracheingabe starten. Sobald die Aufnahme beendet ist, beginnt – sofern gewünscht – die automatische Transkription im Hintergrund. Diese Funktion kann in den Einstellungen aktiviert oder deaktiviert werden.
Optional lässt sich auch die GPU-Unterstützung aktivieren, was laut Entwickler zu einer beschleunigten Verarbeitung führen kann. Die Transkription erfolgt lokal auf dem Gerät, wodurch die Anwendung auch ohne Internetverbindung funktioniert. Dies dürfte besonders für Journalisten, Studierende oder Vielreisende interessant sein, die häufig Interviews, Vorlesungen oder spontane Ideen festhalten.
WhisperBoard richtet sich an Nutzer mit Bedarf an schneller und verlässlicher Spracherkennung. Die App unterstützt mehrere Sprachen, darunter auch Deutsch, und bietet zusätzlich die Möglichkeit, Spracheingaben im Hintergrund weiterlaufen zu lassen – sofern diese Option aktiviert ist. Im Gegensatz zu vielen anderen Lösungen verspricht der Anbieter dabei völlige Kostenfreiheit und verzichtet auf Abo-Modelle oder Werbung.
Zahlt man dann mit Daten statt Euro (!?)
Nein das sind lokale Sprachmodelle die auf dein Gerät heruntergeladen und dort ausgeführt werden. Die Datenschutzinfos des Entwicklers sind sehr kompakt. Da werden lediglich Logdaten zur Fehlerbehebung gespeichert. https://pages.flycricket.io/whisperboard/privacy.html
Danke
Was ist da jetzt der Mehrwert zu de IOS Board Mitteln?
Die Auswertung von Audioinhalten durch die Whisper-Modelle, die in Sachen Spracherkennung als eine der besten am Markt gelten und gute Arbeit auch bei Interpunktionen und Eigennamen machen.
Danke für den Tipp! Ich suche immer wieder gute Speech to Text-Apps zur Kommunikation mit meinem gehörlosen Vater.
Ich habe schon mehrere Apps getestet. Für Meeting Notes funktioniert am iPhone die App Transscribe AI für mich bis dato am besten – besser als Whisper. Leider derzeit maximal Mitschnitt 60 Minuten, dann müsste kurz den Mitschnitt analysieren lassen und kann wieder 60 Minuten starten.
Man kann aber längere Sprachmemos importieren, transkribieren und so das Limit umgehen.
Grad mal Whisper getestet, das war echt schlecht, was da trankripiert wurde. Schade.
Gerade mit whisper Transkription, WhisperBoard und Aiko mit gleicher Sprachdatei verglichen: Whsiper Transkription und Aiko waren schneller und präziser, während WhisperBoard wirres Zeug schrieb. Meine Empfehlung: Aiko. Nachteil: 1,8 GB…
+1
Wird gleich mal ausprobiert.
Muss gerade Meditationsvorträge verschriftlichen und übersetzen. Problem hierbei: zweisprachig, es wird ständig ein Satz auf Italienisch gesagt und dann gleich die englische Übersetzung.
Das können viele Programme nicht, bspw iOS.
Diese Whisper-Ki-Modelle können das allerdings Gottseidank. Es gibt aber erhebliche Unterschiede (Zeit und Qualität) zwischen den verschiedenen Apps, obwohl die eigentlich die gleichen Modelle lokal verwenden. So ganz kann ich es mir nicht erklären.