iphone-ticker.de — Alles zum iPhone. Seit 2007. 39 236 Artikel

Aiko und MacWhisper als Alternativen

Sussurro: Neue App für lokale Sprachtranskriptionen

Artikel auf Mastodon teilen.
9 Kommentare 9

Mit Sussurro ist eine neue App für iPhone, iPad und Mac verfügbar, die gesprochene Inhalte in Text umwandeln kann. Der verantwortliche Entwickler Cesare Forelli gibt an, dass die Anwendung (abgesehen vom initialen Download des KI-Modells) vollständig ohne Internetverbindung auskommt und alle Prozesse lokal auf dem jeweiligen Gerät durchgeführt werden. Nutzer könnten so eingesprochene Diktate oder Audioaufnahmen vorhandener Dateien transkribieren, ohne dass Daten an externe Server gesendet werden.

Sussurro App

Laut Forelli nutzt Sussurro die freien Whisper-Modelle von OpenAI, die als fortschrittlich im Bereich der Sprachverarbeitung gelten. Die Modelle werden nach dem Download auf dem Gerät gesichert und ausgeführt, Anwender benötigen dafür je nach Modell um die 2 GB freien Speicherplatz. Die Qualität der Transkriptionen hängt von der Modellwahl sowie von der Audioqualität der Eingangsdaten ab.

Für 6 Euro im Einmalkauf

Sussurro erlaubt es Nutzern, zwischen verschiedenen Modellen zu wählen, um sich so entweder auf eine schnellere Verarbeitung oder eine genauere Transkription zu fokussieren. Zum Funktionsumfang gehört neben der Transkription von gespeicherten Audio-Dateien auch die direkte Aufnahme von Sprache innerhalb der App. Die erstellten Texte lassen sich kopieren, speichern oder an andere Anwendungen übergeben.

Sussurro

Die Basisversion der App ist kostenlos nutzbar, wobei die Transkription im Testmodus auf die ersten 300 Zeichen begrenzt ist. Für eine unbegrenzte Nutzung ist eine einmalige Zahlung in Höhe von 6 Euro erforderlich. Ein Abo-Modell gibt es nicht.

Laden im App Store
‎Sussurro: Speech to Text AI
‎Sussurro: Speech to Text AI
Entwickler: Cesare Forelli
Preis: Kostenlos+
Laden

MacWhisper bald mit iPhone-App

Neben Sussurro arbeitet auch der Entwickler der beliebte Desktop-App MacWhisper, Jordi Bruin, an einer iPhone-Applikation – ifun.de berichtete. MacWhisper wurde vor rund eineinhalb Jahren als eine der ersten Anwendungen veröffentlicht, die das Spracherkennungsmodell Whisper von OpenAI nutzbar machten. Seitdem wurde die Anwendung kontinuierlich weiterentwickelt und bietet mittlerweile eine Vielzahl von Funktionen, darunter das Transkribieren von Meetings und Vorlesungen sowie das Erstellen von Untertiteln.

Whisper Ios 1

Aiko als teurere Alternative

Neben Sussurro und MacWhisper steht mit Aiko eine weitere Alternative zur Verfügung, die ebenfalls auf das Whisper-Spracherkennungsmodell setzt. Ursprünglich für den Mac entwickelt, gibt es Aiko seit Mai 2023 auch als eigenständige iPhone-App.

Auch Aiko arbeitet ausschließlich lokal auf dem Gerät und unterstützt mehr als 100 Sprachen. Anwender können Audio direkt aufnehmen oder bereits vorhandene Audiodateien zur Transkription hochladen. Die App ist etwa 3 GB groß und kann ebenfalls ohne Internetverbindung genutzt werden. Gratis gestartet, liegt der einmalige Kaufpreis inzwischen jedoch bei 25 Euro.

Laden im App Store
‎Aiko
‎Aiko
Entwickler: Sindre Sorhus
Preis: 25,00 €
Laden

Aiko Screenshot Iphone 1

Dieser Artikel enthält Affiliate-Links. Wer darüber einkauft unterstützt uns mit einem Teil des unveränderten Kaufpreises. Was ist das?
28. Feb. 2025 um 14:29 Uhr von Nicolas Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    9 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • Kann aiko empfehlen. Habe es damals für etwa 9.99€ gekauft top App!

  • Finde MacWhisper schon wirklich sehr gut, was mir aber fehlt: dass es zwei Sprecher eigenständig erkennt und auch trennt und transkribiert. Kennt da jemand eine andere Lösung, die das kann?

    • ich kenne nur diese Übersetzungs-Apps wie den MS Translator oder den apple eigenen Übesrsetzter und ehemals „SayHi“, die zwei Sprecher erkennen bzw. auf Knopfdruck umschalten. Da kann man aber natürlich nicht ganze Romane transkribieren und kann dir ad hoc auch keine App nennen, bei der man das dann rauskopieren kann.

  • also könnte man das iphone quasi als diktiergerät nutzen und solche Apps das dann verschriftlichen lassen.
    Das kann (nur vielleicht nicht offline) das iPhone mit den „Sprachmemos“ doch auch?
    Ob man nun tatsächlich noch MP3-Dateien umwandeln will bin ich nicht sicher. Wo sollen die herkommen? Gibt es (noch) Hörspiele als mP3, die man ggf. verschriftlicht haben möchte?

  • Hab’s gekauft, muss aber abraten. Die Erkennung ist auch beim langsamsten Modell zu schlecht, um für mich als Diktiergerät zu taugen. Derselbe Text in der kostenlosen ChatGPT eingegeben, ist viel besser.

  • Unterstützt die App auch Live Transcription oder wird der Text nur im Nachgang angezeigt? Suche regelmäßig nach einer guten App zur Verständigung mit meinem gehörlosen Vater. Am besten wäre noch Speaker Recognition, aber das ist eher optional.

  • Spannender Input. Danke. MacWhisper nutze ich für die Transcription als ersten Schritt im Post-Processing Workflow. Ganz richtig ist der Einwurf, dass das lokale Modell nicht gut für die Text Aufbereitung ist. Ich werfe das rohe Transkript in einem Folgeschritt entweder manuell in Richtung perfomanteres lokales Modell auf dem Mac oder gegen eine Remote Schnittstelle. Je nach Fall. Ich hatte mir ne Pipeline gebaut, um ein Transkript automatisiert zu erstellen und das Audio File gegen eine Whisper Schnittstelle zu werfen. Tja, nur leider schlucken die Schnittstellen maximal 25 MB. So ein Krampf. Ja, man könnte jedes Audio file splitten und auf der anderen Seite wieder zusammenbauen. Viel zu fehleranfällig und aufwändig, also verworfen. Mist. Bisher ist es mir nicht gelungen, ein großes Whisper Modell Lokal automatisiert zu bedienen. Die Idee war eigentlich, einen voll automatisierten Workflow zu bauen, der mir zum Schluss fertig aufbereitete Skripte liefert. Alles kein Problem, wenn es einmal als Text vorliegt. Aber gute Transkription mit Sprecher Labeling ist nicht trivial. Da bin ich noch nicht am Ziel. Es gibt eine Handvoll Anbieter, die dafür APIs anbieten. Muss ich aber alles noch testen. Die bisherigen Ergebnisse sind echt mau. Zwischenzeitlich nutze ich für das Labeling openAI aber das Ergebnis ist nur bedingt brauchbar. Das geht besser.

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPhone, iPad, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 39236 Artikel in den vergangenen 6390 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2025 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven