KI die denkt, plant, agiert und sich erinnert
Google stellt Gemini 2.0 vor: Neues Modell kommt in die Gemini-App
Google und die KI-Tochter DeepMind haben die nächste Generation ihres gemeinsamen KI-Modells vorgestellt: Gemini 2.0. Der Suchmaschinen-Riese will mit Gemini 2.0 die Ära der KI-Agenten einläuten und beschriebt das neue Modell als ein System, das nicht nur Informationen verarbeiten, sondern auch eigenständig Aktionen ausführen kann.
Mit der Neuveröffentlichung will Google neue Möglichkeiten für den Einsatz von künstlicher Intelligenz in unterschiedlichen Bereichen schaffen.
Multimodale Funktionen und Agenten
Gemini 2.0 kombiniert Eingaben aus Text, Video, Bildern und Audio und kann selbst nicht nur Text sondern auch Inhalte wie Bilder und Sprache generieren. Google zufolge bietet das Modell Verbesserungen in der Verarbeitungsgeschwindigkeit und eine flexiblere Nutzung von Werkzeugen wie der Google-Suche und benutzerdefinierten Funktionen.
Ein Highlight ist Gemini 2.0 Flash, ein experimentelles Modell, das erste Entwickler bereits getestet haben. Es unterstützt die Steuerung von Werkzeugen und ermöglicht komplexere Aufgaben wie Planung und Problemlösung. Prototypen wie „Project Astra“ (ein KI-Assistent), „Project Mariner“ (eine Browser-Unterstützung) und „Jules“ (ein Entwickler-Tool) zeigen mögliche Einsatzbereiche.
- Project Astra: Ein Prototyp, der als universeller KI-Assistent dienen soll. Verbesserungen betreffen unter anderem die Dialogfähigkeit in mehreren Sprachen, die Nutzung von Google-Diensten und eine personalisierte Speicherfunktion.
- Project Mariner: Eine Anwendung, die Nutzern im Browser helfen soll, komplexe Aufgaben zu bewältigen. Die KI kann auf Bildschirminhalte wie Texte, Bilder und Formulare zugreifen und Aufgaben wie das Ausfüllen von Formularen übernehmen.
- Jules: Ein Werkzeug für Softwareentwickler, das Aufgaben im GitHub-Workflow bearbeiten und ausführen kann.
Verfügbar über die Gemini-App
Google betont, dass Sicherheit und Ethik bei der Entwicklung von Gemini 2.0 im Vordergrund standen. So wurden Maßnahmen zur Datensicherheit, zur Verhinderung eines missbräuchlichen Einsatzes und zur zuverlässigen Informationsverarbeitung implementiert. Entwickler können erste Versionen über die Gemini-API bereits testen, eine breitere Verfügbarkeit ist für Anfang 2025 geplant, dann soll das neue Modell auch über die kürzlich veröffentlichte Gemini-App angeboten werden.
Wie viele Steine soll ich diesmal pro Tag essen?
reference acknowledged: https://www.ifun.de/googles-ki-debakel-steine-schmackhaft-rauchen-gesund-tiere-im-penis-233149/
Mittlerweile funktioniert Gemini sehr gut und ich nutze es täglich für alle mögliche Dinge auf dem iPhone. Ich wünschte, Apple wäre mal so weit…
Das ist ja nicht einmal Apples Anwendungsgebiet. Dafür soll ja die Anbindung externe Dienste wie ChatGPT sorgen.
Also warum nur Gemini wenn man alles haben kann. Zumal Gemini die schlechteste generative KI ist. Apple hat ja nicht einmal eine.
Die Algorithmen die mit der Neural Engine funktionieren, könnte man durchaus als KI verstehen. Aber ja, die texten dir nicht einfach deine Hausaufgaben – das stimmt.
Habe heute früh eine Webseite in fünf Sätzen zusammenfassen lassen, Gemini hat drei Sätze verfasst. Auf meine Beschwerde, es wären ja nur drei Sätze, hat Gemini acht Sätze daraus gemacht. Ich hab dann gefragt ob Gemini nicht richtig zählen kann, hat Gemini sich entschuldigt und die korrekte Zusammenfassung in fünf Sätzen nachgelegt. Mit so nem Scheiß fange ich nichts an, echt ey…
Wow und das funktioniert sogar auch auf älteren iPhones
Online, ja. Oder in einer speziellen App, ja. Sonst wird es schon komplizierter…
Auch Apple scheint ja nicht alles offline zu lösen, ansonsten hätte man keine Angst vor der EU Gesetzgebung.
„Google betont, dass Sicherheit und Ethik bei der Entwicklung von Gemini 2.0 im Vordergrund standen. So wurden Maßnahmen zur Datensicherheit, zur Verhinderung eines missbräuchlichen Einsatzes und zur zuverlässigen Informationsverarbeitung implementiert.“
Kann das bei Google, der Datenkrake, überhaupt nicht glauben. Bin gespannt was die ersten analytischen Auswertungen herausfinden.
Mal schauen ob Gemini 2.0 einen großes Sprung geschafft hat, da Gemini (1.0) bisher imho weit abgeschlagen gewesen ist.
Im Moment meiner Meinung nach leider noch völlig unbrauchbar im Vergleich zu ChatGPT. Einfache Fragen oder Google Suche bringen keine vernünftigen Antworten. Fakten sind meist ein Fremdwort für die KI.
Ich warte immer noch darauf, dass sich ein KI Anbieter mal traut sein System „Skynet“ zu nennen. :))))
Aus Marketing-Sicht nicht so sinnvoll, es geht ja letztlich unter ;)
Nicht wenn man sich alle Filme vorher nochmal genau anschaut. ;)
Wow, dieses Gemini ist wirklich fantastisch. Ich habe mal ein paar Tests gemacht und fand die Ergebnisse wirklich beeindruckend. Die deutschen stimmen, mag ich auch sehr. Viel angenehmer als in diesem offiziellen Werbevideo.
Leider ist es immer noch umbrauchbar.
Ich benutze ChatGPT als Übersetzer, Geminin versagt komplett.