1000+ Fünf-Sterne-Bewertungen und Top-Auszeichnungen machen uns zu einer der gefragtesten Lernplattformen.

maschke academy blog

Wissen. Technik. Kreativität.

Der offizielle Blog der Maschke Akademie: Updates, Tutorials und Insights aus der Welt der digitalen Bildbearbeitung, KI und visuellen Medien.

← Zurück zur Übersicht

Künstliche Intelligenz 26.09.2025

Google Gemini Live API: Neue Funktionen für bessere Sprachassistenten

Die Google Gemini Live API bietet seit Sommer 2025 deutliche Verbesserungen speziell für Sprachassistenten und multimodale Anwendungen.

Multimodalität & Echtzeitinteraktion

Die API unterstützt nun parallele Audio-, Video- und Texteingaben und ermöglicht fließende, latenzarme Dialogführung – auch in komplexen Situationen und verschiedenen Medienformaten. So können Sprachassistenten nicht nur hören, sondern auch sehen und in Echtzeit reagieren, z.B. auf Live-Kamerafeeds.

Verbesserte Sprachausgabe & Personalisierung

Die neueste Version (Gemini 2.5) erlaubt eine native, besonders ausdrucksstarke Audioausgabe: Anwender können Tonfall, Akzent und Sprechstil individuell steuern. Geschichten können etwa dramatisch, flüsternd oder mehrsprachig vorgelesen werden – aktuell in über 24 Sprachen.

Emotionserkennung und Dialogkompetenz

Gemini erkennt Emotionen an der Nutzerstimme (Affective Dialogue) und passt die Antwort dynamisch an. Außerdem kann das System Hintergrundgeräusche erkennen und “weiß”, wann es zum Beispiel bei Gruppengesprächen sinnvoll reagieren soll (Proactive Audio).

Kontextspeicher und Funktionsaufrufe

Die Live API führt einen Sitzungs-Speicher ein: Alle Interaktionen einer Session werden im Kontext gehalten, sodass persönliche Präferenzen und Gesprächsdynamik in Echtzeit berücksichtigt werden können. Sprachassistenten können zudem externe Dienste ansteuern, Websuche auslösen oder Code ausführen.

Tools für Entwickler und Integration

Die API basiert auf WebSockets, unterstützt Python-Integration und bietet Vorschaufunktionen für verschiedene Gemini-Modelle. Sie ist Server-zu-Server ausgerichtet, empfiehlt für mobile und Web-Apps jedoch Kooperationslösungen mit Partnern wie Daily.