ist ein neues, besonders schnelles und gĂźnstiges Modell aus der Geminiâ3âFamilie, das vor allem fĂźr groĂe Mengen einfacher Anfragen gedacht ist.
Positionierung und Kosten
Ausgelegt auf hohe Anfragevolumen mit sehr niedriger Latenz, z.B. fĂźr AgentenâBackends, Ăbersetzung, Klassifikation, Routing oder schlanke ChatâAssistenten.
Die Preisstruktur liegt deutlich unter den groĂen GeminiâVarianten und ist so kalkuliert, dass auch Masseneinsätze mit vielen Millionen Tokens wirtschaftlich bleiben.
Fähigkeiten und Technik
Verarbeitet Texte, Code und verschiedene Medien (z.B. Bilder oder Dokumente) als Eingabe, liefert aber in erster Linie TextâAntworten zurĂźck.
UnterstĂźtzt typische EntwicklerâFeatures wie Funktionsaufrufe, strukturierte Ausgaben und effiziente Verarbeitung langer Kontexte, um Workflows zuverlässig zu automatisieren.
Performance
Im Vergleich zu frĂźheren âFlashââVarianten legt FlashâLite bei Genauigkeit und Robustheit sichtbar zu und nähert sich in einigen Benchmarks grĂśĂeren Modellen an.
Gleichzeitig ist die Antwortzeit sehr kurz und die TokenâAusgabe hoch, sodass sich das Modell gut fĂźr interaktive Anwendungen, WebâUIs und SaaSâDienste mit vielen parallelen Nutzern eignet.
Hier findest du weiterfĂźhrende Informationen: Google Blog