ElevenLabs Scribe v2: Neues Modell zur Transkription steht zur VerfĂźgung
ElevenLabs
hat mit Scribe v2 ein neues Transkriptionsmodell verĂśffentlicht, das auf hohe Genauigkeit, Mehrsprachigkeit und groĂe Audio-Mengen ausgelegt ist.
Kernverbesserungen von Scribe v2
HĂśhere Genauigkeit als Scribe v1 und laut Benchmarks aktuell eines der genauesten Modelle am Markt, inklusive robusterer Ergebnisse bei langen Audios, Pausen und mehreren Sprecher:innen.
UnterstĂźtzung fĂźr Ăźber 90 Sprachen mit automatischer Spracherkennung, auch in gemischtsprachigen Aufnahmen.
Einsatzfelder
Batch-Transkription, Untertitelung und Captioning im groĂen Stil, z.B. fĂźr Podcasts, YouTube, Schulungsvideos oder Archive.
Realtime-Variante âScribe v2 Realtimeâ fĂźr Live-Transkription mit Latenzen um ca. 150 ms, etwa fĂźr Agentenâ/CallâCenterâSzenarien oder Live-Untertitel.
Besondere Features
Keyterm Prompting: Bis zu 100 Fachbegriffe/Markennamen vorgeben, die das Modell im Kontext besonders zuverlässig erkennt.
Native Entitätserkennung mit Zeitstempeln (z.B. Personenâ, Gesundheitsâ oder Zahlungsdaten) plus SpeakerâDiarization, WortâZeitstempel und dynamisches Tagging von Geräuschen wie Lachen oder Schritten.
VerfĂźgbarkeit
Scribe v2 steht in ElevenLabs Studio (fĂźr Transkription/Untertitel im Browser) und Ăźber die SpeechâtoâTextâAPI fĂźr Entwickler und Unternehmen zur VerfĂźgung.
Hier findest du weiterfĂźhrende Informationen: Elevenlabs