OpenAI
hat mit GPT-OSS erstmals seit Jahren wieder Modelle mit âoffenen Gewichtenâ verĂśffentlicht, konkret die beiden Sprachmodelle gpt-oss-120b und gpt-oss-20b. Beide Modelle sind darauf ausgelegt, logische Aufgaben (âReasoningâ), schrittweises Denken (Chain-of-Thought) sowie Funktionen wie Websuche und CodeausfĂźhrung zu unterstĂźtzen.
Wichtige Eckpunkte:
- Zwei Modelle: gpt-oss-120b mit 117 Milliarden Parametern und gpt-oss-20b mit 21 Milliarden Parametern. Das kleinere Modell läuft auf Laptops mit 16 GB RAM, das groĂe benĂśtigt eine GPU mit 80 GB Speicher.
- Mixture-of-Experts-Architektur (MoE): Nur ein Teil der Parameter wird pro Anfrage genutzt, was Rechenressourcen spart und Anpassungen ermĂśglicht.
- Apache-2.0-Lizenz: Die Modelle dĂźrfen frei genutzt, angepasst und kommerziell eingesetzt werden.
- Fokus auf Reasoning: Beide Modelle sind speziell fßr komplexe Schlussfolgerungen und Analyseaufgaben trainiert; sie unterstßtzen strukturierte, erklärbare Ausgaben.
- Open-Weight, nicht Open-Source: OpenAI hat nur die Gewichte, aber weder den Trainingscode noch die Trainingsdaten verĂśffentlicht. Das bedeutet mehr Offenheit fĂźr Entwickler, aber nicht vollständige Transparenz wie z.âŻB. bei einigen Konkurrenzmodellen.
- Sicherheitsprotokoll: Ein neues âWorst-Case Fine-Tuningâ-Verfahren wurde implementiert, um Missbrauch besser vorzubeugen. Gleichwohl weist OpenAI auf ein hĂśheres Missbrauchsrisiko verglichen mit abgeschotteten Modellen hin.
- Bereitstellung: Die Modelle sind ßber Plattformen wie HuggingFace, AWS und Azure download- und einsatzfähig.
- Kritikpunkte: In der Community wird kritisiert, dass OpenAI zu wenig Transparenz Ăźber Trainingsdaten und Methoden bietet. Erste Praxis-Tests zeigen, dass besonders das kleinere Modell sprachliche Schwächen und faktische Fehler aufweist (z.âŻB. bei Deutsch).
Im Ergebnis markiert GPT-OSS einen Schritt in Richtung mehr Offenheit und Anpassbarkeit, bleibt jedoch hinter echten Open-Source-Projekten bezĂźglich Transparenz zurĂźck. FĂźr professionelle Anwender â etwa im Fotografie- oder Reiseumfeld â kĂśnnte das kleinere Modell eine Option fĂźr lokale Analyseaufgaben darstellen, sofern der Funktionsumfang ausreicht.
Hier findest du weiterfĂźhrende Informationen: Heise.de