Worum geht’s?
OpenAI hat eine neue Version seines KI-Modells veröffentlicht: GPT-5.4 bringt die Fähigkeit mit, Computer eigenständig zu bedienen. Das System kann Maus und Tastatur steuern, Programme öffnen und komplexe Aufgaben ausführen. Dabei nutzt es Screenshots als visuelle Eingabe, um den Bildschirminhalt zu verstehen und entsprechend zu reagieren. Die neue Funktionalität zielt besonders auf die Automatisierung von Büroarbeiten und Programmieraufgaben ab.
Das Update vereint verschiedene KI-Fähigkeiten in einem einzigen Modell. Reasoning, Coding und die neu hinzugekommene Computersteuerung sind jetzt integriert verfügbar. Nutzer müssen nicht mehr zwischen verschiedenen spezialisierten Modellen wechseln. Zusätzlich führt OpenAI eine sogenannte Thinking-Funktion ein, die den Denkprozess der KI vorab sichtbar macht und Eingriffe vor der finalen Ausgabe ermöglicht.
Hintergrund & Einordnung
In Benchmark-Tests zeigt GPT-5.4 deutliche Fortschritte gegenüber seinen Vorgängern. Im OSWorld-Verified-Benchmark erreicht das Modell eine Erfolgsrate von 75 Prozent bei der Bewältigung komplexer Desktop-Aufgaben. Damit übertrifft es sogar die durchschnittliche menschliche Leistung, die bei diesem Test bei 72,4 Prozent liegt. Die Verbesserung demonstriert einen signifikanten Sprung in der Fähigkeit von KI-Systemen, eigenständig mit Computeroberflächen zu interagieren.
Die Kontextverarbeitung wurde massiv erweitert: Das Modell kann bis zu eine Million Tokens gleichzeitig verarbeiten. Dies ermöglicht die Analyse und Bearbeitung umfangreicher Dokumente, großer Codebasen oder kompletter Projektstrukturen in einem Durchgang. Gleichzeitig wurde die Effizienz verbessert – das System benötigt weniger Tokens zur Problemlösung, was sich positiv auf Geschwindigkeit und Kosten auswirkt.
OpenAI bietet neben der Standard-Version auch eine Pro-Variante für Nutzer mit besonders anspruchsvollen Anforderungen an. Die neue Computersteuerung reiht sich in eine Entwicklung ein, die KI-Systeme zunehmend als autonome Agenten positioniert, die nicht nur Informationen liefern, sondern aktiv Aufgaben übernehmen können.
Was bedeutet das?
- Automatisierung erreicht neue Ebene: Die direkte Computersteuerung durch KI könnte repetitive Büroaufgaben, Dateneingaben und administrative Tätigkeiten grundlegend verändern. Unternehmen erhalten neue Möglichkeiten zur Prozessoptimierung.
- Integration statt Spezialisierung: Durch die Zusammenführung verschiedener KI-Funktionen in einem Modell vereinfacht sich die Nutzung erheblich. Anwender können komplexe Workflows durchführen, ohne zwischen Tools wechseln zu müssen.
- Transparenz durch Thinking-Funktion: Die Sichtbarkeit des KI-Denkprozesses schafft mehr Kontrolle und Vertrauen. Nutzer können Fehler frühzeitig erkennen und korrigieren, bevor Aktionen ausgeführt werden.
- Effizienzgewinne: Der reduzierte Token-Verbrauch bei gleichzeitig verbesserter Leistung macht den Einsatz wirtschaftlicher und schneller – ein wichtiger Faktor für den produktiven Einsatz.
- Neue Sicherheitsfragen: Die Fähigkeit zur autonomen Computersteuerung wirft auch Fragen nach Sicherheit, Datenschutz und Kontrollmechanismen auf, die bei der Implementierung zu berücksichtigen sind.
Quellen
GPT-5.4 ist da: ChatGPT kann jetzt Ihren Computer steuern (CHIP)
Introducing GPT-5.4 (OpenAI)
GPT-5.4: OpenAI vereint Reasoning und Coding mit Computer-Steuerung (Heise)
GPT-5.4: KI-Modell verbessert ChatGPT (t3n)
Neues Spitzenmodell für ChatGPT: OpenAI verbessert GPT-5.4 bei autonomer Computersteuerung (ComputerBase)
Dieser Artikel wurde mit KI erstellt und basiert auf den angegebenen Quellen sowie den Trainingsdaten des Sprachmodells.
