Firma OpenAI zaprezentowała model GPT-5.4 w kilku wariantach, w tym Thinking oraz Pro, o czym informują The Economic Times, TechCrunch i Ars Technica, pisze Bytow24.
Bezpośrednie sterowanie komputerem
Jedną z kluczowych nowości jest możliwość bezpośredniego sterowania komputerem. Model analizuje cykliczne zrzuty ekranu i potrafi:
- wprowadzać dane przy użyciu klawiatury
- wykonywać operacje myszą
- poruszać się po interfejsie aplikacji
To pierwsza wersja zaprojektowana specjalnie do realizacji zadań wymagających realnej interakcji z systemem operacyjnym. Funkcjonalność została potwierdzona w testach OSWorld-Verified oraz WebArena Verified.
Wersja Thinking i większa kontrola nad rozumowaniem
Wariant Thinking pozwala użytkownikom śledzić tok rozumowania modelu w czasie rzeczywistym. W interfejsie ChatGPT można obserwować kolejne etapy analizy oraz korygować kierunek odpowiedzi.
Takie podejście ułatwia:
- długie projekty badawcze
- złożone analizy prawne i finansowe
- wieloetapowe zadania wymagające utrzymania kontekstu
Dodatkowo wprowadzono nowy system oceny bezpieczeństwa, który ogranicza ryzyko ukrywania lub zniekształcania logiki działania.
Mniej błędów i większa precyzja
Według danych firmy liczba błędów faktograficznych została zmniejszona o 18 procent w porównaniu z wersją 5.2, a liczba nieprawdziwych twierdzeń dotyczących konkretnych faktów spadła o 33 procent.
W teście APEX-Agents, sprawdzającym kompetencje w obszarze prawa i finansów, model zajął pierwsze miejsce. Wskazano, że generuje modele finansowe i analizy szybciej oraz przy niższych kosztach operacyjnych.
Większe okno kontekstu i analiza obrazu
Nowa architektura oferuje okno kontekstu API do 1 miliona tokenów. Oznacza to możliwość przetwarzania znacznie większych zbiorów danych jednocześnie.
Model obsługuje analizę obrazów o rozdzielczości do 10,24 miliona pikseli, przy maksymalnym boku grafiki sięgającym 6000 pikseli. Pozwala to na dokładniejsze badanie dokumentów, wykresów i interfejsów.
Nowości dla programistów
Wprowadzono system Tool Search. Wcześniej integracja narzędzi przez API wymagała ręcznego definiowania funkcji, co zwiększało zużycie tokenów.
Teraz model:
- samodzielnie wyszukuje potrzebne definicje
- aktywuje narzędzia tylko wtedy, gdy są konieczne
- optymalizuje koszty operacyjne przy pracy z wieloma funkcjami
Kontekst rynkowy i dostępność
Premiera GPT-5.4 nastąpiła w okresie rosnącej konkurencji ze strony Anthropic oraz Google. Model jest już dostępny w:
- ChatGPT Plus, Team i Pro w wersji Thinking
- wersji Pro dla edukacji i klientów korporacyjnych
- API oraz platformie Codex
- aplikacjach mobilnych
Przypomnij, że wcześniej pisaliśmy o marcowych premierach Apple i zmianach w ofercie produktowej w 2026 roku.