ChatGPT 5.4. Zdjęcie - OpenAI

Jakie nowe możliwości ma nowa wersja ChatGPT 5.4 i co zmienia w pracy z AI

OpenAI wprowadziło GPT-5.4 z funkcją sterowania komputerem, większym oknem kontekstu i zmniejszoną liczbą błędów faktograficznych.

Firma OpenAI zaprezentowała model GPT-5.4 w kilku wariantach, w tym Thinking oraz Pro, o czym informują The Economic Times, TechCrunch i Ars Technica, pisze Bytow24.

Bezpośrednie sterowanie komputerem

Jedną z kluczowych nowości jest możliwość bezpośredniego sterowania komputerem. Model analizuje cykliczne zrzuty ekranu i potrafi:

  • wprowadzać dane przy użyciu klawiatury
  • wykonywać operacje myszą
  • poruszać się po interfejsie aplikacji

To pierwsza wersja zaprojektowana specjalnie do realizacji zadań wymagających realnej interakcji z systemem operacyjnym. Funkcjonalność została potwierdzona w testach OSWorld-Verified oraz WebArena Verified.

Wersja Thinking i większa kontrola nad rozumowaniem

Wariant Thinking pozwala użytkownikom śledzić tok rozumowania modelu w czasie rzeczywistym. W interfejsie ChatGPT można obserwować kolejne etapy analizy oraz korygować kierunek odpowiedzi.

Takie podejście ułatwia:

  • długie projekty badawcze
  • złożone analizy prawne i finansowe
  • wieloetapowe zadania wymagające utrzymania kontekstu

Dodatkowo wprowadzono nowy system oceny bezpieczeństwa, który ogranicza ryzyko ukrywania lub zniekształcania logiki działania.

Mniej błędów i większa precyzja

Według danych firmy liczba błędów faktograficznych została zmniejszona o 18 procent w porównaniu z wersją 5.2, a liczba nieprawdziwych twierdzeń dotyczących konkretnych faktów spadła o 33 procent.

W teście APEX-Agents, sprawdzającym kompetencje w obszarze prawa i finansów, model zajął pierwsze miejsce. Wskazano, że generuje modele finansowe i analizy szybciej oraz przy niższych kosztach operacyjnych.

Większe okno kontekstu i analiza obrazu

Nowa architektura oferuje okno kontekstu API do 1 miliona tokenów. Oznacza to możliwość przetwarzania znacznie większych zbiorów danych jednocześnie.

Model obsługuje analizę obrazów o rozdzielczości do 10,24 miliona pikseli, przy maksymalnym boku grafiki sięgającym 6000 pikseli. Pozwala to na dokładniejsze badanie dokumentów, wykresów i interfejsów.

Nowości dla programistów

Wprowadzono system Tool Search. Wcześniej integracja narzędzi przez API wymagała ręcznego definiowania funkcji, co zwiększało zużycie tokenów.

Teraz model:

  • samodzielnie wyszukuje potrzebne definicje
  • aktywuje narzędzia tylko wtedy, gdy są konieczne
  • optymalizuje koszty operacyjne przy pracy z wieloma funkcjami

Kontekst rynkowy i dostępność

Premiera GPT-5.4 nastąpiła w okresie rosnącej konkurencji ze strony Anthropic oraz Google. Model jest już dostępny w:

  • ChatGPT Plus, Team i Pro w wersji Thinking
  • wersji Pro dla edukacji i klientów korporacyjnych
  • API oraz platformie Codex
  • aplikacjach mobilnych

Przypomnij, że wcześniej pisaliśmy o marcowych premierach Apple i zmianach w ofercie produktowej w 2026 roku.

Udostępnij