Premiera GPT-5: Turbulencje i Innowacje

5 days ago

Premiera ChatGPT 5 Turbulencje i Innowacje.png

Premiera ChatGPT-5 miała miejsce 7 sierpnia 2025 roku. W tym dniu odbyła się oficjalna prezentacja najnowszego modelu językowego GPT-5, który jest podstawą ChatGPT-5. Model ten łączy w sobie różne technologie OpenAI , oferując m.in. zaawansowane zdolności matematyczne i rozumowanie. ChatGPT-5 jest udostępniany niemal wszystkim użytkownikom niemal od razu, w tym bezpłatnym, a wersja dla użytkowników Enterprise została zaplanowana na 14 sierpnia 2025 roku.

Premiera była istotnym krokiem w rozwoju konwersacyjnej AI, a OpenAI określiło ChatGPT-5 jako „najmądrzejszy, najszybszy i najbardziej użyteczny model” w swojej historii ( ͡° ͜ʖ ͡°)

GPT-5 Startuje z Turbulencjami

OpenAI uruchomiło GPT-5, długo wyczekiwanego następcę swojej przełomowej serii dużych modeli językowych, ale usterki wdrożeniowe pozostawiły wielu wczesnych użytkowników rozczarowanych i sfrustrowanych.

Co nowego: Zamiast rodziny modeli, GPT-5 to rodzina systemów — GPT-5, GPT-5 Mini, GPT-5 Nano i GPT-5 Pro — które obejmują modele bezrozumne i o zmiennym stopniu rozumowania, wraz z routerem, który automatycznie przełącza się między nimi w zależności od danych wejściowych. OpenAI uczyniło GPT-5 jedyną opcją w interfejsie użytkownika ChatGPT bez wcześniejszego powiadomienia, ale router zawiódł od razu, co spowodowało, że firma przywróciła płatnym użytkownikom dostęp do wcześniejszych modeli ChatGPT.

https://twitter.com/sama/status/1953893841381273969

Kluczowe cechy i specyfikacje:

Wejście/wyjście: Tekst i obrazy jako dane wejściowe (do 272 000 tokenów), tekst jako dane wyjściowe (do 128 000 tokenów, w tym rozumowanie i odpowiedź, 122 tokeny na sekundę, 72 sekundy do pierwszego tokenu)

https://artificialanalysis.ai/models/gpt-5/providers

Wydajność: GPT-5 Przewyższa poprzednie modele OpenAI w większości zgłaszanych testów porównawczych; przewyższa konkurencyjne modele w niektórych testach matematyki, kodowania i zdolności multimodalnych, a także wiedzy medycznej; zmniejszone halucynacje

https://openai.com/index/introducing-gpt-5-for-developers/

Funkcje: Opcje dla deweloperów obejmują cztery poziomy rozumowania, trzy poziomy szczegółowości (długość wyjścia), wywoływanie narzędzi za pomocą JSON lub języka naturalnego, wybieralne modele bezrozumne i rozumujące, podsumowania tokenów rozumowania

https://cookbook.openai.com/examples/gpt-5/gpt-5_new_params_and_tools

Dostępność i architektura:

Dostępność/cena:
- Poprzez API: GPT-5 kosztuje 1,25 USD / 0,13 USD / 10 USD za milion tokenów wejściowych/buforowanych/wyjściowych
- GPT-5 Mini kosztuje 0,25 USD / 0,025 USD / 2 USD za milion tokenów wejściowych/buforowanych/wyjściowych
- GPT-5 Nano kosztuje 0,05 USD / 0,005 USD / 0,40 USD za milion tokenów wejściowych/buforowanych/wyjściowych
- Poprzez ChatGPT: Bezpłatny, ograniczony dostęp
- Poprzez ChatGPT Pro: 200 USD/miesiąc za nieograniczony dostęp do GPT-5 i GPT-5 Pro
Odcięcie wiedzy: 30 września 2024 (GPT-5), 30 maja 2024 (GPT-5 Mini, GPT-5 Nano)
Nieujawnione: Architektura modelu, routera i systemu; metody i dane szkoleniowe

Jak to działa?

Niestety OpenAI ujawniło niewiele szczegółów na temat architektury i szkolenia GPT-5, z wyjątkiem dostrajania "bezpiecznych uzupełnień" w celu zrównoważenia bezpieczeństwa i użyteczności, co jest udokumentowane w pracy "From Hard Refusals to Safe-Completions: Toward Output-Centric Safety Training"

Router wybiera między modelami bezrozumnymi a rozumującymi na podstawie "typu" i "złożoności" danych wejściowych, wymagań narzędziowych oraz jawnej intencji użytkownika (np. podpowiedzi "pomyśl intensywnie"). Router uczy się na podstawie zachowań użytkowników. Gdy użytkownicy ChatGPT osiągną limity użycia, router kieruje zapytania do mini wersji każdego modelu.
Zespół szkolił modele na treściach internetowych, licencjonowanych danych oraz danych wejściowych generowanych przez ludzi i modele. Dostosowywano je do rozumowania poprzez uczenie wzmacniające.
Ponadto dostrajano modele tak, aby preferowały pomocne, ale "bezpieczne" odpowiedzi zamiast odmowy odpowiedzi, co zespół nazywa bezpiecznymi uzupełnieniami. W przypadku potencjalnie problematycznych danych wejściowych model dąży do użytecznej odpowiedzi, pozostając w granicach wytycznych bezpieczeństwa, wyjaśnia, kiedy musi odmówić, i sugeruje powiązane wyniki, które nie dotyczą tematów, których został przeszkolony, aby unikać.

Wyniki wydajności:

GPT-5 znalazł się na szczycie niektórych testów porównawczych według ocen OpenAI. Jednakże nie dorównał konkurencyjnym modelom w niektórych miarach rozumowania abstrakcyjnego w niezależnych testach.

Na SWE-bench (zadania z inżynierii oprogramowania), GPT-5 (74,9 procent dokładności) przewyższył Claude Opus 4.1 (74,5 procent dokładności)
Na AIME 2025 (konkursowe problemy matematyczne), GPT-5 ustawiony na wysokie rozumowanie bez narzędzi (94,6 procent dokładności) przewyższył o3 ustawiony na wysokie rozumowanie (88,9 procent).
W teście EQ-Bench Creative Writing v3 (tabela wyników tutaj), GPT-5 z nieokreślonym poziomem rozumowania (90,30) przewyższył o3 (87,65), Gemini-2.5-pro (86,00) i Claude Opus 4 (83,75)
Na Artificial Analysis’s Intelligence Index, średniej ważonej z 10 testów porównawczych, GPT-5 ustawiony na wysokie lub średnie rozumowanie przekroczył wszystkie inne testowane modele, a za nim xAI Grok 4 i OpenAI o3. Jednakże gorzej wypadł w testach rozumowania abstrakcyjnego bez użycia narzędzi. Na przykład, na ARC-AGI-1 i ARC-AGI-2 (zagadki wizualne), GPT-5 z wysokim rozumowaniem (odpowiednio 65,7 procent i 9,9 procent) ustępował Grok 4 Thinking (odpowiednio 66,7 procent i 16 procent)

Co się dzieje za kulisami?

Uruchomiony w marcu 2023 roku, GPT-4 podniósł poprzeczkę dla wydajności wizualno-językowej, a oczekiwanie na następną wersję rosło stabilnie przez dwa lata. W grudniu 2024 roku The Wall Street Journal poinformował, że GPT-5 został opóźniony, ponieważ skala projektu przekroczyła limity obliczeniowe OpenAI. W poście z połowy lutego 2025 roku na platformie X CEO OpenAI Sam Altman zaproponował GPT-4.5 jako tymczasowe rozwiązanie i przedstawił oczekiwane ulepszenia w GPT-5. Ale w kwietniu powiedział, że GPT-5 zostanie opóźniony dalej i uruchomił o3 i o4-mini, których wydajność ponownie znalazła się na szczycie rankingów. Debiut GPT-5 7 sierpnia zakończył długie oczekiwanie, ale mylące wykresy jego wydajności, limity szybkości i wadliwy przełącznik zepsuły wydarzenie, podczas gdy nieoczekiwane wycofanie wcześniejszych modeli w ChatGPT sparaliżowało wielu użytkowników.

https://x.com/sama/status/1889755723078443244

Znaczenie i przyszłe perspektyw

Modele OpenAI konsekwentnie zajmują czołowe miejsca w rankingach językowych. Dzięki GPT-5 firma uruchomiła architekturę systemową, która integruje jej najlepsze modele i wykorzystuje mocne strony każdego z nich: szybkie generowanie wyników, wolniejsze generowanie wyników z regulowaną mocą obliczeniową przeznaczoną do wnioskowania oraz płynne przejście do mniejszych wersji.

Rozważanie na koniec.
Początkujący użytkownicy mogą uznać, że zdolność routera GPT-5 do wyboru modelu dla dowolnych danych wejściowych upraszcza sprawy, ale pozostaje do zobaczenia, czy doświadczeni użytkownicy, którzy mogą lepiej wybierać odpowiedni model do swoich zadań, będą zadowoleni z rezygnacji z tej kontroli.

A Ty co wolisz? Pełną kontrolę nad wyborem modelu,
czy uważasz, że inteligentny router GPT-5 zrobi to lepiej za Ciebie?

polish ai proofofbrain technology chatgpt

0.000

0 comments