
Zaledwie dwa dni po zapowiedzi modelu GPT-4.1, firma OpenAI ogłosiła publiczną dostępność dwóch nowych modeli sztucznej inteligencji: o3 i o4-mini. Ich wprowadzenie na rynek stanowi znaczący krok naprzód, szczególnie w zakresie rozumowania i interakcji wizualnej.
Według OpenAI, model o3 jest obecnie najbardziej zaawansowanym systemem rozumowania firmy, wykazującym „wysoką wydajność” w złożonych zadaniach związanych z kodowaniem, matematyką i naukami ścisłymi. Model o4-mini jest pozycjonowany jako bardziej przystępna cenowo alternatywa, która wciąż dostarcza „imponujące wyniki” w tych samych kluczowych obszarach. Najważniejszą nowością w obu modelach są możliwości, których nie było w poprzednich systemach OpenAI. Po raz pierwszy modele rozumowania firmy mogą wykorzystywać i łączyć wszystkie narzędzia dostępne w ChatGPT, w tym przeglądanie stron internetowych i generowanie obrazów, bezpośrednio w swoim procesie myślenia. OpenAI twierdzi, że ta integracja narzędzi pozwala o3 i o4-mini skuteczniej rozwiązywać trudne, wieloetapowe problemy i stawiać „realne kroki w kierunku niezależnego działania”.
Jednocześnie o3 i o4-mini zyskują zaawansowane możliwości przetwarzania wizualnego. Potrafią nie tylko „widzieć”, ale także interpretować obrazy i „myśleć” o nich. Użytkownicy mogą przesyłać diagramy, szkice czy obrazy tablic – nawet te słabej jakości – a nowe modele będą w stanie je zrozumieć i uwzględnić w swoim rozumowaniu, a nawet modyfikować obrazy w jego ramach.
OpenAI podkreśla, że „połączona moc najnowocześniejszego rozumowania z pełnym dostępem do narzędzi przekłada się na znacznie wyższą wydajność w akademickich testach porównawczych i zadaniach w świecie rzeczywistym, ustanawiając nowy standard zarówno w zakresie inteligencji, jak i użyteczności”. Osobno, OpenAI ogłosiło także wydanie nowego agenta kodowania o nazwie Codex CLI. Narzędzie to zostało zaprojektowane, aby umożliwić programistom łatwe łączenie modeli OpenAI z ich lokalnym kodem za pomocą minimalnego interfejsu. Codex CLI działa od razu z modelami o3 i o4-mini, a w przyszłości planowana jest obsługa GPT-4.1.
Dzisiejsze ogłoszenie jest zgodne ze niedawnymi sygnałami od dyrektora generalnego OpenAI, Sama Altmana, wskazującymi na zmianę wcześniejszych planów rozwoju. Altman, który w lutym szczegółowo opisywał mapę drogową, sugerował wtedy, że model o3 nie zostanie wydany jako samodzielny produkt. Na początku kwietnia ogłosił jednak „zmianę planów”, informując o przyspieszeniu prac nad wydaniem o3 i o4-mini. Na platformie X (dawniej Twitter) Altman wyjaśnił, że decyzja ta pozwoli „uczynić GPT-5 znacznie lepszym niż pierwotnie”, a także wynika z faktu, że „płynna integracja wszystkiego będzie trudniejsza niż myśleliśmy” oraz z potrzeby przygotowania mocy przerobowych na „bezprecedensowy popyt”.
Użytkownicy z subskrypcjami ChatGPT Plus, Pro i Team mogą zacząć korzystać z modeli o3 i o4-mini już od dziś. W ciągu najbliższych kilku tygodni OpenAI planuje wprowadzić model o3-pro – jeszcze potężniejszą wersję o3 – udostępniając ją subskrybentom Pro. Usprawnienia obiecywane wcześniej przez Altmana prawdopodobnie zostaną wprowadzone wraz z premierą GPT-5, która według niego ma nastąpić w ciągu najbliższych „kilku miesięcy”.