18.04.2025

OpenAI o3 i o4-mini: Nowe modele z możliwością „myślenia obrazami” i dostępem do narzędzi

Zaledwie dwa dni po zapowiedzi modelu GPT-4.1, firma OpenAI ogłosiła publiczną dostępność dwóch nowych modeli sztucznej inteligencji: o3 i o4-mini. Ich wprowadzenie na rynek stanowi znaczący krok naprzód, szczególnie w zakresie rozumowania i interakcji wizualnej.

Według OpenAI, model o3 jest obecnie najbardziej zaawansowanym systemem rozumowania firmy, wykazującym „wysoką wydajność” w złożonych zadaniach związanych z kodowaniem, matematyką i naukami ścisłymi. Model o4-mini jest pozycjonowany jako bardziej przystępna cenowo alternatywa, która wciąż dostarcza „imponujące wyniki” w tych samych kluczowych obszarach. Najważniejszą nowością w obu modelach są możliwości, których nie było w poprzednich systemach OpenAI. Po raz pierwszy modele rozumowania firmy mogą wykorzystywać i łączyć wszystkie narzędzia dostępne w ChatGPT, w tym przeglądanie stron internetowych i generowanie obrazów, bezpośrednio w swoim procesie myślenia. OpenAI twierdzi, że ta integracja narzędzi pozwala o3 i o4-mini skuteczniej rozwiązywać trudne, wieloetapowe problemy i stawiać „realne kroki w kierunku niezależnego działania”.

Jednocześnie o3 i o4-mini zyskują zaawansowane możliwości przetwarzania wizualnego. Potrafią nie tylko „widzieć”, ale także interpretować obrazy i „myśleć” o nich. Użytkownicy mogą przesyłać diagramy, szkice czy obrazy tablic – nawet te słabej jakości – a nowe modele będą w stanie je zrozumieć i uwzględnić w swoim rozumowaniu, a nawet modyfikować obrazy w jego ramach.

OpenAI podkreśla, że „połączona moc najnowocześniejszego rozumowania z pełnym dostępem do narzędzi przekłada się na znacznie wyższą wydajność w akademickich testach porównawczych i zadaniach w świecie rzeczywistym, ustanawiając nowy standard zarówno w zakresie inteligencji, jak i użyteczności”. Osobno, OpenAI ogłosiło także wydanie nowego agenta kodowania o nazwie Codex CLI. Narzędzie to zostało zaprojektowane, aby umożliwić programistom łatwe łączenie modeli OpenAI z ich lokalnym kodem za pomocą minimalnego interfejsu. Codex CLI działa od razu z modelami o3 i o4-mini, a w przyszłości planowana jest obsługa GPT-4.1.

Dzisiejsze ogłoszenie jest zgodne ze niedawnymi sygnałami od dyrektora generalnego OpenAI, Sama Altmana, wskazującymi na zmianę wcześniejszych planów rozwoju. Altman, który w lutym szczegółowo opisywał mapę drogową, sugerował wtedy, że model o3 nie zostanie wydany jako samodzielny produkt. Na początku kwietnia ogłosił jednak „zmianę planów”, informując o przyspieszeniu prac nad wydaniem o3 i o4-mini. Na platformie X (dawniej Twitter) Altman wyjaśnił, że decyzja ta pozwoli „uczynić GPT-5 znacznie lepszym niż pierwotnie”, a także wynika z faktu, że „płynna integracja wszystkiego będzie trudniejsza niż myśleliśmy” oraz z potrzeby przygotowania mocy przerobowych na „bezprecedensowy popyt”.

Użytkownicy z subskrypcjami ChatGPT Plus, Pro i Team mogą zacząć korzystać z modeli o3 i o4-mini już od dziś. W ciągu najbliższych kilku tygodni OpenAI planuje wprowadzić model o3-pro – jeszcze potężniejszą wersję o3 – udostępniając ją subskrybentom Pro. Usprawnienia obiecywane wcześniej przez Altmana prawdopodobnie zostaną wprowadzone wraz z premierą GPT-5, która według niego ma nastąpić w ciągu najbliższych „kilku miesięcy”.

Piotr
18 kwietnia, 2025

POPRZEDNI

NASTĘPNY

[ popularne ]

Nadjeżdża Kia K4 – następca popularnego Ceeda

Sony zapowiada obiektyw Sony FE 100 mm F2.8 Macro GM OSS

CMF Headphone Pro: Modułowe Słuchawki Nauszne Hi-Res LDAC z Adaptacyjnym ANC i 100h Baterią

Rozpoczynają się testy pierwszego pojazdu z przełomowym Zintegrowanym Inteligentnym Systemem Baterii

Oakley Meta Vanguard: Przyszłość dzięki AI

Portal o nowych technologiach, sztucznej inteligencji (AI), lifestylu, motoryzacji, stylu, smartfonach, komputerach oraz wszystkim, co kształtuje naszą współczesną rzeczywistość.

NA SKRÓTY

Nowości Ai Tech Autoblog Lifestyle Testy

INFORMACJE

Nasza redakcja i Kontakt Polityka prywatnoci

NEWSLETER

ZAPISZ SIĘ I BĄDŹ Z NAMI NA BIEŻĄCO