OpenAI Wydaje Nowy Model AI „Reasoning”, o1
OpenAI ogłosiło dziś swoją najnowszą sztuczną inteligencję, o1, pierwszą z nowej rodziny „modeli rozumowania„, zaprojektowanych do szybszego i dokładniejszego rozwiązywania złożonych problemów niż poprzednie modele.
Obok o1, firma wprowadza również mniejszą i bardziej przystępną cenowo wersję oznaczoną jako o1-mini. Ta premiera jest opisywana jako „podgląd”, co sygnalizuje, że technologia jest wciąż na wczesnym etapie rozwoju.
o1, wcześniej znane pod kodową nazwą „Strawberry”, to pierwszy z serii modeli „rozumujących”, które OpenAI planuje wypuścić na rynek, jak zauważył TechCrunch.
Jerry Tworek, kierownik badań w OpenAI, powiedział The Verge, że trening stojący za o1 znacznie różni się od poprzednich modeli, choć firma nie była do końca jasna co do szczegółów.
W przeciwieństwie do swoich poprzedników, które były zaprojektowane do naśladowania wzorców z danych treningowych, o1 korzysta z uczenia ze wzmocnieniem, metody która uczy system rozwiązywać problemy poprzez nagrody i kary.
Jedną z najbardziej uderzających cech o1 jest jego zdolność do rozwiązywania problemów wieloetapowych i pisania kodu z wyższym stopniem dokładności w porównaniu do wcześniejszych modeli.
Na przykład, w kwalifikacyjnym egzaminie do Międzynarodowej Olimpiady Matematycznej, o1 przewyższył poprzedni model GPT-4o od OpenAI, rozwiązując 83% problemów w porównaniu do 13% problemów rozwiązanych przez GPT-4o.
Ten skok wydajności przypisywany jest nowemu procesowi szkolenia o1, który uwzględnia to, co OpenAI nazywa mechanizmem „łańcucha myśli”, pozwalającym modelowi na rozbijanie i rozwiązywanie problemów krok po kroku.
Tworek zauważa, że chociaż model zmniejszył swoją skłonność do „halucynacji”, czyli dostarczania nieprecyzyjnych informacji, problem ten nie został całkowicie rozwiązany, jak donosi The Verge.
Oprócz swoich matematycznych zdolności, o1 znalazło się w 89. percentylu w konkursach programowania, pokazując swój potencjał jako narzędzie zarówno dla deweloperów, jak i badaczy.
Według The Verge, to, co rzucało się w oczy, to jak celowo o1 wydawało się naśladować ludzkie myślenie. Zwroty takie jak „Jestem ciekawa”, „Myślę” i „Zobaczmy” dawały złudzenie procesu myślowego, chociaż model tak naprawdę nie myśli. Więc dlaczego sprawiać, że tak jest?
The Verge informuje, że Tworek tłumaczy, iż to interfejs ma na celu pokazanie, jak model poświęca więcej czasu na przetwarzanie i badanie problemów w większej głębi.
Pomimo tych postępów, OpenAI przyznaje, że o1 nadal ma swoje ograniczenia. Chociaż doskonale radzi sobie z rozwiązywaniem skomplikowanych problemów, jest mniej sprawny w obsłudze faktów na temat świata. Ponadto, brakuje mu niektórych funkcji, które czynią GPT-4o niezwykle wszechstronnym, takich jak możliwość przeglądania internetu czy przetwarzania plików i obrazów.
Ponadto, nowe możliwości modelu o1 wiążą się z kosztami. Jest on znacznie droższy w użyciu niż GPT-4o. Na API OpenAI, koszt używania o1-preview wynosi 15 dolarów za 1 milion tokenów wejściowych i 60 dolarów za 1 milion tokenów wyjściowych, co jest trzy do czterokrotnie wyższe od kosztu GPT-4o.
Chociaż technologia wciąż jest na wczesnym etapie rozwoju, wydanie modelu o1 podkreśla trwające postępy w zdolnościach AI do radzenia sobie ze skomplikowanymi zadaniami, oferując potencjalne korzyści w różnych dziedzinach, które wymagają zaawansowanych zdolności rozwiązywania problemów.
Zostaw komentarz
Anuluj odpowiedź