OpenAI o1 a GPT-4o. Czym się różnią?

Monika Blandyna Lewkowicz 13.09.2024 12:18

Przetestowaliśmy OpenAI o1 pod względem kreatywnego generowania tekstu na podstawie wprowadzonych przez nas danych.
Autor. OpenAi

OpenAI przedstawiło nowy chatbot: o1. Jest dostępny w wersji „preview” i „mini”, za opłatą, a także w wersji API. Według zapowiedzi, nowe modele mają poświęcać więcej czasu na „myślenie”, ale też lepiej rozwiązywać trudniejsze zadania.

Jak czytamy w komunikacie OpenAI, modele z serii o1 potrafią rozwiązywać złożone zadania w dziedzinie nauk ścisłych, programowania i matematyki, lepiej niż starsze wersje.

„OpenAI o1 plasuje się na 89. percentylu w pytaniach dotyczących programowania konkurencyjnego (Codeforces), plasuje się wśród 500 najlepszych studentów w Stanach Zjednoczonych w kwalifikacjach do USA Math Olympiad (AIME) i przewyższa ludzką dokładność na poziomie doktoratu w testach fizyki, biologii i chemii (GPQA)” - twierdzi firma.

Czytaj też

ChatGPT uzyskał dostęp do tekstów sprzed 100 lat

Reklama

Z czym dobrze radzi sobie OpenAI o1?

Model o1 nadal jest trenowany pod kątem wnioskowania logicznego. Przetestował go naukowiec i ekspert sztucznej inteligencji Paweł Szczęsny. Wynikami podzielił się w serwisie LinkedIn.

„Nowy model OpenAI (o1) jest dla wąskiego grona ekspertów - prawników, programistów, naukowców, itd.” – komentuje. Z czym sobie dobrze radzi?

„o1 odpowiedział poprawnie na wszystkie pytania, które projektowałem dla OpenAI w obszarze biologii molekularnej i strukturalnej a z którymi sobie nie radził GPT-4o. Radzi sobie również fantastycznie z analizą publikacji naukowych” – pisze ekspert.

Czytaj też

Nowe narzędzie może utrudnić plagiaty. Dlaczego OpenAI nie chce go wypuścić?

Reklama

Kreatywne zadania

Według Szczęsnego, nowy model w wielu zastosowaniach nie różni się od GPT-4, a w zadaniach kreatywnych wydaje gorszy.

Redakcja CyberDefence24.pl także przetestowała OpenAI o1 pod względem kreatywnego generowania tekstu na podstawie wprowadzonych przez nas danych.. Wygenerowany tekst wydawał się nieco lepszy niż w modelu GPT-4o. Jednak, gdy wpisaliśmy kolejny prompt z informacją, co należy poprawić chatbot się zaciął.

Zauważyliśmy też, że rzeczywiście proces „myślenia” jest dłuższy, można też go prześledzić. Chatbot przed wygenerowaniem tekstu prowadzi analizy, takie jak „rozumienie kontekstu”, „rozważanie różnych perspektyw”, czy „rozważanie scenariuszy”. Widać również, że OpenAI o1 wyciąga wnioski „dla siebie” z wrzuconego przez nas tekstu, np. w kwestii reklam w LLM-ie.

Poniżej przedstawiamy screeny z „procesu myślowego” chatbota.

OpenAI o1 - analiza — Test OpenAI o1 redakcji CyberDefence24.pl
Autor. Redakcja CyberDefence24.pl

OpenAI o1 - dłuższe myślenie — Test OpenAI o1 redakcji CyberDefence24.pl
Autor. Redakcja CyberDefence24.pl

OpenAI o1 - w czym jest lepszy — Test OpenAI o1 redakcji CyberDefence24.pl
Autor. Redakcja CyberDefence24.pl

Czytaj też

ChatGPT będzie generował treści pornograficzne? OpenAI to rozważa

Reklama

CyberDefence24.pl - Digital EU Ambassador

Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na: [email protected].

Reklama