Technologie
OpenAI o1 a GPT-4o. Czym się różnią?
OpenAI przedstawiło nowy chatbot: o1. Jest dostępny w wersji „preview” i „mini”, za opłatą, a także w wersji API. Według zapowiedzi, nowe modele mają poświęcać więcej czasu na „myślenie”, ale też lepiej rozwiązywać trudniejsze zadania.
Jak czytamy w komunikacie OpenAI, modele z serii o1 potrafią rozwiązywać złożone zadania w dziedzinie nauk ścisłych, programowania i matematyki, lepiej niż starsze wersje.
„OpenAI o1 plasuje się na 89. percentylu w pytaniach dotyczących programowania konkurencyjnego (Codeforces), plasuje się wśród 500 najlepszych studentów w Stanach Zjednoczonych w kwalifikacjach do USA Math Olympiad (AIME) i przewyższa ludzką dokładność na poziomie doktoratu w testach fizyki, biologii i chemii (GPQA)” - twierdzi firma.
Czytaj też
Z czym dobrze radzi sobie OpenAI o1?
Model o1 nadal jest trenowany pod kątem wnioskowania logicznego. Przetestował go naukowiec i ekspert sztucznej inteligencji Paweł Szczęsny. Wynikami podzielił się w serwisie LinkedIn.
„Nowy model OpenAI (o1) jest dla wąskiego grona ekspertów - prawników, programistów, naukowców, itd.” – komentuje. Z czym sobie dobrze radzi?
„o1 odpowiedział poprawnie na wszystkie pytania, które projektowałem dla OpenAI w obszarze biologii molekularnej i strukturalnej a z którymi sobie nie radził GPT-4o. Radzi sobie również fantastycznie z analizą publikacji naukowych” – pisze ekspert.
Czytaj też
Kreatywne zadania
Według Szczęsnego, nowy model w wielu zastosowaniach nie różni się od GPT-4, a w zadaniach kreatywnych wydaje gorszy.
Redakcja CyberDefence24.pl także przetestowała OpenAI o1 pod względem kreatywnego generowania tekstu na podstawie wprowadzonych przez nas danych.. Wygenerowany tekst wydawał się nieco lepszy niż w modelu GPT-4o. Jednak, gdy wpisaliśmy kolejny prompt z informacją, co należy poprawić chatbot się zaciął.
Zauważyliśmy też, że rzeczywiście proces „myślenia” jest dłuższy, można też go prześledzić. Chatbot przed wygenerowaniem tekstu prowadzi analizy, takie jak „rozumienie kontekstu”, „rozważanie różnych perspektyw”, czy „rozważanie scenariuszy”. Widać również, że OpenAI o1 wyciąga wnioski „dla siebie” z wrzuconego przez nas tekstu, np. w kwestii reklam w LLM-ie.
Poniżej przedstawiamy screeny z „procesu myślowego” chatbota.
Czytaj też
Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na: [email protected].