Reklama

Technologie

Pierwszy polski otwarty duży model językowy. Powstanie PLLuM

Powstanie pierwszy polski duży model językowy
Powstanie pierwszy polski duży model językowy
Autor. Google DeepMind/ Unsplash

Sześć wiodących jednostek naukowych z obszaru AI oraz przetwarzania języka naturalnego stworzy polski duży model językowy nazwany PLLuM. Jest on trenowany na treściach głównie polskojęzycznych, podobnie jak oparty na nim inteligentny asystent. Czy będzie to konkurencja dla ChatuGPT?

Reklama

Niedawno minął rok od czasu upowszechnienia się ChatuGPT, który błyskawicznie zyskał popularność i z którego tygodniowo korzysta obecnie - jak podała niedawno firma - ponad 100 mln użytkowników.

Reklama

Duże generatywne modele językowe (LLMs) mają jednak swoje ograniczenia - nadal często się mylą, zwykle trenowane są na treściach anglojęzycznych, a większa liczba funkcjonalności dostępna jest z reguły w wersji płatnej.

Czytaj też

Polski otwarty duży model językowy

Stąd pojawił się pomysł, aby stworzyć otwarty, darmowy model językowy - w większości wytrenowany na treściach polskojęzycznych. Projekt będzie realizować sześć jednostek naukowych z obszaru sztucznej inteligencji i językoznawstwa: Politechnika Wrocławska (lider konsorcjum), Państwowy Instytut Badawczy NASK, Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy (OPI PIB), Instytut Podstaw Informatyki PAN, Uniwersytet Łódzki oraz Instytut Slawistyki PAN zawiązało konsorcjum PLLuM (Polish Large Language Universal Model).

Reklama

PLLuM ma być pierwszym polskojęzycznym otwartym dużym modelem językowym, dodatkowo naukowcy AI stworzą również model inteligentnego asystenta.

„Całość projektu ma być przeprowadzona zgodnie z dobrymi praktykami etycznej i odpowiedzialnej sztucznej inteligencji, w tym przy zachowaniu reprezentatywności, przejrzystości i sprawiedliwości danych. Istotną rolę odegra tu więc również Krajowe Centrum Doskonałości Danych z siedzibą w NASK-PIB” - zaznacza NASK PIB w nadesłanej nam informacji prasowej.

Czytaj też

Model trenowany na języku polskim

Jak zaznacza jednostka badawcza, nadal brakuje modeli wytrenowanych na języku polskim, co sprawia, że nie nadają się one do wielu komercyjnych zastosowań w języku polskim. Z kolei PLLuM ma działać na bezpłatnej, otwartoźródłowej licencji, jednocześnie odpowiadając wymogom rynkowym.

„Wielkie modele językowe stały się uniwersalnymi, podstawowymi silnikami dla przetwarzania języka naturalnego, ale ich zbudowanie czy dotrenowanie przekracza możliwości polskich przedsiębiorców. Dlatego stworzenie otwartego polskiego wielkiego modelu językowego w połączeniu z dostępną już w Polsce infrastrukturą obliczeniową dla AI (np. na PWr.) jest takie ważne, bo może wesprzeć rozwój nauki, ale także małe i średnie przedsiębiorstwa, które w obszarze IT oraz AI są motorem napędowym polskiej gospodarki” – komentuje prof. Maciej Piasecki, kierownik projektu po stronie Politechniki Wrocławskiej, lidera konsorcjum.

Natomiast dr inż. Jarosław Protasiewicz, dyrektor Ośrodka Przetwarzania Informacji dodaje, że „w interesie nas wszystkich leży dynamiczny rozwój branży IT i środowiska naukowego w Polsce. Istotne jest, aby opracowywać nowe narzędzia IT i udostępniać je wszystkim za darmo”.

Dr Inez Okulska, kierowniczka Zakładu Inżynierii Lingwistycznej i Analizy Tekstu z NASK-PIB tłumaczy z kolei, że model PLLuM „będzie stymulował rozwój nauki w Polsce nie tylko w obszarze rozwoju AI, ale także wyjaśnialności sztucznej inteligencji (XAI - Explainable AI)”.

Założeniem projektu ma być fakt, że PLLuM będzie służył nie tylko naukowcom i przedsiębiorcom, ale też polskiemu społeczeństwu. W tym ma pomóc polskojęzyczny inteligentny asystent, którego celem będzie zwiększenie dostępności usług publicznych - zarówno cyfrowych, jak i np. podczas tradycyjnej wizyty w urzędzie czy punkcie obsługi.

/NB

Czytaj też

Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na:*[email protected].*

Reklama

Komentarze

    Reklama