- WIADOMOŚCI
Pierwsze wdrożenia PLLuM. Minimum 200 mln zł na dalszy rozwój
Wiceminister cyfryzacji Dariusz Standerski w rozmowie z CyberDefence24 zapowiedział pierwsze pełne wdrożenia modelu PLLuM w administracji publicznej. Równolegle trwają prace nad zapewnieniem dalszego finansowania projektu oraz rozwoju zastosowań sztucznej inteligencji w sektorze publicznym.
Autor. Canva / CyberDefence24
- Pierwsze pełne wdrożenia PLLuM mają ruszyć w czerwcu w Ministerstwie Cyfryzacji oraz Kancelarii Premiera.
- Na dalszy rozwój modeli PLLuM planowane jest co najmniej 200 mln zł do 2029 roku.
- Rozwijanie dużych modeli językowych dla języka polskiego jest trudniejsze niż w przypadku angielskiego ze względu na ograniczoną liczbę dostępnych danych treningowych.
Polska administracja przechodzi do kolejnego etapu wdrażania polskiego modelu językowego PLLuM. Po zakończeniu testów i pilotaży projekt ma zostać wykorzystany w praktycznym działaniu instytucji publicznych.
„Jesteśmy już po testach i pilotażach dotyczących wdrożeń modeli PLLuM w administracji publicznej. W czerwcu planujemy pierwsze pełne wdrożenia w Ministerstwie Cyfryzacji i w Kancelarii Premiera” - zapowiedział Dariusz Standerski w rozmowie z CyberDefence24.
Równolegle prowadzone są działania związane z zapewnieniem długoterminowego finansowania projektu. Jak podkreśla resort cyfryzacji, rozwój krajowych modeli AI ma być jednym z ważniejszych elementów budowania kompetencji technologicznych państwa.
„Kończymy procedurę uruchamiania środków unijnych, aby zapewnić stabilne i bezpieczne finansowanie co najmniej do 2029 roku. Mówimy o minimum 200 milionach złotych na dalszy rozwój modeli PLLuM” - dodał wiceminister.
PLLuM nie przetwarza danych osobowych
Jednym z najważniejszych tematów związanych z wdrażaniem modeli AI w administracji pozostaje bezpieczeństwo danych oraz zgodność z europejskimi regulacjami dotyczącymi sztucznej inteligencji.
Dariusz Standerski podkreślił, że publiczne systemy z wykorzystaniem PLLuM zostały zaprojektowane w sposób ograniczający ryzyko związane z przetwarzaniem danych użytkowników.
„PLLuM nie przetwarza żadnych danych osobowych, w związku z czym jest bezpieczny i zapomina konwersacje po ich zakończeniu. Nasze dane są bezpieczne, nieprzetwarzane i wszystko jest zgodne z europejskim Aktem o sztucznej inteligencji” - powiedział wiceminister cyfryzacji Dariusz Standerski.
AI i rozwój e-zdrowia
Rozwój sztucznej inteligencji coraz mocniej wchodzi również do obszaru ochrony zdrowia. W połowie maja br. Sejm przyjął ustawę dotyczącą rozwoju usług e-zdrowia oraz nowych funkcjonalności systemu ochrony zdrowia.
Planowane jest m.in. rozwijanie platform wykorzystujących nowoczesne technologie i sztuczną inteligencję do szybszej analizy badań oraz zwiększenia precyzji diagnostyki.
W rozmowie z prof. Szymonem Łukasikiem, dyrektorem Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK - PIB, zapytaliśmy, czy miała miejsce lub jest planowana współpraca NASK z Ministerstwem Zdrowia i Centrum e-Zdrowia przy rozwijaniu technologii AI dla e-zdrowia.
„W naszym ośrodku tym tematem się nie zajmowaliśmy. To jest bardzo delikatna dziedzina, w której potrzebna jest bardzo duża odpowiedzialność w kwestii samego wdrożenia. To są systemy wysokiego ryzyka według AI Act. Oczywiście jesteśmy gotowi na możliwe wspólne działania w tym obszarze - na razie współpraca NASK z tymi podmiotami obejmuje obszary cyberbezpieczeństwa i medycznej dezinformacji” - wyjaśnił Łukasik.
Jak zaznaczył Dariusz Standerski, model PLLuM ma być rozwiązaniem otwartym i dostępnym dla różnych instytucji publicznych, w tym także dla sektora zdrowia.
„Ministerstwo Zdrowia, podobnie jak każdy inny podmiot, może wejść na platformę, pobrać model i od razu zacząć z niego korzystać. Na tym polega przewaga i unikalność PLLuM: nikt nie musi pytać ministerstwa o zgodę na zastosowanie modelu. Serdecznie do tego zachęcamy i oczywiście oferujemy wsparcie techniczne” - podkreślił wiceminister cyfryzacji.
Jak powstają polskie modele językowe?
Rozwijanie dużych modeli językowych dla języka polskiego jest znacznie trudniejsze niż w przypadku języka angielskiego. Głównym wyzwaniem jest ograniczona liczba dostępnych danych treningowych.
„Język polski należy do języków o tak zwanych małych zasobach. Oznacza to, że mamy stosunkowo niewiele tekstów, zwłaszcza dostępnych w internecie i na wolnych licencjach, które można wykorzystać do zbudowania takiego modelu od podstaw. Prowadziliśmy tego rodzaju eksperymenty i modele trenowane w ten sposób miały bardzo niską jakość. Dlatego zwykle punktem wyjścia jest istniejąca architektura otwartego modelu, na przykład Llama, Gemma czy Mistral, a następnie kontynuuje się trenowanie na polskich danych” - wyjaśnił prof. Łukasik.
Jak dodał, podobne podejście stosuje wiele państw rozwijających własne modele językowe.
„Wykorzystujemy polskie dane i polskie instrukcje do dalszego trenowania modelu. Dodaje się też pewną porcję otwartych tekstów w języku angielskim, aby model nie tracił kompetencji, których nauczył się wcześniej. Takie podejście jest praktykowane przy wielu modelach na świecie. Przykłady mamy choćby w Singapurze, a w Polsce jest nim Bielik. To w dużej mierze modele, w których wychodzi się od bazowej architektury otwartego modelu, a następnie adaptuje się ją lokalnie” - dodał Łukasik.



Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na: [email protected].
Krajowy system e-Faktur - co musisz wiedzieć o KSEF?
Materiał sponsorowany