Reklama

Czy Polska może mieć własnego DeepSeeka?

Styczniowy przełom w dziedzinie AI oraz publikacja PLLuM prowokują pytania o możliwość stworzenia polskiego ChataGPT. Czy jest to w ogóle możliwe?
Styczniowy przełom w dziedzinie AI oraz publikacja PLLuM prowokują pytania o możliwość stworzenia polskiego ChataGPT. Czy jest to w ogóle możliwe?
Autor. Growtika/Unsplash

Styczniowe przyspieszenie wyścigu sztucznej inteligencji spowodowało znaczny wzrost popularności pomysłów dotyczących stworzenia własnych dużych modeli językowych. Czy to oznacza, że nasz kraj powinnien dążyć do stworzenia polskiego odpowiednika ChataGPT?

Początek roku przyniósł duże zwiększenie tempa w pracach nad stworzeniem możliwie najdoskonalszej sztucznej inteligencji. Jak przedstawialiśmy wówczas na łamach CyberDefence24, Chińczycy zaprezentowali światu model DeepSeek opisywany jako „lepszy od ChatGPT”, co spowodowało jego wielką popularność. OpenAI, główny konkurent firmy, odpowiedział publikacją funkcji DeepResearch.

    Reklama

    PLLuM precedensem dla dużych LLM-ów?

    Kolejne modele AI stworzone przez innych graczy zaczęły się pojawiać niczym „grzyby po deszczu”. Swoją sztuczną inteligencję stworzyli na przykład Francuzi – publikacja Mistral AI Le Chat okazała się dużym sukcesem. Pokazano tym samym, że również kraje mniejsze od wielkich graczy mogą pracować nad swoimi modelami.

    Czy zatem i Polska powinna mieć swój odpowiednik ChatGPT lub DeepSeeka? Takim mianem już był (błędnie) nazywany PLLuM – jak opisywaliśmy na naszych łamach, jest to rodzina polskich modeli umożliwiających generowanie i przetwarzanie tekstów w języku polskim. Jak jednak zaznaczał wówczas kierownik projektu Maciej Piasecki, zostały one stworzone jako asystenci administracji publicznej, a nie „drugi ChatGPT”. 

    Wydawałoby się zatem, że miejsce na duży model językowy istnieje. Z wypowiedzi ekspertów wynika także zgoda co do tworzenia i rozwoju polskich LLM. Jak jednak zauważa dyrektor Ośrodka Przetwarzania Informacji – Państwowego Instytutu Badawczego dr hab. inż. Jarosław Protasiewicz, o ile nasze LLM-y sprawdzają się lepiej dla tekstów polskojęzycznych, tak sytuacja w przypadku dużych modeli jest nieco inna.

      Reklama

      Polskie LLM, ale poza wyścigiem gigantów

      Warto zastanowić się, czy koniecznie musimy się ścigać z USA i Chinami w budowaniu dużych modeli” – powiedział szef OPI. Takie wersje AI, zdolne do codziennej pomocy, nie są potrzebne firmom – zarówno tym małym, jak i dużym. W tym przypadku znacznie korzystniej wypadają dedykowane modele LLM, znacznie mniejsze od „dużych braci” – przykładem takowego jest wspomniany PLLuM.

      Tam, gdzie występuje ryzyko utraty przewagi konkurencyjnej bazującej na prywatnych danych, będziemy szli w dużo mniejsze modele szyte na miarę konkretnych firm lub instytucji. Szczególnie biorąc pod uwagę fakt, że dostosowanie DeepSeeka do mniejszych modeli drogą destylacji, np. do LLam-y 70B, odbywa się z dużą stratą jakościową” – wyjaśnia kierownik AI Lab w OPI, dr inż. Marek Kozłowski.

      Innym problemem stojącym na przeszkodzie stworzenia „polskiego ChatGPT” jest zapotrzebowanie na podzespoły. Popularny model DeepSeek-R1 posiada ok. 700 mld parametrów, do uruchomienia których potrzeba 16 kart H100 lub więcej. Koszt takiego „minimalnego” zestawu wynosi 3,2 mln zł, a z każdą kolejną kartą rośnie o 200 tys. zł. 

      Mniejsze, specjalistyczne modele posiadają 7 razy mniej parametrów, ale ich trening pozwala osiągnąć poziom co najmniej porównywalny z DeepSeekiem. Nietrudno zatem ocenić, że zamiast udziału w wyścigu potęg można prowadzić prace nad własnymi, znacznie prostszymi, ale ukierunkowanymi na konkretne zagadnienia modelami.

        Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na:[email protected].

        Reklama
        Reklama

        Sztuczna inteligencja w Twoim banku. Gdzie ją spotkasz?

        Materiał sponsorowany

        Komentarze

          Reklama