Technologie
Kontrowersje wokół ChatuGPT. Chodzi o nagrania z YouTube
Pracownicy OpenAI spisali tysiące nagrań z YouYutube i nakarmili tymi danymi ChatGPT-4, który jest uważany za najlepiej rozwinięty duży model językowy. Złamali w ten sposób prawa autorskie twórców i regulamin platformy.
Open AI bardzo dobrze zdawał sobie sprawę, z tego co robi - donosi dziennik „The New York Times”, powołując się na pięć osób związanych z firmą. W proces gromadzenia nagrań miał być zaangażowany sam Greg Brockman - współzałożyciel i członek zarządu Open AI. Nagrania zamieniono w tekst programem Whisper i wykorzystano do trenowania GPT-4.
Decyzja miała zostać podjęta w 2021 roku, po tym jak OpenAI wykorzystało już wszystkie dobrej jakości teksty w języku angielskim, dostępne na stronach internetowych.
Czytaj też
Sora trenowana na nagraniach z YouTube
Kilka dni temu wyszło na jaw, że na nagraniach YouTube miała być też trenowana Sora, czyli narzędzie OpenAI, które na podstawie komend tekstowych tworzy filmy.
Jeśli to prawda, doszłoby do oczywistego naruszenia polityki prywatności – komentował sprawę prezes YouTube Neal Mohan w rozmowie z agencją Bloomberga.
Czytaj też
Google wcale nie lepsze od OpenAI
Do sprawy trenowania GPT-4 odniósł się z kolei Matt Bryant, rzecznik prasowy Google do którego należy YouTube. W rozmowie z NYT stwierdził, że firma nie zdawała sobie sprawy z zabronionych działań, polegających na „nieautoryzowanym pobieraniu danych z YouTube”. Google twierdzi, że podejmie kroki prawne, jeśli znajdzie ku temu podstawy.
To jednak mało prawdopodobne. Okazuje się bowiem, że Google też korzystało z nagrań YouTube do trenowania własnych narzędzi opartych na sztucznej inteligencji. Big Tech ma zgodę na korzystanie z danych twórców, pod warunkiem, że posłużą one do rozwijania funkcjonalności platformy. Nie jest jednak pewne, czy może to robić do trenowania nowych narzędzi, takich jak chatboty. Interpretacja regulaminu jest w tym przypadku otwarta.
Czytaj też
Wyścig o dane
OpenAI miało zdawać sobie sprawę z działań Google’a, dlatego nie zaprzestało swoich praktyk - mimo, że w przypadku tej pierwszej firmy jest to nielegalne. Oba Big Techy ścigają się w rozwoju sztucznej inteligenci, a negocjacje nad licencjami artystów, muzyków czy wydawców prawdopodobnie trwają zbyt długo i są dla nich nieopłacalne.
Firmy wolą więc wykorzystywać dane bez zgody twórców.
Czytaj też
Trenowanie sztucznej inteligencji a prawo
To, że nie ma jeszcze klarownych rozwiązań prawnych dotyczących sztucznej inteligencji, nie oznacza, że firmy mogą dowolnie korzystać z naszych danych do trenowania AI.
”Przepisy prawne istotne z tego punktu widzenia, czy to RODO czy prawo własności intelektualnej, zawsze obowiązywały. Konsekwencją tego są chociażby głośne obecnie sprawy sądowe wytaczane przez twórców czy wydawców przeciwko dostawcom AI – komentowała na łamach CyberDefence24 dr Maria Dymitruk, radczyni prawna, counsel w firmie doradczej Olesiński i Wspólnicy.
Ostatnim głośnym pozwem był ten wytoczony przez NYT wobec OpenAI i Microsoft. Dziennik chce zatrzymania wykorzystywania historii napisanych przez dziennikarzy do trenowania chatbotów, takich jak ChatGPT czy Bing.
Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na: [email protected].