Reklama

Technologie

Meta pozyskiwała nielegalnie książki do treningu AI?

Autorzy pozywający Metę o naruszenie praw autorskich twierdzą, że gigant miał świadomie pobierać książki do treningu AI z nielegalnych źródeł. Miał pozyskać w ten sposób ponad 80 TB danych.
Autorzy pozywający Metę o naruszenie praw autorskich twierdzą, że gigant miał świadomie pobierać książki do treningu AI z nielegalnych źródeł. Miał pozyskać w ten sposób ponad 80 TB danych.
Autor. Sergei Tokmakov, Esq./Pixabay / Muhammad Asyfaul/Unsplash

Meta miała wykorzystać kilkaset tysięcy książek pozyskanych za pośrednictwem piractwa do treningu swoich modeli sztucznej inteligencji – wynika z informacji przekazanych do sądu. Pozywający firmę autorzy twierdzą, że właściciele Facebooka i Instagrama uzyskali co najmniej 81 terabajtów danych.

Kontrowersje wokół materiałów wykorzystywanych przez gigantów do szkolenia AI trwają od ponad roku. Pozwy dotyczące tej sprawy otrzymało pod koniec 2023 roku OpenAI. Jednak jak opisywaliśmy na łamach CyberDefence24, skierowane m.in. przez New York Times pismo zostało uznane za „bezpodstawne”.

    Reklama

    Terabajty książek uzyskane nielegalnie?

    OpenAI to nie jedyna firma, która została oskarżona o złamanie praw autorskich. Podobny pozew otrzymała Meta. Spośród kilkunastu zarzutów ze strony trzech autorów książek utrzymał się tylko jeden, dotyczący złamania przepisów pod kątem treningu AI na dziełach powodów.

    Jak jednak opisuje serwis CyberNews, autorzy przedstawili nowe dowody sugerujące winę właściciela Facebooka. Do treningu modelu Llama Meta miała przygotować zestaw 81,7 TB plików będących wersjami tekstowymi książek. Uzyskano je wykorzystując piractwo - za pośrednictwem stron Anna’s Archive czy Libgen. Co istotne, ta ostatnia baza pojawia się dwukrotnie: wspólnie z serwisem Z-Library miała być źródłem 35,7 TB danych, a wcześniej wykorzystano ją do pozyskania 80,6 TB plików.

      Reklama

      Meta podjęła świadomą decyzję? Gigant zaprzecza

      Autorzy książek nie ograniczyli się jedynie do twierdzeń związanych z objętością danych. Pojawiają się również wewnętrzne wiadomości, które pracownicy Mety przesyłali między sobą w związku ze sprawą. W dokumencie sądowym wskazano, że zastanawiano się nad licencjonowaniem treści do celów treningu AI czy kontekstem etycznym zastosowania pirackich treści.

      Pozywający giganta wskazują, że Meta miała zdecydować się na nielegalne pozyskiwanie treści do szkolenia sztucznej inteligencji przy udziale firmowego prawnika. Jak również zauważono, w korporacji była świadomość w kwestii kolizji materiałów pirackich i licencjonowanych.

      Jeżeli uzyskamy prawa do jednej pozycji, nie będziemy mogli skorzystać ze strategii dozwolnego użytku. Będziemy musieli porzucić zarówno Libgen, jak i książkowe datasety” – wynika z jednej z wewnętrznych wiadomości pracowników giganta.

      Natomiast Meta twierdzi, że wykorzystanie materiałów do treningu AI spełnia warunki dozwolonego użytku.

      „Strona powodowa nie powołuje się na ani jeden przypadek, w którym jakakolwiek część jakiejkolwiek książki została faktycznie pobrana przez osobę trzecią z Meta za pośrednictwem torrenta, a tym bardziej, że książki powodów były w jakiś sposób dystrybuowane przez firmę” – napisało przedsiębiorstwookreślając argumenty autorów mianem „wadliwych” i wyrażając nadzieję na „obalenie” ich tez w orzeczeniu.

        Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na:[email protected].

        Reklama
        Reklama

        Jak odkryto blokady w pociągach Newagu?

        YouTube cover video

        Komentarze

          Reklama