Technologie
Google wie o tobie znacznie więcej niż myślisz i uczy tego AI
Google zaktualizował swoją politykę prywatności, zawierając w niej zapisy świadczące o tym, że pobiera wszystkie publiczne dane, jakimi dzielą się użytkownicy. Powodem ma być trenowanie sztucznej inteligencji. Co wie o tobie gigant tech? Z pewnością więcej, niż myślisz.
W kwietniu 2022 roku pisaliśmy o tym , że zbieranie i zestawianie publicznie dostępnych w internecie danych zostało uznane za legalne w orzeczeniu sądu apelacyjnego w USA, w długo toczącej się sprawie, którą serwis LinkedIn wytoczył jednej z firm, masowo gromadzącej publicznie dostępne dane z profili użytkowników tej sieci.
Warto pochylić się nad tym wątkiem w kontekście aktualizacji polityki prywatności Google, która zastrzegła sobie prawo do scrapingu danych publicznych online, by na tej bazie tworzyć swoje narzędzia sztucznej inteligencji (o googlowskim Bardzie i jego błędach w dniu premiery pisaliśmy w tym materiale ).
Serwis Gizmodo zwraca uwagę , że Google – w celu ulepszania swoich usług i opracowywania nowych produktów wykorzystuje „publicznie dostępne informacje, aby trenować modele sztucznej inteligencji oraz tworzyć produkty i funkcje, takie jak Tłumacz Google, Bard i funkcje sztucznej inteligencji w chmurze".
Wcześniej technologiczny gigant uzasadniał, że dane będą wykorzystywane do trenowania „modeli językowych”, a nie „modeli sztucznej inteligencji”, choć w poprzedniej wersji polityki prywatności wspominano o Tłumaczu Google, Bardzie i AI w chmurze.
Serwis określa te zasady jako zatrzeżenie przez Google, że firma traktuje internet „jak własny plac zabaw AI dla firmy” i przestrzega, że „jeśli Google może odczytać twoje słowa, to zakładaj, że należą teraz do firmy”.
Czy oznacza to zmianę w kwestii podejścia do tego, co prywatne, a co publiczne? Podano przykład: oznacza to m.in., że do trenowania Barda z dużym prawdopodobieństwem zostanie użyty np. stary post na dawno już zapomnianym przez ciebie blogu czy np. twoje recenzje sprzed kilkunastu lat, pozostawione jako wpisy publiczne.
W tym miejscu warto przypomnieć, że sam Google przestrzegał swoich pracowników przed umieszczaniem poufnych materiałów w chatbotach AI. Apel dotyczył nie tylko ChatuGPT, ale także własnego produktu firmy - konkurencyjnego względem OpenAI - Barda. Pytaniem pozostaje, gdzie zaciera się granica między „publicznymi” a „prywatnymi” danymi. Czy gdyby użytkownicy wcześniej wiedzieli, że ich publiczne dane będą wykorzystywane do trenowania modeli sztucznej inteligencji i przez nie przetwarzane (wciąż z różnymi efektami), czy na pewno by je udostępnili?
Czytaj też
Co wie o nas Google?
Czy jako użytkownicy wiemy, jakie dane na nasz temat pobierają i gromadzą Big Techy? Można to sprawdzić we wspomnianej polityce prywatności giganta, którą przejrzeliśmy .
Już w czasie tworzenia swojego konta Google przekazujemy: dane osobowe – imię, nazwisko, hasło; opcjonalnie także numer telefonu czy dane do płatności. Dane przekazuje się nawet w czasie kontaktu czy chęci otrzymania informacji o usługach (nie trzeba tworzyć konta).
Google gromadzi informacje, które tworzymy, przesyłamy, otrzymujemy od innych osób, kiedy korzystamy z ich usług. Mogą to być maile, zdjęcia, filmy, tworzone dokumenty czy komentarze do filmów w serwisie YouTube.
Dodatkowo zbiera informacje o aplikacjach, przeglądarkach i urządzeniach, przy użyciu których korzystamy z ich usług. Gromadzi również informacje o: unikalnych identyfikatorach, typie i ustawieniach przeglądarki, typie i ustawieniach urządzenia, systemie operacyjnym, danych sieci komórkowej (w tym nazwa operatora i numer telefonu oraz numer wersji aplikacji).
Kolejne? Informacje o interakcjach z aplikacji, z przeglądarek i urządzeń z ich usługami - w tym adres IP, raporty o awariach, dane o aktywności systemu oraz datę, godzinę i adres URL strony odsyłającej żądania.
Informacje o aktywności
To nie koniec listy: do raportu Google’a kierowane są informacje o aktywności w ich usługach: wyszukiwane hasła, oglądane filmy, wyświetlenia reklam i treści oraz interakcja z nimi, informacje związane z głosem i dźwiękiem, zakupy, osoby, z którymi się kontaktujemy lub którym udostępniamy materiały, aktywność w witrynach i aplikacjach innych firm, które korzystają z usług Google, historia przeglądania w Chrome synchronizowana z kontem Google.
Połączenia, numery telefonów, adresy nadawcy i odbiorcy
Jeśli użytkownik korzysta z usług Google do nawiązywania i odbierania połączeń lub wysyłania i odbierania wiadomości – jak czytamy w polityce prywatności – gigant może zbierać dane z dziennika połączeń telefonicznych i wiadomości, w tym numer telefonu, numer osoby dzwoniącej, numer rozmówcy, do którego dzwonisz, numery przekierowania, adresy e-mail nadawcy i odbiorcy, daty i godziny połączeń i wiadomości, czasy trwania rozmów, ustawienia przesyłania oraz liczbę i typy połączeń i wiadomości.
Informacje o lokalizacji
W czasie korzystania z usług Big Techa zbierane są także informacje o lokalizacji, które są określane na podstawie: GPS i inne dane z czujników urządzenia; adres IP; aktywność w usługach Google, na przykład wyszukiwania i miejsca oznaczone jako dom lub praca; informacje o rzeczach w pobliżu urządzenia (np. punkatach dostępu do sieci Wi-Fi, stacji bazowych sieci komórkowych i urządzeń z włączoną obsługą Bluetooth).
Czym są informacje dostępne publicznie?
„W pewnych okolicznościach Google zbiera też informacje o Tobie ze źródeł dostępnych publicznie” – czytamy w dokumencie . Jak gigant pojmuje „informacje dostępne publicznie”? „Jeśli na przykład Twoje imię i nazwisko pojawi się w lokalnej gazecie, wyszukiwarka Google może zindeksować dany artykuł i wyświetlać go osobom, które będą Cię wyszukiwać” – podano przykład.
Informacje o nas może też zbierać od zaufanych partnerów, partnerów marketingowych, partnerów w zakresie bezpieczeństwa, partnerów reklamowych. „Do zbierania i przechowywania informacji używamy różnych technologii, w tym plików cookie, tagów pikselowych, pamięci lokalnej, na przykład pamięci przeglądarki lub pamięci podręcznej aplikacji, baz danych i dzienników serwera” – podsumowano.
Jak sprawdzić, co wie o mnie Google?
Choć zwykle na co dzień - jako użytkownicy - nie zadajemy sobie pytań, co tak naprawdę wiedzą o nas internetowi dostawcy usług, zachęcamy, by sprawdzić to samodzielnie tutaj . Można także samodzielnie określić, jakie informacje może gromadzić o tobie Google oraz jak może z nich korzystać.
Google: nasza polityka jest przejrzysta
Poprosiliśmy zespół prasowy Google Polska o komentarz.
"Nasza polityka prywatności od dawna jest przejrzysta - Google wykorzystuje publicznie dostępne informacje z otwartej sieci do trenowania modeli językowych dla usług takich jak Tłumacz Google. Najnowsza aktualizacja w bardziej pogłębiony sposób wyjaśnia, że nowsze usługi, takie jak Bard, są również uwzględnione. Zasady prywatności i zabezpieczenia włączamy także do rozwoju naszych technologii AI zgodnie z naszymi Zasadami AI" - odpowiedziało nam biuro prasowe Google.
Czytaj też
Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na: [email protected].