Reklama

Prywatność

Sztuczna inteligencja pozwoli unikać podsłuchów? Powstaje neuronowy kamuflaż dźwiękowy

Autor. Jason Rosewell / Unsplash

W erze wszędobylskich urządzeń elektronicznych, z których zdecydowana większość ma zdolność rejestrowania naszego głosu i podsłuchiwania (jak np. inteligentni asystenci), coraz bardziej palącą kwestią staje się znalezienie sposobu na ochronę prywatności i poufności konwersacji prowadzonych we własnym domu. Może w tym pomóc nowe narzędzie oparte o sztuczną inteligencję.

Reklama

Technologia Neural Voice Camouflage (neuronowy kamuflaż dźwiękowy) oparta o sztuczną inteligencję, według jej twórców ma być odpowiedzią na nieustanny nasłuch, który stał się naszym udziałem w dobie wszechobecnych urządzeń elektronicznych.

Reklama

Czytaj też

Reklama

Jednak, to nie tylko inteligentne głośniki wyposażone w asystentów (takie jak Amazon Echo, Google Home czy inne) są tu jedynym problemem – pandemia koronawirusa przyniosła pracę zdalną, a wraz z nią przyszły pomysły na nadzór dźwiękowy pracowników wykonujących swoje obowiązki z domu. Problemem są również aplikacje typu stalkerware, mogące być narzędziem przemocy w relacjach osobistych i np. nagrywać bez wiedzy oraz zgody osoby, na której telefonie są zainstalowane. O tym, jak dużym zagrożeniem jest tego rodzaju oprogramowanie, pisaliśmy już wcześniej na łamach naszego serwisu w tym tekście.

Jak ma działać neuronowy kamuflaż dźwiękowy?

System opiera się na algorytmach uczenia maszynowego do generowania takiego szumu dźwiękowego w tle, aby sztuczna inteligencja działająca np. w inteligentnych głośnikach z funkcją asystenta wszystkie rejestrowane odgłosy, w tym – ludzką mowę – identyfikowała jako coś zupełnie innego. W skrócie, algorytmy mają za zadanie oszukać inne algorytmy.

Niestety, technologia ta nie działa w czasie rzeczywistym, może być wykorzystana obecnie jedynie po fakcie – do obróbki dźwięków już nagranych, które uzupełniane są o wspomniany wcześniej szum w tle. Dlaczego? Potrzebny jest czas na przetworzenie przez uczenie maszynowe kompletu zarejestrowanych w klipie dźwiękowym danych.

Czytaj też

Analiza ta ma jednak charakter wyprzedzający w stosunku do tego, co znajduje się na nagraniu – poprzez dokładne zmapowanie tego, co już zostało powiedziane i jakim tonem, algorytmy uczą się „przewidywać", co powiemy za chwilę i przygotować się do tego, aby te słowa „zakamuflować" odpowiednim szumem tła, generowanym w oparciu np. o charakterystyczne cechy głosu osoby mówiącej.

Jednocześnie, jak podkreślają eksperci, którzy pracują nad nową technologią, z perspektywy człowieka wszystkie dźwięki pozostaną perfekcyjnie słyszalne i zrozumiałe.

Wysoki odsetek błędów

W czasie eksperymentu z systemami automatycznego rozpoznawania głosu, które często są wykorzystywane do transkrypcji tekstowej mowy, wykazano iż skuteczność w zaburzaniu prawidłowego działania transkrypcji wynosiła od 11,3 proc. do aż 80,2 proc. Najtrudniejsze do zakłócenia okazały się krótkie słowa, takie jak zaimki.

Chcemy być także bliżej Państwa – czytelników. Dlatego, jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na: [email protected]. Przyszłość przynosi zmiany. Wprowadzamy je pod hasłem #CyberIsFuture.

Reklama

Komentarze

    Reklama