Technologie
Powstaje sztuczna inteligencja symulująca ludzki głos
Microsoft zaprezentował nowy model AI zajmujący się generowaniem mowy. Sztuczna inteligencja spróbuje mówić ludzkim głosem.
Nowy model AI Microsoftu nazywa się VALL-E i - jak mówią przedstawiciele firmy - jest „modelem języka kodeków neuronowych” i opiera się na technologii o nazwie EnCodec (ogłoszonej przez Metę w październiku 2022 roku).
Czytaj też
Jak opisuje portal Arstechnica, „VALL-E generuje dyskretne kodeki kodeków audio z monitów tekstowych i dźwiękowych. Analizuje jak brzmi dana osoba, dzieli te informacje na dyskretne komponenty (tokeny) i dzięki wspomnianemu EcCodec wykorzystuje dane do tego, aby przedstawić jak mogłyby brzmieć dalsze wypowiedzi”.
Wystarczą trzy sekundy
Programowi wystarczy trzysekundowa próbka głosu, aby wygenerować z niej symulację dłuższej wypowiedzi. Oznacza to, że fałszowanie czyjegoś głosu stanie się jeszcze prostsze. Z uwagi na ten fakt Microsoft nie udostępnia kodu VALL-E innym podmiotom.
Czytaj też
W produkcję zaangażowała się również Meta. Microsoft przeszkolił możliwość syntezy mowy VALL-E na bibliotece audio, której właścicielem jest Mark Zuckerberg. Biblioteka LibrilLight zawiera 60 tysięcy godzin wypowiedzi w języku angielskim.
Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu.*Piszcie do nas na: [email protected].*