Technologie

Powstaje sztuczna inteligencja symulująca ludzki głos

Fot. Geralt/Pixabay

Microsoft zaprezentował nowy model AI zajmujący się generowaniem mowy. Sztuczna inteligencja spróbuje mówić ludzkim głosem.

Nowy model AI Microsoftu nazywa się VALL-E i - jak mówią przedstawiciele firmy - jest „modelem języka kodeków neuronowych” i opiera się na technologii o nazwie EnCodec (ogłoszonej przez Metę w październiku 2022 roku).

Czytaj też

Jak opisuje portal Arstechnica, „VALL-E generuje dyskretne kodeki kodeków audio z monitów tekstowych i dźwiękowych. Analizuje jak brzmi dana osoba, dzieli te informacje na dyskretne komponenty (tokeny) i dzięki wspomnianemu EcCodec wykorzystuje dane do tego, aby przedstawić jak mogłyby brzmieć dalsze wypowiedzi”.

Wystarczą trzy sekundy

Programowi wystarczy trzysekundowa próbka głosu, aby wygenerować z niej symulację dłuższej wypowiedzi. Oznacza to, że fałszowanie czyjegoś głosu stanie się jeszcze prostsze. Z uwagi na ten fakt Microsoft nie udostępnia kodu VALL-E innym podmiotom.

Czytaj też

W produkcję zaangażowała się również Meta. Microsoft przeszkolił możliwość syntezy mowy VALL-E na bibliotece audio, której właścicielem jest Mark Zuckerberg. Biblioteka LibrilLight zawiera 60 tysięcy godzin wypowiedzi w języku angielskim.

Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu.*Piszcie do nas na: [email protected]*

Komentarze

    Czytaj także