Biznes i Finanse
#CyberMagazyn: ElevenLabs - polski jednorożec w generatywnej sztucznej inteligencji
Postępujący rozwój sztucznej inteligencji spowodował pojawienie się wielu platform i przedsiębiorstw wyspecjalizowanych w AI. Do powszechnej wiedzy nie należy jednak fakt, że jedno z bardziej znanych przedsiębiorstw - ElevenLabs - ma polskie korzenie, a wszystko przez… niewłaściwy dubbing filmów.
Chociaż ElevenLabs powstało w 2022 roku, korzenie projektu sięgają znacznie wcześniej. Założyciele przedsiębiorstwa Piotr Dąbkowski i Mateusz Staniszewski nie byli zadowoleni z poziomu polskiego dubbingu, który tworzono do amerykańskich filmów.
Przed powstaniem ElevenLabs, dwójka Polaków miała za sobą pracę dla amerykańskich gigantów technologicznych. Staniszewski był zatrudniony w Palantir Technologies jako strateg wdrożeń, a Dąbkowski odpowiadał za machine learning w Google.
Czytaj też
Słaby dubbing? Napraw go z pomocą AI
Jak przekazał CyberDefence24 przedstawiciel ElevenLabs, pomysł „naprawienia” tego problemu zrodził się po zdobyciu przez obu Polaków osiągnięć na polach technologicznych. Dodatkowo, spotykali się oni na weekendowych hackatonach.
„Obaj zaczęli eksplorować możliwość poprawienia jakości generacji dźwięku w taki sposób, aby brzmiała bardziej ludzko. To była iskra, z której powstało ElevenLabs” – powiedział nam przedstawiciel firmy.
Samo założenie ElevenLabs jeszcze nie wróżyło sukcesu. Kluczem do niego, jak przekazała nam firma było inne podejście do generowania wypowiedzi przez sztuczną inteligencję.
„Nasz model jest zbudowany tak, aby rozumieć relacje między słowami, co umożliwia dostosowanie efektu końcowego do szerszego kontekstu wypowiedzi” – przekazał pracownik przedsiębiorstwa. Zwykle bowiem, zdania są generowane jedno po drugim.
Czytaj też
Dynamiczna generacja wypowiedzi
Oprócz świadomości kontekstu, „ultrarealistyczna mowa” jest osiągana przez model ElevenLabs za pomocą wysokiej kompresji. Nie ma również mowy o elementach zakodowanych na stałe.
„Dzięki temu, model może dynamicznie przewidywać tysiące charakterystycznych elementów mowy podczas jej generacji” – powiedział przedstawiciel ElevenLabs.
Przedsiębiorstwo przeprowadza wszystkie badania i rozwój samodzielnie. Sama technologia, która jest stosowana podczas procesów, została w całości opracowana przez firmę.
Czytaj też
Nie tylko narzędzia głosowe
Chociaż pierwszy model sztucznej inteligencji opracowany przez ElevenLabs został opublikowany w 2023 po około roku prac, plany rozwoju firmy są dość ambitne. Okazuje się, że generacja mowy nie będzie jedynym obiektem zainteresowań przedsiębiorstwa.
„Zamierzamy włączyć więcej narzędzi z dziedziny dźwięku do naszej oferty poza samym głosem. Mówimy tu m.in. o generacji efektów dźwiękowych czy muzyki” – przekazał CyberDefence24 przedstawiciel polskiego jednorożca.
Co najciekawsze, w przyszłości ma się również pojawić narzędzie do dubbingowania całych filmów. W efekcie dojdzie niejako do rozwiązania problemu, który zaowocował utworzeniem startupu.
W rozwoju ElevenLabs mają pomóc zbiórki funduszy. Do tej pory, firma uzyskała blisko 100 mln dol., z czego większość otrzymanych środków przypadła na styczeń 2024 roku. W gronie inwestorów znaleźli się m.in. były szef GitHuba Nat Friedman, współzałożyciel Oculusa Brendan Iribe czy Sequoia Capital.
Czytaj też
Serwis CyberDefence24.pl otrzymał tytuł #DigitalEUAmbassador (Ambasadora polityki cyfrowej UE). Jeśli są sprawy, które Was nurtują; pytania, na które nie znacie odpowiedzi; tematy, o których trzeba napisać – zapraszamy do kontaktu. Piszcie do nas na:[email protected].