Przerażające nowe oszustwo! Nabrać się może każdy z nas

16 kwietnia 2023 14:05 | Autor: Anna Szkutnik | Aktualności | Brak komentarzy|

Zadzwonili do przerażonej matki i zażądali miliona dolarów. Oszust użył sztucznej inteligencji, by wygenerować głos dziecka. Okazuje się, że wystarczy już kilkusekundowa próbka głosu.

Fot. Pixabay

Pierwszy taki przypadek miał miejsce w Arizonie. Oszuści podrobili głos nastolatki będącej poza domem. Przestępcy zadzwonili do matki dziewczyny informując, iż ta została porwana. W tle było słychać głos córki kobiety proszącej o pomoc.

Sztuczna inteligencja generuje głos za pomocą próbek poprzez analizę i naśladowanie właściwości ludzkiego głosu, a następnie tworzenie nowych próbek dźwiękowych opartych na tych analizach. Proces ten zwykle opiera się na zaawansowanych algorytmach uczenia maszynowego, takich jak sieci neuronowe, które uczą się rozpoznawania i generowania cech dźwiękowych na podstawie dużych zbiorów danych.

Oto kilka kroków, które AI wykonuje, aby wygenerować głos z próbek:

Zbiór danych: AI jest trenowane na dużym zbiorze danych zawierającym próbki ludzkiego głosu. Ten zbiór danych może obejmować różnorodne głosy, akcenty, języki i sytuacje mówione.
Analiza cech: AI analizuje cechy dźwiękowe zawarte w próbkach, takie jak ton, wysokość, artykulacja, tempo i intonacja. Te cechy są następnie reprezentowane w formie matematycznej, która może być łatwo przetwarzana przez algorytmy.
Uczenie maszynowe: Algorytmy uczenia maszynowego, takie jak sieci neuronowe, uczą się na podstawie analizy próbek głosowych. Nauczenie się wzorców i struktur pozwala AI na generowanie nowych dźwięków zgodnych z cechami oryginalnych próbek.
Synteza mowy: Po nauczeniu się właściwych cech dźwiękowych AI jest w stanie generować nowe próbki głosowe, które naśladują ludzki głos. To może obejmować generowanie pojedynczych fonemów (najmniejszych jednostek dźwiękowych), które są następnie łączone, aby tworzyć słowa, frazy i zdania.
Ewaluacja i optymalizacja: Wygenerowane próbki głosowe są oceniane pod względem jakości, naturalności i zrozumiałości. Na podstawie tej oceny AI może być dalej optymalizowane, aby poprawić jakość syntezowanego głosu.

Najbardziej znanym przykładem technologii generowania głosu za pomocą próbek jest WaveNet, opracowany przez DeepMind. WaveNet to głęboka sieć neuronowa, która generuje surowe próbki dźwiękowe na podstawie analizy i modelowania cech dźwiękowych ludzkiego głosu.

Anna Szkutnik

W Krakowie w Pigułce pracuje na stanowisku redaktora. Zajmuje się tematami miejskimi. Lubi poznawać nowych ludzi i nowe miejsca.

Adres wydawcy i właściciela portalu:
Capital Media S.C.
ul. Grzybowska 87,
00-844 Warszawa.