Hlasové deepfaky neoklamou váš sluchový systém, jen vaše vědomí

Sdílet
Nový výzkum ukazuje, že lidé vědomě nedokážou rozlišit AI hlas od lidského. Mozek to ale zvládá sám. Neurologové pomocí EEG zjistili, že sluchový systém po krátkém tréninku začne falešné hlasy „označovat" jinak než skutečné, a to dávno před tím, než to člověk vědomě zaregistruje. Co to znamená pro budoucí obranu proti hlasovým podvodům?
Hlasové deepfaky neoklamou váš sluchový systém, jen vaše vědomí

Dokážete rozlišit skutečný lidský hlas od hlasu vytvořeného umělou inteligencí? Pravděpodobně ne. A nejste v tom sami. Nová studie zveřejněná v časopise eNeuro ale přináší nečekaně povzbudivé zjištění: i když vědomě selháváte, váš mozek už na rozpoznávání AI hlasů tiše pracuje.

Výzkumný tým pod vedením Xiangbin Tenga z Tianjinské univerzity a Čínské univerzity v Hongkongu provedl experiment s třiceti účastníky. Každý z nich poslouchal věty namluvené skutečnými lidmi a jejich AI kopie vytvořené pomocí systému GPT-SoVITS. Úkolem bylo určit, zda hlas patří člověku, nebo stroji. Výsledky na úrovni vědomého rozhodování? Tristní. Účastníci v tom měli úspěšnost srovnatelnou s náhodným hádáním.

Zajímavější příběh se ale odehrával pod povrchem.

Mozek pracuje dřív než vědomí

Během experimentu nosili účastníci EEG čepice, které snímaly jejich mozkovou aktivitu. A právě tady se ukázalo něco pozoruhodného. Po pouhých dvanácti minutách krátkého perceptuálního tréninku (kdy byly hlasy explicitně označeny jako lidské nebo umělé) začal mozek reagovat na AI hlasy měřitelně jiným způsobem.

Výzkumníci identifikovali tři klíčové okamžiky, ve kterých se neuronální odpovědi na skutečný a syntetický hlas lišily: přibližně 55 milisekund, 210 milisekund a 455 milisekund po začátku zvuku. Všechny tři momenty spadají do raných fází sluchového zpracování, tedy daleko před tím, než se zapojí vědomé rozhodování. Jinými slovy, sluchový systém začne falešné hlasy „tagovat” jako odlišné, ale tato informace se zatím nepropojí s vědomou schopností říci „tohle je AI”.

V čem se AI hlasy liší

Součástí studie byla i akustická analýza samotných hlasových vzorků. Rozdíly mezi skutečnou a syntetickou řečí se ukázaly v rozmezí modulačních frekvencí 5,4 až 11,7 Hz. Toto frekvenční pásmo souvisí s tím, jak mozek sleduje rychlé řečové detaily, tedy jednotlivé fonémy a začátky slabik.

AI hlasy, a to i ty jemně doladěné (tzv. fine-tuned), tyto jemné variace zatím neumí dokonale napodobit. Právě v nich se skrývá jakýsi „akustický otisk”, který lidský sluchový systém zachytí, přestože si to jeho majitel neuvědomuje.

Proč je to dobrá zpráva

Výsledky studie mají důležitý praktický rozměr. Hlasové deepfaky představují reálnou hrozbu, od podvodných telefonátů přes manipulativní audionahrávky až po falšování identity. Zatímco současné technické detektory deepfaků čelí neustálému závodu s vylepšujícími se generátory, lidský mozek nabízí alternativní cestu.

Klíčové zjištění spočívá v tom, že biologický „hardware” pro rozpoznávání falešných hlasů funguje. Chybí ale propojení mezi nevědomou detekcí a vědomým rozhodnutím. To otevírá prostor pro vývoj cílených tréninkových programů, které by lidem pomohly vědomě rozpoznat to, co jejich mozek už zachytil.

Místo obecných rad typu „buďte opatrní při telefonátech” by tak v budoucnu mohly vzniknout konkrétní tréninkové metody zaměřené na specifické akustické znaky, které AI hlasy zatím nedokážou simulovat. Teoreticky by mohly pomoci i techniky neurofeedbacku, které by posílily propojení mezi nevědomou neuronální reakcí a vědomou percepcí.

Závod pokračuje

Je třeba dodat, že studie pracovala s konkrétním generátorem AI hlasů (GPT-SoVITS) a relativně malým vzorkem třiceti lidí. Syntetické hlasové technologie se navíc neustále zdokonalují. Frekvenční pásmo, ve kterém dnes AI hlasy zaostávají, může být překonáno další generací modelů.

Přesto je zjištění zásadní: lidský sluchový systém je ve zpracování řeči mimořádně sofistikovaný a dokáže zachytit nuance, které vědomému vnímání zatím unikají. Výzva teď stojí před neurovědou i bezpečnostním výzkumem: jak tuto skrytou schopnost mozku přetavit v praktický nástroj obrany.

Zdroj: Digital Trends

Zůstaňte v obraze s AI novinkami

Přihlaste se k odběru mého newsletteru a získejte nejnovější tipy, triky a novinky ze světa umělé inteligence přímo do vaší schránky. Žádný spam, pouze hodnotný obsah.

Týdenní přehled novinek

Exkluzivní návody

Slevy na workshopy

Name(Required)
Privacy(Required)

Odesláním souhlasíte se zpracováním osobních údajů. Odhlásit se můžete kdykoliv.

Další články

Další zajímavé články, které by vás mohly zajímat

Pět klíčových strategií, které odlišují AI lídry od firem uvízlých v pilotním režimu

Umělá inteligence slibuje revoluci v byznysu, ale většina firem se stále točí v kruhu pilotních projektů bez skutečného dopadu. Co dělají ti, kterým se daří AI škálovat a přinášet reálnou hodnotu? Odhalte pět zásadních strategií,...

Který placený AI asistent je pro vás nejlepší? Srovnání Gemini Advanced, ChatGPT Plus a Copilot Pro

Placené AI asistenty dnes najdete v prohlížečích, vyhledávačích i na ploše. Který z nich ale zvládá odpovídat nejrychleji, nejpřesněji a nejpohodlněji? Otestoval jsem Gemini Advanced, ChatGPT Plus a Copilot Pro v pěti klíčových oblastech a...

Umělá inteligence pomáhá řešit globální problémy v roce 2025

Umělá inteligence už dávno není jen slibem do budoucna. V roce 2025 vidíme její konkrétní dopady v boji s klimatickými riziky, zlepšování zdravotní péče, posilování potravinové bezpečnosti i podpoře inkluzivního vzdělávání. Jaké inovace přináší a...