Гоогле вештачка интелигенција научила је да препознаје појединачне гласове у гомили

Нови развој америчког ИТ гиганта Гоогле личи на технологију двоструке намене. С једне стране, ово је божји дар за шпијуна који може да идентификује и прислушкује звучника на даљину, чак и ако се крије у гомили људи. С друге стране, откриће у анализи гласовних података помоћи ће бројним особама оштећеног слуха и повећати ефикасност самих Гоогле услуга. Па како то функционише?

Није тешко препознати глас особе, чак и ако је присутна сметња - проблем је у идентификовању њеног власника. Гоогле програмери су једноставно причврстили видео камеру на микрофон помоћу алгоритма који реагује на људски израз лица. Систем упоређује покрете на лицу звучника, „чита усне“ и истовремено анализира звук. Ако се резултати поклапају - сјајно, АИ изолује овог лика и може да прати његов говор само у позадини опште какофоније звукова.

Неуронска мрежа је прво научена самој техници читања са усана, а затим је научена да разликује људе који разговарају од једноставног смеха, да препознаје изразе лица током разговора, чак и ако је лице делимично скривено брадом или микрофоном. Затим је у систем додат механизам за сортирање - када се израчуна звучник, његови подаци се уносе у засебан акустички профил. Захваљујући овоме, АИ може да разликује речи различитих људи, чак и ако намерно покушавају да их збуне и сложно говоре или певају.

Разумевање разговора одређене особе је добра ствар не само за шпијуна. На пример, могуће је са великом тачношћу пренети на слушни апарат речи саговорника особе са инвалидитетом, филтрирајући друге гласове, попут буке. Или проширите функционалност видео ћаскања као што су Хангоутс и Дуо. Осим тога, ово су нове могућности за системе гласовне контроле и сада ће бити немогуће провалити заштиту гласа само уз помоћ лажног акустичног снимка.

Повезани чланци
Нови чланци