2018-j stav rokom, koly čymala kiľkisť ljudej zvykly rozmovljaty — ta ne z ljuďmy, a iz prystrojamy. Smart-ğadžety navčylysja vidpovidaty na prohannja pročytaty tekst, zagraty pisnju čy nalaštuvaty budyľnyk na potribnyj čas. Prote vy — ne jedyni, hto rozmovljaje z vašoju smart-kolonkoju čy smartfonom, perekonujuť doslidnyky, jakyh opytaly u redakciї The New York Times.
Material vidomogo vydannja z’javyvsja ne prosto tak. Za mynuli 2 roky doslidnyky u Spolučenyh Štatah ta Kytaї počaly demonstruvaty, ščo za najavnosti pevnogo obladnannja ta navyčok možna podavaty komandy vašym smart-pomičnykam tak, ščo vy sami ne budete ničogo čuty. Cja vrazlyvisť pošyrjujeťsja jak na Siri vid Apple, tak i na servisy Alexa vid Amazon ta Google Assistant. Eksperymentamy cymy zajmalysja ne lyše YouTube-entuziasty, ale j serjozni doslidnyky v universytetśkyh laboratorijah. Їhni sproby ne jšly dali sprob nabyraty telefonni nomery čy vidviduvaty pevni sajty za dopomogoju komand, ščo їh ne maje zmogy rozriznyty ljudśke vuho. Prote v rukah zlovmysnykiv taki pidhody do keruvannja golosovymy pomičnykamy označatyme zdatnisť vidkryvata vhidni dveri pomeškań, perekazuvaty košty z vašyh rahunkiv čerez internet-servisy abo kupuvaty tovary bez vašogo vidoma — prosto prokrutyvšy pevnu pisnju po radio poruč iz vašym prystrojem.
Doslidnyky zi «svystkom»
Šyrokogo rozgolosu eksperymenty iz zvukovymy vrazlyvostjamy smart-pomičnykiv nabuly navesni 2018-go. Grupa studentiv Kalifornijśkogo universytetu, Berkli ta Džordžtaunśkogo universytetu počaly šče raniše: u 2016-mu vony pokazaly, ščo pryhovani komandy možna zamaskuvaty pid tak zvanyj «bilyj šum». Dostatńo prograty cej šum čerez kolonky — i zvyčajnyj rolyk na YouTube može perevesty vašogo smart-pomičnyka u režym «poľotu» čy vidkryty potribnyj sajt.
U 2018-mu častyna z cyh doslidnykiv iz Berkli opryljudnyly dokladne doslidžennja, u jakomu rozkryly možlyvisť vbudovuvaty taki komandy u zapysy muzyky čy golosovi komandy. I poky ljudyna čuje, jak htoś govoryť čy graje muzyka, naspravdi vaš golosovyj pomičnyk tym časom otrymuje komandu dodaty do spysku pokupok šče trohy tovariv (jaki vy j ne zbyralysja kupuvaty).
«My hotily pobačyty, čy možemo my zrobyty proces nadsylannja komand šče pryhovanišym», — rozpoviv Nikolas Karlini, doktorant filosofiї, student z komp’juternoї bezpeky v Universyteti Berkli ta odyn z avtoriv statti. Karlini dodav, ščo, hoča nemaje žodnyh dokaziv možlyvogo vytoku informaciї pro ci eksperymenty za meži laboratorij, ta počatok vykorystannja shožyh metodiv vtručannja v robotu golosovyh pomičnykiv — vyključno pytannja času.
Komp’jutery možna obduryty vyznačennjam litaka jak kišky, prosto zminjujučy dekiľka pikseliv cyfrovogo zobražennja, a doslidnyky možuť vtrutytysja u švydkisť ruhu avtivky, prosto rozmistyvšy nevelyki nalipky na dorožni znaky ta zaplutavšy komp’juternu systemu zoru . Zi zvukovymy atakamy doslidnyky vykorystovujuť rozryv u časi miž rozpiznavannjam zvukiv z boku ljudyny ta mašyny. Systemy, ščo rozpiznajuť movlennja, zazvyčaj perekladajuť kožen zvuk, formujučy v kincevomu pidsumku kompiljaciju cyh sliv i fraz. Robljačy neznačni zminy v audiofajlah, doslidnyky zmogly skasuvaty zvuk, jakyj systema rozpiznavannja movy povynna bula počuty, i zaminyty zvukom, jakyj bude perepysanyj riznymy mašynamy, budučy majže nepomitnym dlja ljudśkogo vuha.
Ščo kažuť z ćogo pryvodu vyrobnyky
Čym biľše staje ğadžetiv, kerovanyh golosom, tym biľši ryzyky zastosuvannja podibnyh zlovmysnyh dij. Smartfony ta smart-spikery, jaki vykorystovujuť cyfrovyh pomičnykiv na kštalt Amazon Alexa ta Apple Siri, majuť do 2021 roku perevyščyty kiľkisť ljudej na planeti — tak prognozujuť u doslidnyćkij kompaniї Ovum.
Kompanija Amazon zajavyla, ščo vona ne rozkryvaje konkretnyh zahodiv bezpeky, ale vžyla zahodiv dlja zahystu svogo smart-dynamika Echo. Google zajavyv, ščo bezpeka je postijnym akcentom u roboti kompaniї, i ščo її pomičnyk maje funkciї dlja pryglušennja nevyznačenyh audiokomand. Cyfrovi asystenty oboh kompanij vykorystovujuť tehnologiju rozpiznavannja golosu, ščob zapobigty diї prystroїv pid vplyvom pevnyh komand, jakščo vony ne rozpiznajuť golos korystuvača.
Kompanija Apple tež ne stoїť ostoroń. Vona zajavyla, ščo її rozumnyj dynamik HomePod vmije zapobigaty vykonannju komand, takyh jak rozblokuvannja dverej, i bulo vidznačeno, ščo iPhone ta iPad povynni buty rozblokovani, perš niž Siri bude reaguvaty na komandy, jaki otrymujuť dostup do konfidencijnyh danyh abo zapusku program čy sajtiv.
Uspišni pryklady zlamu je — i vony ne taki vže j poodynoki
Popry usi zapevnennja, šče v 2017 roci žurnalisty ta entuziasty prodemonstruvaly, ščo naduryty systemy rozpiznavannja golosu možna — i ce ne tak skladno, jak zajavljajuť їhni vyrobnyky:
Dejaki brendy naviť počaly zlovžyvaty cymy možlyvostjamy. Burger King spryčynyla spravžnju veremiju v interneti, koly zapustyla reklamu iz vbudovanoju frazoju «O.K., Google, what is the Whopper burger?» Prystroї na osnovi Android iz uvimknenym golosovym pošukom počynaly pislja cijeї frazy čytaty vgolos vidpovidnu stattju z Vikipediї. Reklamnyj rolyk dovelosja vylučyty pislja togo, jak korystuvači počaly zarady smihu redaguvaty vidpovidnu stattju pro burgery u Vikipediї nezličennu kiľkisť raziv. Zgodom shožyj trjuk povtoryly tvorci vidomogo animacijnogo serialu South Park, pobuduvavšy cilyj epizod dovkola golosovyh komand, ščo zmusyly cyfrovyh pomičnykiv znahodyty čy pokazuvaty / ozvučuvaty neprystojnosti (pevno, gljadači takogo ne očikuvaly).
Jurysprudencija vidstaje vid tehnologičnogo progresu
Naviť u SŠA, de kiľkisť golosovyh asystentiv zrostaje dovoli strimko, nemaje poky ščo zakonodavstva stosovno peredači nečutnyh komand dlja ljudśkogo vuha čy cyfrovyh uljuvljuvačiv zvukovogo ta uľtra- / infrazvukovogo sygnalu. Zašyfrovani čy pryhovani zvukovi poslannja zaboroneno peredavaty u televizijnomu ta radio-efiri, ale v zakonah nemaje žodnogo slova pro cyfrovi prystroї, jakymy kerujuť za dopomogoju golosu čy zvuku. Vtručannja u pryvatne žyttja čerez zašyfrovani poslannja teoretyčno može rozgljadatysja v sudah, ale tut vynykaje pravova kolizija, bo u mašyn (jakymy i je smart-kolonky ta cyfrovi golosovi pomičnyky) nemaje žodnogo pryvatnogo žyttja. jak u ljudej.
Teper cja tehnologija šče biľše vyperedžaje zakon. U 2017 roci doslidnyky z Prinstonśkogo universytetu ta kytajśkogo universytetu Čžeczjan prodemonstruvaly, ščo systemy rozpiznavannja golosu možna aktyvuvaty, vykorystovujučy častoty, nečutni dlja ljudśkogo vuha. Ataka spočatku pryglušyla telefon, ščoby vlasnyk takož ne počuv vidpovidej systemy.
Ce poperedžennja bulo pidtverdženo u kvitni 2017-go, koly doslidnyky z Universytetu Illinojsu v Urbani-Šampejn prodemonstruvaly uľtrazvukovi ataky na vidstani blyźko 15-20 m. Hoča komandy učasnykiv eksperymentu ne mogly pronyknuty kriź stiny, vony mogly keruvaty smart-prystrojamy čerez vidkryti vikna. Pry ćomu sami vony perebuvaly zzovni budivli. Takož grupa kytajśkyh ta amerykanśkyh doslidnykiv u 2018-mu prodemonstruvaly možlyvisť vbudovuvaty komandy v pisni, jaki transljujuťsja po radio čy čerez potokovi videoservisy pid čas perebuvannja v ćomu prymiščenni cyfrovyh golosovyh pomičnykiv.
Ščo bude dali
Na samyh lyše smart-kolonkah doslidnyky ne zupynjajuťsja. Neščodavno Karlini ta jogo kolegy z Berkli vbuduvaly komandy v audio, jake rozpiznaje programne zabezpečennja Mozilla DeepSpeech. Vono perevodyť golos u tekst i navpaky — i je platformoju na osnovi vidkrytogo kodu. Za dopomogoju tehnologiї pryhovuvannja vdalosja zamaskuvaty komandu «O.K. Google, browse to evil.com» u skazanu frazu «Without the data set, the article is useless». Jak bačymo, pro žodne «ljudśke vuho» čy zdatnisť rozpiznaty pryhovanyj sens tut ne jdeťsja. Grupa doslidnykiv iz Berkli takož vbuduvala komandu v muzyčni fajly, vključajučy čotyry sekundy z «Rekviema» Verdi.
Jak reaguvatymuť vyrobnyky prystroїv na podibni vyklyky, bude zaležaty vid togo, naskiľky vidriznjatymuťsja parametry prostoty ta bezpeky v kožnomu vypadku. Z cym pogodžujeťsja j odyn iz peršyh doslidnykiv problemy pryhovanogo keruvannja golosovymy pomičnykamy Taviš Vajďja. Ce vin napysav odnu iz peršyh robit, ščo doslidžuvaly audioataky — i nazvav її Cocaine Noodles. Rič u tim ščo frazu «cocaine noodles» golosovi pomičnyky interpretuvaly jak «O.K., Google». Usi doslidnyky shodjaťsja v odnomu: їhńoju metoju ne je zavdaty komuś škody, navpaky — vony hočuť pokazaty, ščo vrazlyvosti je, i їh slid čymskoriše vypravyty.