Думаете, ваш смартфон просто делает снимки, когда вы фотографируетесь или снимаете видео? Но это не так. Камера вашего устройства не только снимает изображение, она также «фиксирует звук», даже если микрофон отключен. В каждой фотографии и каждом беззвучном видеоролике зашифрован акустический след момента съемки.
Звучит как научная фантастика? Однако последние исследования показали, что это реальность…
Ученые разработали методику извлечения звуков из статических изображений или беззвучных видео, снятых камерами смартфонов.
Как это работает?
Все просто. Современные камеры в смартфонах имеют специальную систему стабилизации изображения, чтобы фотографии не получались размытыми. Такая система состоит из маленьких пружинок, которые держат линзу и подстраиваются под движения руки. Но оказывается, что эти пружинки реагируют не только на движения, а также на звуковые волны. Когда кто-то говорит рядом с камерой, он создает вибрации в пружинках и меняет угол падения света на линзу. Данный эффект практически незаметен для обычного глаза, но современные технологии позволяют извлечь из этих данных много интересного.
Исследователи создали технику Side Eye, которая анализирует подобные искажения с помощью алгоритмов искусственного интеллекта, и позволяет восстановить из них акустическую информацию, сопровождающую момент съемки.
Учёные поясняют, что камеры смартфонов создают специальный оптико-акустический побочный канал, который не требует прямой видимости или присутствия объекта в поле зрения камеры, однако позволяет считать эту информацию с высокой точностью. Это значит, что ваш смартфон может слышать то, что вы говорите, даже если вы его положите на стол экраном вниз или спрячете в карман. А хитроумный алгоритм способен с высокой точностью распознать, все что таким образом «услышала» камера.
Детали исследования
Эксперты смоделировали ситуацию, когда злоумышленник запустил вредоносное приложение на смартфоне жертвы, но не смог получить доступ к микрофону. Предполагалось, что киберпреступник имеет возможность снимать видео с помощью камеры пользователя и заранее может получить образцы речи жертв, чтобы использовать их для обучения системы искусственного интеллекта.
Используя набор данных из 10 000 образцов произнесения цифр, исследователи обучили алгоритм и настроили его на выполнение различных задач. В экспериментах ученые использовали устройства Google Pixel, Samsung Galaxy и Apple iPhone. Согласно результатам исследования, точность восстановления звука в технике Side Eye варьировалась от 80% до 99% в зависимости от количества и сложности восстановленного звука, а также позволяла определить пол говорящего.
Исследователи отмечают, что пока Side Eye не работает с человеческими голосами, а только с громкими динамиками. Но кто знает, что будет в будущем? По мнению ученых быстрое развитие технологий позволит злоумышленникам уже совсем скоро «услышать» все, что угодно, из любой фотографии или видео. Причем если киберпреступники будут использовать данный вид атаки в дополнение к другим, то шансы на успех многократно возрастут.
Как защититься от угрозы?
Пользователи смартфонов уверены, что отключение доступа к микрофону смартфона автоматически защитит их от кражи звуковой информации. Они легко предоставляют доступ к приложениям камеры, просто потому что не знают о возможности акустического подслушивания. Однако если приложение вдруг окажется вредоносным таких пользователей в будущем ждут большие неприятности.
Исследователи считают, что хорошим способом защиты станет использование камер более низкого качества с более примитивным механизмом. Такой подход способен сильно ограничить потенциальную утечку информации, связанную с этим типом атаки. По мнению экспертов, также должно помочь физическое удаление смартфонов от говорящих и добавление виброизолирующих материалов между телефоном и передающей поверхностью. Кроме того, производители смартфонов могут смягчить атаку с помощью более высокой частоты срабатывания затвора, чего можно добиться как на программном, так и аппаратном уровне.