Базы лиц
Существуют наборы фотографий людей, предназначенные для обучения систем распознавания лиц. К наиболее известным можно отнести Microsoft Celeb (8,2 млн снимков, собранных из открытых источников), Duke MTMC (2 млн снимков), Brainwash (фотографии посетителей одноименного кафе в Сан-Франциско), Oxford Town Centre (анализ записей камеры наблюдения
[388]) и др.
[389] Компании и учебные заведения, отвечающие за сбор таких баз данных, утверждают, что на снимках зафиксированы лишь публичные фигуры, хотя в действительности там обнаружены фотографии людей, которые вряд ли ожидали себя увидеть в такой базе, в том числе журналистов, которые пишут об ИБ
[390]. Многие базы данных собираются без ведома людей, чьи лица попали в кадр, и используются такими компаниями, как SenseNets, для слежки за людьми. Крупные социальные сети, например Facebook, Qzone, Weibo или «ВКонтакте», стремятся собирать как можно больше информации о своих пользователях. Вероятно, поэтому именно такие компании обладают крупнейшими базами лиц (вкупе с остальными персональными данными пользователей)
[391],
[392].
Среди технологий распознавания лиц можно выявить две основные:
■ «Классическая» – используется тот же принцип, что в дактилоскопических исследованиях, когда нужно заранее снять эталонные отпечатки пальцев, а затем сравнивать с ними все получаемые в дальнейшем. Здесь сравниваются некие ранее сохраненные маркеры: расстояние между глазами, форма носа или губ и т. п. Для распознавания нужны качественные фотографии, сделанные при хорошем освещении. Получить их можно, например, при сканировании документов в центре государственных услуг или при фотографировании для оформления, скажем, загранпаспорта. Такие системы ошибаются часто: достаточно не смотреть в камеру, надеть бейсболку, светоотражающую одежду или солнцезащитные очки.
■ Новая технология GaussianFace, развиваемая крупнейшими компаниями, такими как Facebook и Google, включает алгоритмы машинного обучения и использует все доступные в интернете источники информации. В этом случае маркеры не нужны, так как система учитывает все особенности человека: форму тела, походку, осанку, одежду, татуировки и т. п. Чем больше фотографий человека опубликовано в интернете, тем точнее будет результат распознавания. Даже если человек не пользуется социальными сетями, его фотоизображения могут публиковать друзья и близкие. Также могут использоваться источники в государственных и коммерческих структурах со сканами его документов
[393].
Как работает система распознавания лиц?
Рассмотрим на примере используемой в Китае Dragonfly Eye System компании Yitu. В основе системы – облачная база данных с миллиардами цифровых портретов людей и самообучающаяся технология распознавания лиц по набору ключевых зон и параметров человеческого лица. Когда в поле зрения видеокамеры, подключенной к системе, оказывается человек, она делает несколько снимков и выбирает наиболее удачный. Затем система с помощью машинных алгоритмов определяет на снимке область лица и улучшает его изображение, используя фильтры. Далее изображение лица преобразуется в облако точек с рейтингом уникальности каждой характеристики лица: цвет и форма прически, высота лба, форма и цвет глаз, губ, носа и т. п. Благодаря этому в следующий раз система идентифицирует человека, даже если тот отрастит бороду, изменит прическу, наденет очки или медицинскую маску. Полученное облако точек сверяется с имеющимися в базе данных, и на основе некоего порогового значения (совпадения) определяются похожие лица. Вычисление идентификатора и сверка с базой данных занимает не более полутора секунд. Используя множество камер, можно проследить маршрут конкретного человека, узнать время пребывания в каждой точке маршрута, а также увидеть, что ранее делал тот, за кем ведется наблюдение. За исключением распознавания лиц стариков и детей до 3 лет, система справляется со своей задачей превосходно, в частности благодаря актуальности базы данных: в Китае невозможно получить паспорт, водительское удостоверение и даже приобрести SIM-карту без предоставления биометрических данных
[394].
Кейс В 2016 г. петербургский фотограф Егор Цветков провел эксперимент по идентификации и поиску информации о людях, сидящих перед ним в вагоне метро. Благодаря тому, что многие регистрируют аккаунты в социальных сетях и не закрывают профили, во многих случаях за секунды удавалось немало узнать о жизни только что сфотографированного человека. Проект доступен по адресу: https://birdinflight.com/ru/vdohnovenie/fotoproect/06042016-face-big-data.html.
Примечание. Многие камеры видеонаблюдения снабжены инфракрасной подсветкой, позволяющей камере «видеть» в темноте.
Весь процесс идентификации людей на основе технологии распознавания лиц происходит автоматически: вручную просто невозможно обработать поток данных такого объема, да еще и в реальном времени. Алгоритм обращает внимание операторов системы только на тех людей, чьи фамилии занесены в базу данных правоохранительных органов, и отсеивает всех остальных, причем различает даже близнецов
[395].
Подробная статья о том, как работают системы распознавания лиц, доступна по адресу: https://securityrussia.com/blog/face-recognition.html.
Наиболее агрессивно технологии распознавания лиц внедряются в Китае. К 2019 г. в этой стране системы распознавания лиц были установлены в самых разных местах: на улицах городов, в магазинах, отелях, кафе и ресторанах, образовательных учреждениях, детских садах, зоопарках
[396], транспорте, на банкоматах и даже в туалетах
[397] и на дверных замках. В марте 2020 г. сообщалось о планах властей КНР сформировать национальную систему, которая позволит идентифицировать человека за несколько секунд, получая данные с 626 млн камер
[398]. В марте 2019-го в китайском городе Шэньчжэне в тестовом режиме начал работать проект по распознаванию лиц пассажиров для автоматического списания денег за проезд с привязанного к профилю банковского счета
[399]. В декабре 2019 г. в Китае вступил в силу закон об обязательном распознавании лиц покупателей SIM-карт
[400]. Кроме того, китайские полицейские носят специальные темные очки с функцией распознавания лиц
[401].