Книга Невидимые женщины. Почему мы живем в мире, удобном только для мужчин. Неравноправие, основанное на данных, страница 63. Автор книги Кэролайн Криадо Перес

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Невидимые женщины. Почему мы живем в мире, удобном только для мужчин. Неравноправие, основанное на данных»

Cтраница 63

По мере совершенствования систем распознавания речи расширяется их использование в самых разных областях, включая медицину, где ошибки могут обойтись очень дорого. В статье 2016 г. представлены результаты анализа случайной выборки, включающей сотню речевых команд, отданных врачами скорой помощи во время работы с пациентами. Оказалось, что 15 % команд были распознаны неверно, причем ошибки были очень серьезными, «способными привести к недоразумениям, в результате которых могли пострадать пациенты» [691]. К сожалению, авторы работы не привели данных в разбивке медиков по половому признаку, но данные, которыми мы располагаем, показывают, что при распознавании женских команд системы ошибаются чаще, чем при распознавании мужских [692]. Доктор наук Сайед Али, ведущий автор одного из исследований применения голосовых систем в медицине, отмечает, что «практические выводы» ученых таковы: женщинам, «видимо, придется прикладывать больше усилий», чем мужчинам, чтобы «системы [распознавания речевых команд] работали нормально» [693]. Рейчел Татман согласна с этим выводом: «Факт тот, что современные системы распознают мужские команды лучше, чем женские. Соответственно, женщинам труднее работать. Даже если для исправления ошибки требуется всего секунда, эти секунды складываются в дни и недели, которые нашим коллегам-мужчинам не приходится попусту тратить на возню с плохо работающей техникой».

Женщины всего мира, которых приводят в ярость несовершенные голосовые системы, радуйтесь! Том Шальк, вице-президент ATX – компании, поставляющей голосовые навигаторы для автомобилей, – предложил новаторское решение, способное устранить «многие недостатки, связанные с распознаванием женской речи» [694]. По его мнению, женщинам нужна всего лишь «тщательная подготовка» и, конечно, «готовность учиться». Вот только, сокрушается Том Шальк, такой готовности у них нет. Почему в Бангладеш упрямые матери семейств покупают неправильные плиты? Почему автоледи упорно покупают автомобили в напрасной надежде, что разработчики систем голосового управления сделают продукт, который будет их слушаться? Ведь совершенно ясно, что решать проблему должны не инженеры, не программисты, а сами женщины. Ну почему женщина не может быть больше похожа на мужчину?

Рейчел Татман отметает предположение, что проблема кроется в женской речи, а не в технологии, неспособной ее распознавать. Результаты исследований показывают, что «женская речь намного более разборчива, чем мужская» [695], – возможно, потому, что женщины, как правило, более протяжно произносят гласные [696] и говорят медленнее мужчин [697]. Мужчины, напротив, «чаще спотыкаются в разговоре, проглатывают гласные и произносят слова неправильно или небрежно» [698]. С учетом этого голосовые системы должны были бы лучше распознавать женские голоса – и действительно, Рейчел Татман пишет, что ей самой «доводилось обучать классификаторы [699] на записях женской речи, и они работали прекрасно, большое им спасибо».

Разумеется, виной всему вовсе не особенности женской речи. Виноват наш старый друг, дефицит гендерных данных. Голосовые технологии создаются на основе баз данных аудиофайлов с записями речи, так называемых речевых корпусов. И в этих базах данных преобладают записи мужской речи, во всяком случае, насколько мы можем судить, ведь в большинстве речевых корпусов записи не разбиты по половому признаку, что само по себе уже является пробелом в данных [700]. Когда Рейчел Татман сравнила доли записей мужской и женской речи в речевых корпусах, оказалось, что только в TIMIT («главном и наиболее известном речевом корпусе Консорциума лингвистических данных») данные разбиты по половому признаку. При этом на долю записей мужской речи приходилось 69 % общего количества записей. Но, вопреки выводам Рейчел Татман, найти записи женских голосов можно: как указано на сайте Британского национального корпуса [701], эта база данных является гендерно сбалансированной [702].

Речевые корпуса – не единственные базы данных, используемые для разработки алгоритмов, страдающих от «мужского перекоса». Корпуса текстов (включающие самые разные тексты – от романов до газетных статей и стандартных учебников) используются при разработке программ для переводов, сканирования резюме соискателей при приеме на работу и поиска в сети. Они тоже страдают от нехватки гендерных данных. Прошерстив Британский национальный корпус [703] (100 млн слов из различных текстов конца XX в.), я обнаружила, что местоимения мужского рода всегда выскакивают в результатах поиска почти вдвое чаще местоимений женского рода [704]. При этом соотношение местоимений мужского и женского рода в Корпусе современного американского английского языка, содержащем 520 млн слов, также составляет 2:1, хотя он включает более современные тексты (вплоть до 2015 г.) [705]. Алгоритмы, разрабатываемые на основе таких корпусов, страдающих от нехватки гендерных данных, создают впечатление, что в мире действительно преобладают мужчины.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация