
Онлайн книга «Искусственный интеллект на службе бизнеса»
Интеллект это или нет, но в целом переход от детерминированного программирования к вероятностному произошел скачком, хотя и параллельно с прогрессом в общественных и естественных науках. Канадский философ Ян Макдугалл Хакинг в книге «Укрощение случайности» сказал, что до начала XIX века вероятность была прерогативой азартных игроков [31]. С наступлением XIX века и ростом государственной статистики зарождающаяся вероятностная математика стала применимой к общественным наукам. В ХХ веке произошло фундаментальное изменение нашего понимания физики, и мы перешли от детерминистских ньютоновских взглядов к неопределенности квантовой механики. Важнейший прорыв XXI века в IT сравним с предыдущими достижениями в социальных и естественных науках: осознание того, что алгоритмы лучше работают с вероятностной структурой данных. Выводы
• Цели машинного обучения отличаются от статистических. Статистика стремится к точности среднего показателя, в машинном обучении этого не требуется. Его цель – практическая эффективность. Смещение прогнозов допускалось при условии, что они были точнее (что стало возможным из-за увеличения мощности компьютеров). Это дало ученым простор для экспериментов и быстро принесло улучшения, благодаря которым стало возможным воспользоваться преимуществами большого объема данных и быстродействующих компьютеров, появившихся в последние годы. • В традиционных статистических методах для спецификаций модели необходимы сформулированные гипотезы или, по крайней мере, человеческая интуиция. Машинное обучение не требует предварительной спецификации и вмещает в себя эквиваленты гораздо более сложных моделей с большим количеством взаимодействий между переменными. • Прогресс машинного обучения называют достижением ИИ, поскольку: • основанные на данном методе системы учатся и постепенно совершенствуются; • системы выдают значительно более точные прогнозы, чем другие при аналогичных условиях, а некоторые специалисты считают прогностику базисом интеллекта; • повышенная точность прогнозов таких систем позволяет им выполнять задачи, такие как языковой перевод и навигация, ранее считавшиеся прерогативой исключительно человеческого интеллекта. • По поводу связи между прогнозом и интеллектом мы придерживаемся агностической точки зрения. Ни одно из наших заключений не основано на позиции, утверждающей, что достижения прогностики представляют собой интеллектуальные достижения. Мы рассматриваем последствия удешевления прогнозов, а не интеллекта. Глава 3. Данные – это новая нефть
Хэл Вариан, ведущий экономист Google, в обращении к Роберту Гойцуэте из Coca-Cola сказал в 2013 году: «Миллиард лет назад появился современный “человек разумный”. Миллиард минут назад зародилось христианство. Миллиард секунд назад выпустили IBM PC. А миллиард поисковых запросов назад… наступило сегодняшнее утро» [32]. И Google – не единственная компания с неохватным объемом данных. Для всех, от гигантов вроде Facebook и Microsoft до местных государственных органов и стартапов, сбор данных стал проще и дешевле, чем когда-либо. Эти данные обладают ценностью. Миллиарды поисковых запросов – это миллиарды строк данных, с которыми Google совершенствует свои службы. Данные даже называют «новой нефтью». Прогностические машины полагаются на данные. Чем их больше и чем они лучше, тем качественнее прогнозы. Выражаясь языком экономистов, данные остаются ключевым компонентом прогнозирования, их ценность растет с удешевлением прогнозов. В ИИ данные представлены в трех ипостасях. Первая – входные данные, которые загружаются в алгоритмы и используются для прогнозирования. Вторая – обучающие данные, необходимые для создания самих алгоритмов; с их помощью ИИ учится прогнозировать в реальной среде. И наконец, существуют также данные обратной связи, призванные постепенно улучшить эффективность алгоритмов. В некоторых случаях виды данных пересекаются, например одна и та же информация выполняет все три роли. Но сбор данных может стоить дорого, следовательно, объем капиталовложений рассчитывается исходя из компромисса между выгодой от получения дополнительных данных и затратами на них. Чтобы принять оптимальное решение по инвестированию средств в данные, необходимо понимать, как машины их используют. Для прогностики необходимы данные
До недавнего ажиотажа вокруг ИИ возникало много шумихи по поводу большого объема данных. Их разнообразие, количество и качество заметно выросли за последние 20 лет. Изображения и тексты переводят в цифровую форму, чтобы машины могли их анализировать. Все оснащено датчиками. Такой активный интерес основан на возможности этих данных помочь людям снизить неопределенность и оставаться в курсе происходящего. Рассмотрим улучшенные датчики сердечного ритма. Многочисленные компании и некоммерческие организации с медицинскими названиями, такие как AliveCor и Cardiio, разрабатывают продукты, использующие данные о сердечном ритме. Например, стартап Cardiogram сделал приложение для iPhone, которое получает показатели сердечного ритма от Apple Watch и выдает огромный объем информации: посекундные замеры частоты сердцебиения. Пользователи могут отслеживать, не подскакивает ли она в течение дня и повысилась или уменьшилась за год или даже за десять лет. Изобилие данных и возможности прогностических машин открывают подобным разработкам широкие перспективы. Научные и производственные исследователи продемонстрировали, как смартфоны прогнозируют нарушения сердечного ритма («мерцательную аритмию», как говорят медики) [33]. Продукты, разрабатываемые Cardiogram, AliveCor и Cardiio с помощью прогностических машин, используют данные о сердечном ритме, необходимые для диагностики кардиологических заболеваний. Общий подход компаний заключается в том, чтобы на основе выявленных данных прогнозировать информацию о наличии у пользователя отклонений в работе сердца. Без входных данных прогностические машины не смогут работать, поэтому их называют просто «данными», в отличие от обучающих и данных обратной связи. |