Книга Искусственный интеллект на службе бизнеса, страница 12. Автор книги Джошуа Ганс, Аджей Агравал, Ави Голдфарб

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Искусственный интеллект на службе бизнеса»

Cтраница 12

Интеллект это или нет, но в целом переход от детерминированного программирования к вероятностному произошел скачком, хотя и параллельно с прогрессом в общественных и естественных науках. Канадский философ Ян Макдугалл Хакинг в книге «Укрощение случайности» сказал, что до начала XIX века вероятность была прерогативой азартных игроков [31]. С наступлением XIX века и ростом государственной статистики зарождающаяся вероятностная математика стала применимой к общественным наукам. В ХХ веке произошло фундаментальное изменение нашего понимания физики, и мы перешли от детерминистских ньютоновских взглядов к неопределенности квантовой механики. Важнейший прорыв XXI века в IT сравним с предыдущими достижениями в социальных и естественных науках: осознание того, что алгоритмы лучше работают с вероятностной структурой данных.

Выводы

• Цели машинного обучения отличаются от статистических. Статистика стремится к точности среднего показателя, в машинном обучении этого не требуется. Его цель – практическая эффективность. Смещение прогнозов допускалось при условии, что они были точнее (что стало возможным из-за увеличения мощности компьютеров). Это дало ученым простор для экспериментов и быстро принесло улучшения, благодаря которым стало возможным воспользоваться преимуществами большого объема данных и быстродействующих компьютеров, появившихся в последние годы.

• В традиционных статистических методах для спецификаций модели необходимы сформулированные гипотезы или, по крайней мере, человеческая интуиция. Машинное обучение не требует предварительной спецификации и вмещает в себя эквиваленты гораздо более сложных моделей с большим количеством взаимодействий между переменными.

• Прогресс машинного обучения называют достижением ИИ, поскольку:

• основанные на данном методе системы учатся и постепенно совершенствуются;

• системы выдают значительно более точные прогнозы, чем другие при аналогичных условиях, а некоторые специалисты считают прогностику базисом интеллекта;

• повышенная точность прогнозов таких систем позволяет им выполнять задачи, такие как языковой перевод и навигация, ранее считавшиеся прерогативой исключительно человеческого интеллекта.

• По поводу связи между прогнозом и интеллектом мы придерживаемся агностической точки зрения. Ни одно из наших заключений не основано на позиции, утверждающей, что достижения прогностики представляют собой интеллектуальные достижения. Мы рассматриваем последствия удешевления прогнозов, а не интеллекта.

Глава 3. Данные – это новая нефть

Хэл Вариан, ведущий экономист Google, в обращении к Роберту Гойцуэте из Coca-Cola сказал в 2013 году: «Миллиард лет назад появился современный “человек разумный”. Миллиард минут назад зародилось христианство. Миллиард секунд назад выпустили IBM PC. А миллиард поисковых запросов назад… наступило сегодняшнее утро» [32]. И Google – не единственная компания с неохватным объемом данных. Для всех, от гигантов вроде Facebook и Microsoft до местных государственных органов и стартапов, сбор данных стал проще и дешевле, чем когда-либо. Эти данные обладают ценностью. Миллиарды поисковых запросов – это миллиарды строк данных, с которыми Google совершенствует свои службы. Данные даже называют «новой нефтью».

Прогностические машины полагаются на данные. Чем их больше и чем они лучше, тем качественнее прогнозы. Выражаясь языком экономистов, данные остаются ключевым компонентом прогнозирования, их ценность растет с удешевлением прогнозов.

В ИИ данные представлены в трех ипостасях. Первая – входные данные, которые загружаются в алгоритмы и используются для прогнозирования. Вторая – обучающие данные, необходимые для создания самих алгоритмов; с их помощью ИИ учится прогнозировать в реальной среде. И наконец, существуют также данные обратной связи, призванные постепенно улучшить эффективность алгоритмов. В некоторых случаях виды данных пересекаются, например одна и та же информация выполняет все три роли.

Но сбор данных может стоить дорого, следовательно, объем капиталовложений рассчитывается исходя из компромисса между выгодой от получения дополнительных данных и затратами на них. Чтобы принять оптимальное решение по инвестированию средств в данные, необходимо понимать, как машины их используют.

Для прогностики необходимы данные

До недавнего ажиотажа вокруг ИИ возникало много шумихи по поводу большого объема данных. Их разнообразие, количество и качество заметно выросли за последние 20 лет. Изображения и тексты переводят в цифровую форму, чтобы машины могли их анализировать. Все оснащено датчиками. Такой активный интерес основан на возможности этих данных помочь людям снизить неопределенность и оставаться в курсе происходящего.

Рассмотрим улучшенные датчики сердечного ритма. Многочисленные компании и некоммерческие организации с медицинскими названиями, такие как AliveCor и Cardiio, разрабатывают продукты, использующие данные о сердечном ритме. Например, стартап Cardiogram сделал приложение для iPhone, которое получает показатели сердечного ритма от Apple Watch и выдает огромный объем информации: посекундные замеры частоты сердцебиения. Пользователи могут отслеживать, не подскакивает ли она в течение дня и повысилась или уменьшилась за год или даже за десять лет.

Изобилие данных и возможности прогностических машин открывают подобным разработкам широкие перспективы. Научные и производственные исследователи продемонстрировали, как смартфоны прогнозируют нарушения сердечного ритма («мерцательную аритмию», как говорят медики) [33]. Продукты, разрабатываемые Cardiogram, AliveCor и Cardiio с помощью прогностических машин, используют данные о сердечном ритме, необходимые для диагностики кардиологических заболеваний. Общий подход компаний заключается в том, чтобы на основе выявленных данных прогнозировать информацию о наличии у пользователя отклонений в работе сердца.

Без входных данных прогностические машины не смогут работать, поэтому их называют просто «данными», в отличие от обучающих и данных обратной связи.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация