This is the prediction:
[0011100010001111011001101011100010100001010110001110111000110001001001100010010110000011111110001110100010000000111011011010010100100100100000000110101001001101111101100001010110110010101000001010100001010000101101001010101110010001001001111110001010100000001000110000000010110000011010001010100010000000110110010011000000011010001011000001000101000110001010010111100010010011000100010100000110010100101000001111001000]
This is the solution in toto:
Survived
892 0
893 0
894 1
895 1
896 1
897 0
898 0
899 0
900 1
901 0
902 0
903 0
904 1
905 1
906 1
907 1
908 0
909 1
910 1
911 0
912 0
913 1
914 1
915 0
916 1
917 0
918 1
919 1
920 1
921 0
…..
1280 0
1281 0
1282 0
1283 1
1284 1
1285 0
1286 0
1287 1
1288 0
1289 1
1290 0
1291 0
1292 1
1293 0
1294 1
1295 0
1296 0
1297 0
1298 0
1299 0
1300 1
1301 1
1302 1
1303 1
1304 0
1305 0
1306 1
1307 0
1308 0
1309 0
[418 rows x 1 columns]
This is the solution shape:
(418, 1)
Новая колонка с информацией о выживших содержит прогностические данные о 418 пассажирах из тестового массива. Можем сохранить полученные результаты в. CSV-файле под названием my_solution_one.csv, загрузить файл на DataCamp и выяснить, что точность наших прогнозов составляет 97 %. Ура! Мы только что обучили машину. И, когда кто-то говорит, что пользовался «искусственным интеллектом для принятия решения», обычно это означает «пользовался машинным обучением» и сделал примерно то же, что и мы сейчас.
Мы создали колонку с данными о выживших и можем с вероятностью 97 % сказать, что результаты точны. Нам удалось выяснить, что стоимость проезда имела критическое значение в случае математического анализа данных о выживших на «Титанике». И это был слабый ИИ. Он оказался совсем не страшным, способным привести нас к предположению, что компьютерный сверхинтеллект захватит мир. «Это всего лишь статистические модели, такие же, какие используют в компании Google для прогнозирования ходов в играх или которые ваш телефон использует, чтобы сделать предположение о том, что именно вы сказали, чтобы перевести голосовой запрос в текст, – именно так описал ИИ Закари Липтон, профессор Университета Карнеги – Меллона для журнала Register. – Они не умнее миски с лапшой»
[91].
Программисту легко писать алгоритм: он создается, используется и вроде работает. Никто не отслеживает его работу. Возможно, он попытается усовершенствовать точность прогнозов, слегка изменив параметры. Попытается добиться наилучшего результата. А затем перейдет к другой задаче.
Тем временем во внешнем мире за каждым результатом стоят определенные последствия. И неразумно было бы в действительности полагать, что в морских крушениях выживают те, кто платит больше. Хотя какой-нибудь управленец вполне мог бы посчитать такой вывод статистически оправданным. При прогнозировании страховых тарифов можно сказать, что люди, способные оплачивать более дорогие билеты, вероятнее всего, выживут в крушениях, связанных со столкновениями с айсбергами, и, таким образом, относятся к категории малого риска ранней выплаты. Эти люди богаче тех, кто не может себе позволить дорогой билет. Значит, у более обеспеченных граждан может быть дешевый страховой тариф. А это плохо! Ведь страховки нужны как раз для того, чтобы поровну распределить риск между широким спектром людей. Так зарабатывают деньги наши страховые компании, но это никак не способствует чему-то по-настоящему хорошему.
Похожие компьютерные технологии используются для оптимизации цены или узкого сегментирования покупателей, в результате которого разным людям предлагается разная цена. Оптимизация цены используется в самых разных отраслях – от страховой до туристической, а результаты нередко приводят к ценовой дискриминации. Согласно анализу, проведенному в 2017 г. ProPublica и Consumer Reports в Калифорнии, Иллинойсе, Техасе и Миссури, страховые тарифы на жилье, предложенные ключевыми компаниями жителям районов компактного проживания меньшинств, были на 30 % выше тарифов в других районах со сходными оценками аварийности
[92]. В 2014 г. аналитики The Wall Street Journal выяснили, что стоимость одного и того же степлера на staples.com различается для разных покупателей – в зависимости от предполагаемого почтового индекса пользователя она была выше или ниже
[93]. Кристо Уилсон, Дэвид Лизер вместе с коллегами из Северо-Восточного университета выяснили, что разные цены предлагали покупателям homedepot.com и на туристических сайтах, в зависимости от того, просматривали ли они сайт с мобильных устройств или с компьютеров
[94]. Компания Amazon признала, что в 2000-х гг. экспериментировала с ценами подобным образом. Джеф Безос, основатель компании, принес свои извинения, назвав это «ошибкой»
[95].