Диксон и Коулз решили начать с главного вопроса: какая команда победит? Но прежде чем пытаться спрогнозировать конечный результат, они попробовали предсказать, сколько голов будет забито в матче. Допустим, предположили ученые, каждая команда забивает очередной гол через определенный промежуток времени. Вероятность гола в этом случае не зависит от того, что происходило на футбольном поле непосредственно перед голом. В науке подобную череду событий называют процессом Пуассона. Названный в честь физика Симеона Пуассона, он проявляется во многих аспектах повседневной жизни. Исследователи используют процесс Пуассона для моделирования распределения звонков на многоканальном телефоне, распада радиоактивных веществ и даже активности нейронов. Когда мы говорим, что события включены в процесс Пуассона, это значит, что они происходят с определенным интервалом, каждый из которых независим от остальных. Если в первом тайме не было забито ни одного гола, это не повышает вероятность того, что гол будет забит во втором.
Диксон и Коулз смоделировали футбольный матч как процесс Пуассона, предположив, таким образом, что голы забиваются с определенным интервалом на протяжении всей игры. Но как от этого предположения перейти к прогнозу финального результата? Количество забитых в матче мячей, вероятно, зависит от того, какие команды играют. Сколько же голов можно ожидать от каждой команды?
Еще в начале своей статьи от 1997 года Коулз и Диксон определили набор действий, которые необходимо совершить для построения модели игры в рамках футбольной лиги. Прежде всего, необходимо измерить квалификацию каждой команды – например, придумав некую систему рейтинга. Можно присваивать команде определенное количество очков после каждого матча, а по истечении определенного срока суммировать их, скажем, три очка за победу, одно – за ничью и ни одного – в случае поражения. Представив квалификацию команды в виде числа, мы увидим, какая команда играет хорошо. Впрочем, на основе этого рейтинга далеко не всегда можно сделать успешный прогноз. В 2009 году появилось исследование Кристофера Лейтнера и его коллег из Венского университета экономики и бизнеса, ставшее наглядной иллюстрацией к проблеме: ученые проанализировали прогнозы на футбольный Еврокубок 2008 года с опорой на рейтинги ФИФА и пришли к выводу, что оценка букмекеров была гораздо более точной. Для того чтобы заработать деньги на футбольном тотализаторе, одним критерием в оценке команды не обойдешься.
Диксон и Коулз предложили разбить квалификацию команды на две составляющие: атака и защита. Коэффициент атаки показывает способность команды забивать голы, а слабость в защите свидетельствует о пробелах в умении их отражать.
Присвоив команде хозяев коэффициент силы атаки, а команде гостей – коэффициент слабости защиты, Диксон и Коулз пришли к выводу, что ожидаемое количество голов команды-хозяйки можно предсказать на основе учета трех факторов:
Фактор игры на домашнем поле означает важное преимущество – «дома» результаты, как правило, лучше. Точно так же ожидаемое количество голов, забитых гостями, равно коэффициенту силы атаки команды-гостя, помноженному на коэффициент слабости защиты команды-хозяйки (команда-гость не имеет дополнительных преимуществ).
Для оценки мастерства команды в атаке и защите Диксон и Коулз на протяжении нескольких лет собирали данные о проведенных в Англии футбольных матчах четырех высших дивизионов, куда входили 92 команды. Так как модель включала коэффициент атаки и защиты для каждой команды плюс дополнительный фактор преимущества игры на домашнем поле, общее количество оцениваемых факторов составило 185. Если каждая команда играла с другой командой одинаковое количество матчей, расчеты были достаточно простыми. Однако переходы команд в другую лигу (как с повышением, так и с понижением, не говоря уже о розыгрышах кубков) означали, что какие-то команды будут встречаться друг с другом чаще остальных. Так же как и в случае скачек на «Хеппи-Вэлли», количество неизвестной информации было слишком велико, чтобы расчет оказался верен. Для оценки каждого из 185 факторов необходимо было обратиться за помощью к вычислительным методам, подобным тем, что были разработаны учеными в Лос-Аламосе.
Диксон и Коулз использовали свою модель для составления прогнозов матчей, сыгранных в 1995–1996 годах, и обнаружили, что их расчеты во многом совпадали с реальными результатами. Но будет ли модель столь же надежна, если делать ставки? Они протестировали ее на всех матчах, руководствуясь простым правилом: если модель обещает позитивный результат с вероятностью на 10 % выше, чем у букмекера, – надо ставить. Модель и беттинговая стратегия ученых не отличались большой сложностью, но достоверность их прогнозов оказалась выше, чем у букмекеров.
Накануне опубликования статьи Диксон и Коулз прекратили научное сотрудничество. Диксон основал консалтинговую компанию Atass Sport, которая специализировалась на прогнозах результатов спортивных соревнований. Коулз примкнул к Smartodds – лондонской компании, которая также работала на рынке спортивного моделирования. В настоящее время компаний, занимающихся прогнозированием исхода футбольных матчей, существует несколько, и большинство из них до сих пор используют модели на основе работ Диксона и Коулза. «Эти исследования все еще остаются для нас отправной точкой», – говорил Давид Хести, сооснователь Onside Analysis – компании, специализирующейся на футбольной аналитике.
Как и у любой другой модели, у детища Диксона и Коулза были и свои слабые стороны, или, по выражению Коулза, «ряд шероховатостей». Одна из проблем заключалась в том, что модель считала коэффициенты атаки и защиты команды неизменными на протяжении всего матча. Но в реальном матче футболисты могут устать или, наоборот, испытать подъем сил. Другой изъян модели состоял в том, что в реальном футболе ничья случается чаще, чем предполагает процесс Пуассона. Например, более слабая команда изо всех сил старается удержать равный счет, а более сильная, наоборот, расслабляется. Андреас Хойер и Оливер Рубнер из Мюнстерского университета обнаружили еще один фактор. По мнению ученых, игры часто заканчиваются ничьей потому, что при равном счете к концу матча игроки склонны меньше рисковать и, следовательно, меньше забивают. Проанализировав матчи чемпионата Германии с 1968 по 2011 год, исследователи обнаружили, что вероятность гола уменьшается, если команды сравнялась в счете. Особенно это заметно при счете 0:0, когда игроки предпочитают довольствоваться «уютной ничьей».
При определенном наборе факторов в игре создаются условия, когда ничья выгодна обеим сторонам. Хойер и Рубнер подсчитали, что в матчах Бундеслиги на протяжении первых 80 минут распределение голов происходило согласно процессу Пуассона: в это время команды загоняли мяч в сетку с достаточно постоянной частотой. Но ближе к концу игры действия футболистов становились более хаотичными, особенно если на последних минутах лидировала с преимуществом в один-два гола команда гостей.
Приняв во внимание все эти нюансы, компании, занятые спортивными прогнозами, смогли, основываясь на работах Диксона, Коулза и других ученых, превратить футбольный беттинг в прибыльный бизнес. В последние годы эти фирмы значительно расширили сферу своей деятельности. Но, хотя индустрия переживает расцвет и в нее приходят все новые участники, в Великобритании научно обоснованный беттинг – все еще достаточно новое явление; даже самые крупные его представители начали дело не раньше 2000 года. Зато в США индустрия спортивных прогнозов имеет гораздо более богатую – подчас в буквальном смысле слова – историю.