Ознакомительная версия. Доступно 18 страниц из 89
Интересно отметить одно следствие такого положения вещей: когда владелец веб-сайта, входящего в оксфордскую сеть, размещает у себя ссылку на какой-нибудь сторонний сайт, это приводит к повышению ранга этого стороннего сайта, потому что сайт Оксфорда отдает ему малую часть своего огромного престижа (или запаса шаров). Поэтому меня часто просят разместить на моем сайте на математическом факультете Оксфорда ссылки на сторонние веб-сайты. Такие ссылки повышают ранг этих сайтов и, как знать, даже могут позволить им осуществить заветную мечту всех вебсайтов – появиться на первой странице результатов поиска в Google.
Однако алгоритм не вполне неуязвим для хитроумных атак, организаторы которых понимают, как работает математика. В течение короткого периода летом 2018 года в результатах поиска в Google по слову idiot[25] на первом месте среди изображений оказывалось изображение Дональда Трампа. Активисты придумали, как использовать авторитетное положение в интернете сайта Reddit. Они предложили читателям этого сайта голосовать за сообщение, содержащее слово idiot и изображение Трампа, и связь между этими двумя элементами взлетела на самый верх рейтинга Google. Со временем этот пик сгладился, но не из-за вмешательства человека, а благодаря работе алгоритма. Google не любит играть в бога, но верит – в долгосрочной перспективе – в силу своей математики.
Разумеется, интернет – «существо» динамическое. Каждую наносекунду в нем появляются новые сайты и новые ссылки, а сайты, уже существующие, закрываются или обновляются. Это означает, что и рейтинг страниц должен изменяться динамически. Чтобы не отставать от непрерывной эволюции интернета, Google должен регулярно прочесывать Сеть и обновлять подсчет ссылок, соединяющих сайты. Это делается при помощи программ, носящих очаровательное имя «Google-пауков».
Страстные энтузиасты техники и спортивные тренеры выяснили, что этот метод оценки сетевых узлов можно применять и к другим сетям. Одно из самых интересных сторонних приложений было разработано в области футбола (европейского, а не американского). При оценке команды противника бывает важно выявить ее ключевого игрока, который управляет игрой своей команды или играет роль центра, через который, по-видимому, развиваются все комбинации. Если распознать такого игрока и нейтрализовать его на раннем этапе матча, это позволит, по сути дела, разрушить всю стратегию команды.
Два лондонских математика, Хавьер Лопес Пенья и Хьюго Тушетт (оба – страстные футбольные болельщики), решили проверить, не поможет ли алгоритм Google проанализировать команды, готовящиеся к чемпионату мира. Если представить каждого игрока веб-сайтом, а каждый пас от одного игрока к другому – ссылкой с сайта на сайт, то весь комплекс пасов, выполненных во время матча, можно считать сетью. Пас партнеру по команде говорит о доверии к этому игроку, – как правило, футболисты стараются не пасовать слабым игрокам, которые легко могут потерять мяч. Кроме того, чтобы получить пас, игрок должен оказаться открытым для передачи. Неподвижный футболист редко получает пас.
Они решили определить, у каких футболистов оказывается самый высокий рейтинг по количеству передач по данным, опубликованным ФИФА во время чемпионата мира 2010 года. Результаты получились в высшей степени увлекательными. При анализе игры сборной Англии показатели двух игроков, Стивена Джеррарда и Фрэнка Лэмпарда, оказались заметно выше, чем у всех остальных. Это отражает тот факт, что мяч очень часто передавался через этих двух полузащитников: без них игра сборной Англии просто развалилась бы. В том году выступление Англии на чемпионате мира было не особенно успешным: еще на раннем этапе турнира команда выбыла из соревнования, проиграв своему старому заклятому врагу – сборной Германии.
Совсем иначе обстояло дело в команде, ставшей победителем чемпионата, – сборной Испании. Алгоритм равномерно распределил ранги всех ее футболистов, то есть в команде не было явно выраженного центрального игрока, ключевого для всей игры. Это отражает чрезвычайно успешный стиль «тотального футбола», или «тики-така», которого придерживалась испанская команда: в нем игроки постоянно пасуют мяч друг другу, и эта стратегия способствовала победе Испании.
В отличие от многих американских видов спорта, в которых интенсивно используется анализ данных, в футболе не сразу оценили значение математики и статистики, активно действующих за кулисами игры. Но к чемпионату мира 2018 года, проходившему в России, уже многие команды имели в своем составе ученых, обрабатывавших численные данные, чтобы понять сильные и слабые стороны соперников, кроме всего прочего и с точки зрения поведения сети каждой команды.
Сетевой анализ применяется даже к литературе. Эндрю Беверидж и Цзе Шань занялись эпической сагой «Песнь льда и пламени» Джорджа Р.Р. Мартина, широко известной по телесериалу «Игра престолов». Всякий, кто знаком с этим повествованием, хорошо знает, как трудно бывает предсказать, кто из его героев доживет до следующего тома – и даже до следующей главы, – так как Мартин безжалостно убивает даже лучших из созданных им персонажей.
Беверидж и Шань решили создать сеть между персонажами этих книг. Они выделили 107 основных героев, которые стали узлами сети. Затем персонажей соединили ребрами, взвешенными в соответствии с прочностью взаимоотношений между ними. Но как алгоритм может оценить значение такой связи? Алгоритму предложили просто подсчитать число появлений имен двух персонажей в тексте на расстоянии не более 15 слов друг от друга. Полученное значение не является мерой их дружбы – оно просто указывает на определенный уровень взаимодействия или взаимосвязи между ними.
Проанализировать решили третий том эпопеи, «Бурю мечей», так как к этому моменту повествование полностью развилось; исследование начали с анализа рейтингов узлов сети, соответствующих персонажам. Очень быстро были выделены три героя, важные для развития сюжета: Тирион Ланнистер, Джон Сноу и Санса Старк. Это открытие вряд ли удивит кого-либо, читавшего книги или смотревшего сериал. Удивительным было то, что компьютерный алгоритм, не понимавший, что он читает, пришел к такому же выводу. Он сделал это не простым подсчетом появлений имени каждого персонажа – в этом случае на вершине списка оказались бы другие имена. Более тонкий анализ сети позволил выявить главных героев.
Пока что никто из этих трех героев не погиб от безжалостного пера Мартина, оборвавшего в третьем томе жизнь нескольких других ключевых персонажей. В этом отличие хорошего алгоритма: он может быть полезен в самых разных сценариях. Этот алгоритм смог дать ценную информацию в весьма разнообразных областях, от футбола до «Игры престолов».
Математика – секрет счастливого брака
Пусть Сергей Брин и Ларри Пейдж и создали код, направляющий вас на сайты, которые вы искали, даже сами того не зная, но может ли алгоритм работать в такой интимной сфере, как поиск родственных душ? Зайдите на сайт знакомств OKCupid, и там вас встретит лозунг, гордо заявляющий: «Мы найдем вам пару при помощи математики».
«Алгоритм подбора партнеров» таких сайтов знакомств перебирает профили пользователей и составляет из них пары на основе их симпатий, антипатий и черт характера. Судя по всему, эти сайты совсем не плохо справляются со своей работой. Более того, кажется, что алгоритмам подбор партнеров удается лучше, чем нам самим: в исследовании, результаты которого были недавно опубликованы в журнале Proceedings of the National Academy of Sciences, были рассмотрены 19 000 человек, сочетавшихся браком между 2005 и 2012 годами. Выяснилось, что у пар, встретившихся в интернете, браки получились более счастливыми и устойчивыми.
Ознакомительная версия. Доступно 18 страниц из 89