Ознакомительная версия. Доступно 15 страниц из 73
Однако причина быть предельно осторожными с использованием информации личного характера выходит даже за рамки этики. Она заключается и в самих данных. С точки зрения науки о данных, есть большая разница между попытками предугадать вероятность определенных событий в городе и старанием предсказать действия отдельного человека.
Давайте вернемся к самоубийству. Каждый месяц в США делается около 3,5 миллиона связанных с суицидом поисковых запросов{186}. При этом в большинстве из них есть определенные намеки – слова «самоубийца», «самоубийство» и «способы самоубийства». Проще говоря, каждый месяц – больше одного запроса о самоубийстве на каждые 100 американцев. Как тут не вспомнить философа Фридриха Ницше: «Мысль о самоубийстве – это великое утешение: она помогает человеку преодолеть темноту ночи». Данные поисковых запросов в Google показывают, как это верно и насколько распространены мысли о суициде. Тем не менее каждый месяц в Соединенных Штатах совершается менее четырех тысяч самоубийств. То есть суицидальные мысли достаточно распространены, а самоубийства – нет. Поэтому полицейским нет смысла стучаться в двери каждый раз, когда кто-либо сообщает онлайн о желании вышибить себе мозги – если копы будут заниматься этим, у них ни на что больше не останется времени.
Или рассмотрим невероятно злобные исламофобские запросы. В 2015 году в Соединенных Штатах примерно 12 тысяч раз искали выражение «убивать мусульман». И, как сообщалось, на почве ненависти были убиты 12 мусульман{187}. Очевидно, что подавляющее большинство людей, делавших этот ужасающий запрос, не доходят до осуществления соответствующего действия.
Существуют математические выкладки, объясняющие разницу между предсказанием поведения конкретной личности и общей ситуацией в городе. Вот простой мысленный эксперимент. Предположим, в городе живет один миллион человек. И там есть одна мечеть. Предположим, что если кто-то не обратится к Google с запросом «убить мусульман», то он нападет на мечеть с вероятностью всего 1 на 100 миллионов. Предположим, что кто-то начнет искать в Сети выражение «убить мусульман». Тогда эта вероятность резко возрастает до 1 к 10 тысячам. Предположим, что исламофобия взлетела до небес и число поисковых запросов «убить мусульман» выросло со 100 до 1000.
Как показывает математика, в этой ситуации шансы нападения на мечеть возросли примерно в пять раз – с 2 до 10 процентов. Но вероятность того, что человек, писавший «убить мусульман», действительно нападет на мечеть, по-прежнему остается только 1 на 10 тысяч.
Правильная реакция в этой ситуации – не сажать в тюрьму всех людей, искавших, как «убить мусульман». Не обыскивать их дома. Да, имеется крошечный шанс, что любой из них все же совершит преступление. Но правильным ответом, однако, было бы защитить мечеть, шансы которой подвергнуться нападению возросли до 10 %.
Очевидно, что многие ужасные поисковые запросы не приводят к ужасным действиям.
Итак, хотя бы теоретически, существуют некоторые классы поисковых запросов, предполагающих достаточно высокую вероятность негативных последствий. И хотя бы теоретически возможно, например, что ученые, занимающиеся сбором и анализом данных, смогут в будущем построить модель, которая могла бы определить, что поисковые запросы Стоунхэма, связанные с Донато, должны вызвать серьезную обеспокоенность.
В 2014 году было зафиксировано около 6000 поисковых запросов с фразой «как убить подружку» и 400 убийств девушек. Если все эти убийцы перед совершением преступления выполнили поиск в Google, это будет означать, что 1 из 15 человек перешел от слов к делу. Конечно, многие – вероятно, большинство людей, убивших своих подруг, – не искали информацию о преступлении именно таким образом. Это будет означать: истинная вероятность того, что конкретно этот поиск привел к убийству, намного ниже.
Но если бы ученые, занимающиеся анализом данных, смогли построить модель, вычисляющую угрозу в отношении конкретного человека – скажем, 1 к 100, – мы могли бы захотеть что-то сделать с этой информацией. По крайней мере человек, которому угрожает опасность, вероятно, имеет право быть проинформированным о ней – о существовании 1 шанса из 100 того, что он будет убит конкретным преступником.
Однако в целом мы должны быть очень осторожны при использовании поисковых данных для предсказания преступлений на индивидуальном уровне. Статистика ясно говорит нам: имеется много, очень много ужасных запросов, редко приводящих к ужасным последствиям. И пока все еще нет никаких доказательств, что правительство может с высокой долей вероятности спрогнозировать конкретное действие просто на основании изучения этих поисковых запросов. Поэтому нам следует быть очень осторожными и не позволять властям принимать меры на индивидуальном уровне, используя данные поисков. И дело не только в этических или юридических причинах. Дело – по крайней мере сейчас – в науке о данных.
Заключение
Сколько людей дочитывают книгу до конца?
После подписания договора с издательством у меня было четкое видение того, как следует структурировать эту книгу. В начале – вы, возможно, помните – я описал сцену за столом у меня дома на День благодарения. Члены моей семьи обсуждали, в здравом ли я уме, и пытались выяснить, почему я к 33 годам никак не мог найти подходящую девушку.
Заключение к этой книге написалось практически само. Я хотел бы встречаться с хорошей девушкой и жениться на ней. Еще лучше – я хотел бы использовать большие данные, чтобы встретить подходящую девушку. Возможно, я смог бы вплести в книгу историю ухаживания, и тогда в заключении я бы описал, как все собрались вместе. А последние страницы включали бы описание дня моей свадьбы и любовное письмо к моей молодой жене.
К сожалению, жизнь не совпадает с фантазиями. Тот факт, что во время написания книги мне пришлось запереться в своей квартире и практически потерять связь с реальным миром, наверняка не способствовал развитию романтической стороны моей жизни. И – увы – я еще не нашел себе жену. И, что еще важнее, мне все еще нужно новое заключение.
Я корпел над многими из моих любимых книг, пытаясь найти то, что позволит мне написать отличный эпилог. И пришел к выводу, что в лучших заключениях подчеркивается самая главная мысль, проходящая через всю книгу. Основная мысль этой книги следующая: социальная наука становится самой настоящей наукой. И эта новая настоящая наука призвана улучшить нашу жизнь.
В начале второй части я обсуждал критику Карлом Поппером трудов Зигмунда Фрейда. Я отмечал что Поппер не считал необычные мысли Фрейда научными. Но я кое-что не упомянул о критике Поппера. На самом деле это было нечто гораздо более важное, чем просто нападки на Фрейда. Поппер не считал, что какой-либо социальный ученый являлся ученым в строгом смысле этого слова. Карлу не нравилось отсутствие строгости в положениях, высказывавшихся этими так называемыми учеными.
Ознакомительная версия. Доступно 15 страниц из 73