11 октября 2009 г. Los Angeles Angels обыграли Boston Red Sox в плей-офф Американской лиги, заработав право сразиться с New York Yankees за звание чемпиона лиги и место в Мировой серии. Для Angels эта победа была наполнена особым смыслом: всего за шесть месяцев до того один из самых многообещающих игроков команды питчер Ник Аденхарт погиб в аварии, виновником которой был пьяный водитель. Один спортивный журналист начал свою статью об игре следующими словами:
«Когда в воскресенье на стадионе „Фенуэй Парк“ в девятом иннинге Angels проигрывали с разницей в две пробежки, никто уже не верил в их победу, но лосанджелесцы сумели переломить ход игры благодаря важнейшему синглу Владимира Гуэрреро, вырвав победу у Boston Red Sox со счетом 7–6.
Гуэрреро принес Angels два рана. Cчет на подаче был 2–4.
"Если вспоминать о Нике Аденхарте и апрельской трагедии в Анахайме, да, пожалуй, это был самый важный хит [в моей карьере], — сказал Гуэрреро. — Так что я посвящаю эту победу своему бывшему товарищу по команде, парню, которого с нами уже нет".
Гуэрреро хорошо себя проявил во всех играх сезона, особенно в дневных. В дневных играх он показал OPS [процент занятия базы плюс слаггинг] на уровне 0,794. Он выбил пять хоумранов и принес 13 ранов в 26 дневных играх»{117}.
Автору этого текста, наверное, вряд ли стоит рассчитывать на какие-либо награды за свой писательский труд. Тем не менее приведенный выше рассказ — поразительное достижение: дело не в том, что он хорошо читается, в нем нет грамматических ошибок и он содержит точное описание бейсбольного матча; просто его автор — компьютерная программа.
Эту программу (под названием StatsMonkey) создали студенты и преподаватели Лаборатории интеллектуальной информации (Intelligent Information) при Северо-Западном университете. StatsMonkey предназначена для автоматизации процесса написания материалов о спорте за счет превращения объективных данных об отдельно взятой игре в захватывающее повествование. Возможности системы выходят далеко за рамки простого перечисления фактов; скорее, она описывает события, добавляя в рассказ все те основные атрибуты спортивной журналистики, которые присущи работам журналистов-людей. Для выявления значимых событий, имевших место во время матча, StatsMonkey выполняет статистический анализ; затем она использует естественный язык для создания текста, в котором кратко описывается ход игры, а также уделяется особое внимание решающим моментам и ключевым игрокам, определившим ее исход.
В 2010 г. исследователи из Северо-Западного университета, которые руководили работавшей над StatsMonkey группой студентов, специализировавшихся в области вычислительной техники и журналистики, получили финансовую поддержку от венчурных инвесторов и основали новую компанию под названием Narrative Science, Inc. с целью коммерциализации данной технологии. Компания наняла лучших специалистов в области вычислительных систем и инженеров; новая команда избавилась от первоначального кода StatsMonkey и создала значительно более мощную и комплексную систему искусственного интеллекта, которая получила название Quill.
Технология Narrative Science используется крупнейшими средствами массовой информации, в том числе Forbes, для написания статей на различные темы, включая спорт, бизнес и политику. Разработанное компанией ПО генерирует новостные материалы приблизительно каждые 30 секунд; при этом многие из них публикуются на популярных сайтах, которые предпочитают не афишировать свою связь с данным сервисом. В 2011 г. в ходе отраслевой конференции корреспондент Wired Стивен Леви попросил одного из основателей Narrative Science Кристиана Хэммонда оценить, какой будет доля новостных материалов, написанных с помощью программных алгоритмов, в ближайшие 15 лет. В ответ он услышал: более 90 %{118}.
Narrative Science строит далекоидущие планы, не собираясь ограничиваться одной лишь индустрией новостей. Назначение Quill — служить универсальной платформой для анализа и написания нарративных текстов, составлять высококачественные отчеты как для внутреннего пользования, так и для публикации в ряде отраслей. Работа Quill начинается со сбора данных из различных источников, включая базы данных о транзакциях, системы финансовой и торговой отчетности, сайты и даже социальные медиа. Затем система выполняет анализ собранных данных, выбирая самые важные и интересные факты и выводы. Наконец, она сплетает из всей этой информации связное повествование, которое, по заверениям компании-разработчика, сопоставимо с результатами труда лучших аналитиков. После соответствующей настройки система Quill способна практически мгновенно формировать бизнес-отчеты с заданной периодичностью — и все это без вмешательства человека{119}. Учитывая, что одним из первых инвесторов, поддержавших Narrative Science в самом начале пути, было In-Q-Tel — подразделение ЦРУ, отвечающее за венчурные проекты, можно с большой долей уверенности утверждать, что разработанные компанией инструменты будут использоваться для автоматического преобразования потоков необработанных данных, собираемых специалистами американской разведки, в удобный для понимания повествовательный формат.
Пример технологии Quill демонстрирует, насколько уязвимыми для автоматизации оказываются задачи, которые когда-то считались исключительной прерогативой высококвалифицированных профессионалов с высшим образованием. Разумеется, связанная со знаниями работа обычно предполагает наличие широкого круга навыков и талантов. Среди прочего аналитик должен уметь извлекать информацию из различных систем, строить статистические или финансовые модели, а затем доходчиво доносить результаты своей работы до аудитории в виде отчетов или презентаций. Может показаться, что писательский труд — в котором, как ни крути, столько же искусства, сколько и науки, — относится к видам деятельности, в последнюю очередь поддающимся автоматизации. Но, как оказывается, это совсем не так, а алгоритмы с каждым днем становятся все более совершенными. Более того, учитывая то, что для автоматизации профессий, связанных с умственным трудом, достаточно одного лишь ПО, соответствующие рабочие места во многих случаях могут оказаться более уязвимыми, чем рабочие места для людей с низкой квалификацией, предполагающие физический труд.