Парсеры для сети «ВКонтакте». Что, как, зачем?
Парсинговыми сервисами называют программные продукты, которые умеют собирать данные по заданным критериям. Грубо говоря, умеют находить тех самых конкретных людей в толпе, которую представляют собой соцсети.
Еще три года назад таких сервисов даже в проекте на рынке не было. Сейчас работать без них — значит, не уважать себя и свои деньги.
«На пальцах» процесс выглядит следующим образом… Предположим, вам нужны люди, которые интересуются прыжками с парашютом, роупджампингом и прочими адреналиновыми видами спорта. Самый простой и логичный способ настроить на них рекламу — это поставить в настройки таргетинга сообщества, посвященные темам прыжков (если речь идет о «ВКонтакте» или «Одноклассниках» — в Facebook такой финт не провернешь). Но это самый простой и логичный способ, который «был». Ведь в сообществе полно:
• ботов и офферов (пользователей, которые выполняют нужные заказчику действия за деньги, например вступают в сообщество или комментируют конкретные посты), хотя ботов на сегодняшний день соцсети уже научились вычищать из рекламных запусков автоматически;
• тех, кто уже отпрыгал свое и не отписался только потому, что забыл, или потому, что заходит поностальгировать;
• людей, которые никогда не прыгнут, потому что их одна только мысль об этом приводит в состояние хтонического ужаса;
• любителей «полайкать» фотографии и почитать статусы о «свободе полета» и «зоне комфорта», которым вообще плевать на сами прыжки.
Таким образом, если мы показываем рекламу всем подписчикам сообщества, мы показываем рекламу и всем перечисленным группам подписчиков тоже. А это экономически нерационально, потому что они никогда не купят. И это я молчу про «сообщества-призраки», в которых полно реальных, но абсолютно пассивных подписчиков в силу заброшенности самого сообщества модераторами. Чем здесь могут помочь парсеры? Например, собрать:
• только тех, кто вступил в группу за указанный промежуток времени (допустим, в последние две недели);
• тех, кто на протяжении последней недели проявил хотя бы две (или сколько нужно) активности в сообществе;
• тех, кто состоит минимум в трех (или скольких нужно) тематических сообществах сразу;
• тех, кто за последние 11 дней высказался в ветке обсуждения под названием «хочу прыгнуть»;
• тех, кто за последний год оставил в сообществе хотя бы один комментарий, кому при этом от 30 лет и кто к тому же живет в Сыктывкаре;
• тех девушек, у чьих парней в ближайшую неделю день рождения;
• тех…
В общем, парсеры умеют практически все. Если вы понимаете свою аудиторию на уровне сегментов, если вы знаете функционал парсеров до каждой кнопки и если при этом вы умеете логически размышлять — найти можно практически любую аудиторию. Единственное, в некоторых нишах будет вопрос с ее объемами (помните мою историю про таксистов?).
Для того чтобы эта идея закрепилась в вашем сознании образно, отсылаю вас к своей статье под названием «9 способов найти девушку во „ВКонтакте“ после общения в ночном клубе» (сайт http://shcherbakovs.com/9sposobov-naity-devushku-vo-vk/). Это будет хорошей подготовкой к теме парсинговых алгоритмов. Идите прочитайте и возвращайтесь — мы опускаемся еще глубже.
На самом деле парсеров в сети «ВКонтакте» довольно много — растущий спрос привлекает все новых и новых разработчиков. Основных, которыми пользуюсь я сам, всего три — «Церебро Таргет», NinjaPepper и Target Hunter.
Пойдем по порядку…
Познакомиться с «Церебро Таргет» поближе можно на сайте церебро. рф или в одноименном сообществе в сети «ВКонтакте». Честно говоря, я бы советовал подписаться на сообщество и провести в нем хотя бы неделю, изучая возможности сервиса, а в перерывах читая кейсы. Для этого даже доступ к сервису покупать не нужно (но если купите — настоятельно рекомендую также доступ к закрытой тусовке пользователей) (рис. 2.24).
Рис. 2.24
Самое главное — разберитесь в функционале. Добейтесь того, чтобы для вас не осталось ни одной непонятной кнопки в сервисе (потому что, скорее всего, именно эта кнопка однажды и сыграет решающую роль в максимизации ваших продаж или их полном отсутствии). В принципе, инструкций самого «Церебро», их видеоуроков и тусовки внутри сообщества вам будет более чем достаточно для старта. Остальное приложится в процессе практики.
NinjaPepper скромнее по функционалу и количеству фанатов, зато умеет парсить не только «ВКонтакте» (как «Церебро Тар-гет»), но и «Одноклассники». По идее, так как «ВКонтакте» и «Одноклассники» представляют собой взаимоинтегрированные площадки, идентификаторы пользователей (ID) одного ресурса можно использовать на другом. Только вот где гарантии, что, если юзер активен в сообществах «ВКонтакте», он будет так же активен в сообществах «Одноклассников»? Нет таких гарантий. А здравый смысл упорно подсказывает, что, скорее всего, будет ровно наоборот. Признаюсь на правах практика: так и случается. Сайт: https://vk.com/pepperninja.
Turget Hunter — наименее понятен интуитивно, имеет репутацию «профессионального» сервиса, зато содержит массу замечательных функций, не реализованных в рамках конкурентных сервисов (типа автоматизации парсингового процесса и сбора пользователей по добавленным аудиозаписям). Познакомиться поближе, воспользоваться пробной версией и прочесть о деталях можно здесь: https://vk.com/targethunter.
Как итог: богу — богово, кесарю — кесарево, для «ВКонтакте» — «Церебро» и Target Hunter, для «Одноклассников» — NinjaPepper. А дальше как уж душа попросит (но в идеале — попробовать все на своем опыте).
Настоятельно рекомендую вам «загуглить» в Интернете файл под названием «Большое сравнение парсеров» (распространяется в Google Docs бесплатно). Авторство неизвестно, но там собрана информация о 14 парсерах, которые сопоставили с точки зрения 112 характеристик. Колоссальная работа. Даже если вы наткнетесь на давно не обновлявшийся файл, уверен, приятных впечатлений вам все равно не избежать.
Как происходит непосредственно парсинг. Алгоритмы
Парсинговые связки и названия кнопок интерфейса в этой книге могут отличаться от актуально действующих. Поэтому концентрируйтесь на том, чтобы уловить принцип, а не оттенки формулировок.
Честно говоря, чтобы обсудить хотя бы половину возможных (даже только типичных) алгоритмов, нужна еще одна отдельная книга, а то и не одна. Но чтобы пазл в вашей голове приобрел законченный вид, я пробегусь по логике процесса. Следите внимательно…
Предположим, вам нужна аудитория мам из Москвы, у которых есть маленькие дети (наряду с бизнес-аудиторией и аудиторией молодоженов одна из самых востребованных и дорогих аудиторий вообще). Что вы можете сделать?