Шаблон для парсинга и граббинга постов со стен сообществ и профилей ВК

650 руб.

VK Posts Parser - шаблон для парсинга/граббинга постов со стен сообществ и/или профилей в ВК.

С помощью этого шаблоны можно:

  • Отбирать посты по множеству различных фильтров
  • Собрать подробную информацию о различных параметрах постов (CSV)
  • Выкачивать посты целиком или их отдельные элементы

Кому может пригодиться:

  • SMM-специалистам
  • Контент-менеджерам и тем кто ведет свои сообщества в различных соцсетях
  • Рекламщикам, маркетологам, аналитикам
  • Дорвейщикам, арбитражникам, сеошникам
  • Тем кому просто нужно скачать содержимое постов со стены или их отдельные элементы к себе на ПК

Фильтры по которым можно отбирать посты со стен:

Результат работы шаблона

Результат состоит из двух составляющих:

1) CSV (Excel) файл с прошедшими все фильтры постами и их параметрами. Создается всегда.

2) Папки с выкаченными постами или их отдельными элементами. Какие конкретно элементы выкачивать вы задаете самостоятельно во входных настройках

Пример CSV файла с результатом парсинга. Таблица слишком широкая и не умещается на один экран, поэтому прикрепляю 2 скриншота (второй после скрола вправо).

Расшифровка столбцов CSV файла:

  • URL - это URL адрес конкретного поста в ВК.
  • timestamp - время публикации поста в формате Unix (количество секунд, прошедших с полуночи 1 января 1970 года). Чем свежее пост, тем больше эта цифра. Колонка удобна для сортировки постов по дате публикации.
  • datetime - время публикации поста в привычном нам формате ДД.ММ.ГГГГ ЧЧ:ММ ... при фильтрации данных в Excel удобно выделять определенные годы / месяцы / дни.
  • type - может иметь значение post или repost
  • likes - количество лайков (отметок нравится)
  • reposts - количество репостов
  • comments - количество комментариев
  • views - количество просмотров
  • images - количество картинок
  • video_total - общее количество видео в посте
  • video_youtube - количество видео с YoutTube
  • video_vimeo - количество видео с Vimeo
  • video_rutube - количество видео с RuTube
  • video_coub - количество видео с Coub
  • audio - количество аудиозаписей
  • doc_total - общее количество документов
  • doc_gif - количество документов GIF
  • doc_word - количество документов Word
  • doc_excel - количество документов Excel
  • doc_pdf - количество документов PDF
  • doc_ppt - колчичество документов PPT (Power Point)
  • doc_psd - количество документов PSD (PhotoShop)
  • text_len - количество симоволов текста
  • int_links - ( no/yes) - наличие внутренних ссылок
  • ext_links - ( no/yes) - наличие внешних ссылок
  • is_ads - помечен ли пост как реклама ( 1 - да | 0 - нет )
  • is_article - является ли пост ссылкой на статью (1 - да | 0 - нет)
  • can_comment - можно ли комментировать пост (1 - да | 0 - нет)
  • can_repost - можно ли репостнуть пост (1 - да | 0 - нет)
  • signer_id - идентификатор автора, если запись была опубликована от имени сообщества и подписана пользователем;

Важно

Шаблон работает именно с постами, статьи он не грабит! Во-первых, статья это вообще отдельная сущность, а не пост в привычном понимании этого слова. Когда Вы на какой-либо стене видите пост со ссылкой/кнопкой "Читать", то это именно то чем кажется - пост с прикрепленной ссылкой на статью, а не сама статья. Именно так он и грабится как пост состоящий из ссылки на статью. Во-вторых, ВК так и не выкатил API для работы со статьями, хотя уже давно обещали.

Таким образом, запретив в фильтрах внутренние ссылки, вы исключите все посты ссылающиеся на статьи! Так же это можно сделать в Excel, отфильтровав по полю is_article

Еще немного про шаблон

  • Работает по POST/GET запросах без использования браузера, для получения данных использует VK API
  • Умеет работать с прокси (хотя в большинстве случаев можно обойтись и без них)
  • Может работать в многопотоке (хотя я рекомендую работать в 1 поток)
  • Умеет работать с антикапча-сервисами antigate (anti-captcha) и rucaptcha + есть возможность разгадывать капчу вручную или через CapMonster2. Сразу хочу сказать что встретить капчу при таком виде парсинга - это еще ой как нужно постараться
  • Каждый поток использует ВСЕ имеющиеся аккаунты ВК, они меняются при каждом новом обращении к API ... это позволяет парсить действительно крупные сообщества.
  • Для работы нужны аккаунты ВК и возможно прокси. Для небольших сообществ хватит и 1 аккаунта без прокси, но если парсить нужно крупные сообщества, то желательно иметь несколько акков ВК! Я, например, использую 4-5 аккаунтов без прокси, хватает для парсинга практически любых сообществ.
  • Для работы необходим ZP 5.10.2.0 или выше
  • Написан целиком на C# кубиках

Апдейты / обновления

Багфиксы и обновления бесплатные.

Контакты
 Skype: profitbunker
 Telegram: @profitbunker
 Email: profitbunker@gmail.com
Информация

Все шаблоны продаются с правами только на выполнение. Вы не сможете просматривать и редактировать код шаблона.

Шаблоны привязываются к email или Id на котороый зарегистрирован ваш ZP.

Шаблон после покупки будет нельзя переоформить на другой email/id т.е вы не можете его перепродать или передать кому-то другому.