Съдържание:
- Събиране на данни
- Шаблони
- Създаване на задачи
- Запазване и промяна на настройките на задачите
- Представяне на задачите и управление
- Допълнителни инструменти
- Експорт на данни
- Прокси сървъри
- Блокиране на реклама
- Облачни услуги
- Уроци за използване
- Техническа поддръжка
- Предимства
- Недостатъци
- Свалете пробната версия на Octoparse
- Въпроси и отговори: 1
Събиране на данни
Octoparse – това е комплексно софтуерно решение за масово и автоматизирано събиране (уеб скрейпинг), структуриране и анализ на данни, за използването на което не са необходими умения за програмиране. С негова помощ можете да превърнете всякакви неструктурирани уеб данни в готова информационна база за маркетинг, изследвания, продажби, промоции и решаване на множество други бизнес задачи.

В зависимост от това на какви сайтове ще се използва софтуерът, можете да получите данни и/или съдържание от следния тип: цени и информация за продукти (за търговски платформи); постове, публикации, коментари (социални мрежи); цени, рейтинги, отзиви (букинг, недвижими имоти); обяви за работа и заплати (работа) и т.н.

Обсъжданият софтуер функционира под управлението на уникален алгоритъм, в основата на който стои изкуствен интелект, което позволява автоматично намиране и извличане на данни от уеб страници по предварително зададени или шаблонни параметри.

Шаблони
Сервисът предоставя над 200 готови за употреба шаблона за събиране на данни от сайтове в следните категории:
- Популярни уеб услуги;
- Интернет магазини и търговски платформи (Amazon, eBay, Walmart и т.н.);
- Хотели и пътувания (Airbnb, Booking, Tripadvisor и т.н.);
- Социални мрежи и медии (Facebook, Instagram, Twitter, YouTube и т.н.);
- Търсачки (Google, Yahoo);
- Обяви (Crunchbase, Yellow Pages, Yelp и т.н.);
- Картографски услуги (Google);
- Ревюта;
- Търсене на работа;
- Недвижими имоти;
- Училищно образование;
- Финанси;
- Залози.













Създаване на задачи
Освен шаблонните, в Octoparse можете да създадете свои собствени задачи за извличане на данни от уеб. Процедурата се извършва в три прости стъпки: указване на URL адреса на страницата на сайта, от която трябва да се съберат данни, избор на цел и след това стартиране и непосредствено извличане.
Процедурата е изключително проста и автоматизирана – системата разпознава ключовите елементи на уеб страниците и ги подчертава, което не само осигурява допълнително удобство при взаимодействието, но и спестява време. Още по-важно е, че този подход изключва необходимостта от познаване и използване на езика XPath за самостоятелно създаване на XML заявки.

Запазване и промяна на настройките на задачите
По време на автоматичното извличане на информация и на базата на откритото съдържание на сайта, Octoparse създава свои собствени настройки, които могат да бъдат запазени като шаблонни и готови за по-нататъшна употреба, или да бъдат променени по ваше усмотрение, например, като се изключат едни категории и се добавят други или просто се промени тяхната последователност.

Очевидно е, че необходимостта от промяна на основните настройки, които определят крайното представяне на събраните данни, възниква доста често. Първоначално те се показват под формата на визуална таблица с автоматично определени категории и ред, колоните в която могат да се разменят, а ненужните просто да се изтриват.

Освен това, често е необходимо самостоятелно да се задават параметри като брой страници на сайта и интервал на достъп до тях.

След автоматично или самостоятелно определяне на настройките, стартиране и завършване на процеса на извличане, се създава работен шаблон (workflow), състоящ се от няколко блока – редактирани елементи, чийто окончателен вид определя как ще изглежда задачата в резултат.

Представяне на задачи и управление
Готовите задачи се добавят на таблото за управление (достъпно от горното и страничното меню), откъдето могат да се извършват действия като стартиране и спиране на процеса на извличане, споделяне с колеги, експортиране, преглеждане на локални данни и данни, съхранявани в облака.

За по-удобно търсене и управление се препоръчва създаването на групи, а при необходимост може да се преместват задачи от една категория в друга.

Допълнителни инструменти
В актуалната (бета) версия на Октопарс има два допълнителни инструмента, които разширяват функционалните възможности на програмата и позволяват по-ефективно взаимодействие с данните. Така, RegEx Tool предоставя възможност за почистване на събраната информация, а Database Auto Export Tool позволява задаване на собствен график за експортиране в локална база.

Експорт на данни
Събраните с помощта на Octoparse данни могат да бъдат запазени в формати XLSX, CSV, JSON и т.н. за последваща обработка в външно софтуерно приложение, например, Excel или Ajax. Също така има възможност за експортиране в бази данни.

Прокси-сървъри
Разглежданата програма предоставя възможност за използване на собствен прокси-сървър в процеса на събиране на данни. По този начин може да се скрие или автоматично да се подмени IP-адреса, за да не се попадне в черния списък на обработваните уеб ресурси.
Блокировка на реклама
Octoparse съдържа в състава си средства за блокиране на реклама, благодарение на което се съкращава времето за зареждане на страниците и техните заявки и, следователно, се оптимизира и ускорява решаването на основните работни задачи.
Облачни услуги
За осигуряване на безопасността и надеждността на процеса на уеб скрейпинг, Octoparse използва авангардни технологии за облачни изчисления, разработени от самите тях, и предоставя достъп до своите услуги и сървъри, чиято скорост на работа е до 20 пъти по-висока от тази на локалните аналози.

Уроци за използване
На официалния сайт на Octoparse е представена изчерпателна библиотека от обучителни материали, благодарение на които може да се усвоят всички функционални възможности на този софтуер в най-кратки срокове, за да се използва максимално ефективно за организиране на работните процеси и решаване на бизнес задачи. Може да се премине към тях и от интерфейса на програмата, нейното основно прозорец.

Техническа поддръжка
В случай на възникване на каквито и да било трудности при използването и/или проблеми в работата, Octoparse винаги може да се обърне към службата за техническа поддръжка на услугата за уеб скрейпинг на данни. Достъпни са следните канали за връзка: електронна поща, форум и общност, социални мрежи и жив чат (наличен само в платения тариф). Важно е да се отбележи, че за получаване на отговори на определени въпроси често е достатъчно да се обърнете към представената на сайта база знания или вече споменатите обучителни материали.

Предимства
- Наличие 14-дневна безплатна пробна версия;
- Прост и удобен, интуитивно разбираем интерфейс;
- Няма нужда от умения за програмиране;
- Възможност за използване на облачни услуги на компанията-разработчик;
- Наличие на обучителни материали за използване на софтуера;
- Техническа поддръжка с няколко канала за връзка;
- Голяма библиотека от готови шаблони, които при необходимост могат да бъдат променяни според задачите;
- Подкрепа за най-популярните уебсайтове и услуги с напълно различни насочености и тематики.
Недостатъци
- Липса на русификация;
- Липса на шаблони за местни сайтове;
- Към момента на написване на прегледа актуалните версии на Octoparse за Windows и macOS са налични само в бета версия. Предишната (стабилна) се различава от нея по интерфейс и функционалност.
Свалете пробната версия на Octoparse
Изтеглете последната версия на програмата от официалния сайт