Парсер новостей Кинопоиска
Что умеет скрипт:
0. Скрипт имитирует действия браузера;
1. Находит число страниц новостей (учитывая количество новостей на страницу - задается в настройках скрипта);
2. Обходит все страницы и забирает ссылки на новости;
3. Собирает название новости и ее анонс;
4. Далее скрипт обходит все полученные ссылки на новости и забирает полный текст;
5. Из текста новости вырезаются все ссылки, оставляя вместо ссылки ее анкор;
6. На выходе скрипта - массив данных, который можно обработать как Вам нужно (к примеру, занести в базу);
7. При последующих запусках парсер забирает только новые новости, старые пропускает;
8. Работа парсера логируется;
9. На скриншоте представлен var_dump() выходного массива.