Разборщик ХТМЛ

Денис18 років у сервісі
Дані замовника будуть вам доступні після подання заявки
19.01.2010

Нужно написать разборщик набора хтмл документов, образец прилагаю. Основная страница content содержит содержание (гиперссылки на тексты). Эти тексты нужно собирать в порядке, указанном в содержании и сохранять в виде txt. Статьи должны быть разделенны между собой пунктиром ( ---------------------------). Название txt формируется из названия источника (содержится внизу файла content после

Copyright ©) и даты (находится сразу после Оглавления)