Есть текстовой файл около 100мб

1. Нужно разбить файл на на строки- каждая новая строка начинается только с заглавной буквы или цифры, заканчивается .!?

2. Далее

-Удаляем предложения, в которых присутствуют любые символы отличные от английских букв, цифр, тире и запятой!!!

-Удалять предложения, в которых менее 8 слов.

3. Когда текст разбит построчно на предложения и очищен от мусора по фильтрам- чистим от дублей.

6 лет назад
pavlovichcat
Николай 
41 год
15 лет в сервисе
Был
год назад

Выбранный исполнитель

Mihairu
Михаил 
25 лет
9 лет в сервисе
Был
19 часов назад
6 лет назад
$20
1 день
Рекомендую Михаила как ответственного исполнителя. Все вопросы и доработки решались оперативно!
Все прошло отлично, рекомендую :)

Заявки фрилансеров

Mihairu
Михаил 
25 лет
9 лет в сервисе
Был
19 часов назад
6 лет назад