Имеется скрипт социальной сети (Social Engine 2.5) и необходимо выполнить его настройку так чтобы он корректно отображал русский язык в интерфейсе (уже выполнена руссификация примерно на 15%) Если у вас есть опыт ...
Нужна утилита выбора слов из базы под linux
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Задача следующая:
есть файл со словами (очень большой, например 500 мегабайт, или 10.000.000 слов, как пример)
мама смотрит в окно
моя книга очень интересная
книга и авто не совместимы
все слова в столбик
есть второй файл, со словами по которым делать выборку, пример:
авто
окно
книга
суть скрипта следующая:
поочередно берем слова из второго файла и вытягиваем слова из первого
т.е.
пример на perl:
foreach my $request (keys %request)
{
if ($keyword =~ /(?:^|\s+)$request(?:\s+|$)/i)
{
open(F, ">>$request");
print F "$keyword\n";
close(F);
}
как видите, в первом файле могут быть строки вроде:
книга и авто не совместимы
в свою очередь во втором файле мы видим что нам нужны все строки где есть слово: "авто" и "книга"
т.е. мы должды записать строку: "книга и авто не совместимы" в файл: "авто"
И (!)
эту же строку записать в файл: "книга"
т.е. вариант с объединением всех запросов для нахождения в один регекс не катит т.к. будет найдено только одно совпадение
посоветовали сделать сначала выборку путем комманды: "cat $file|grep -P '(?:^|\s+)(?:окно|авто|книга)(?:\s+|$)' >tmp/complete"
и потом уже разбирать файл complete построчно
НО очень долго получается разбирать его
т.е. cat + grep работает очень быстро
а вот выборка по нужным запросом долго (файл в миллион строк, разбирается около часа)
т.е. получается в данном случае нам надо три запроса:
окно
книга
авто
т.е. если cat + grep насобирал миллион записей, то при выборке будет обработано 3.000.000 записей
у меня этих запросов сотни, соответсвенно кол-во выборок увеличивается не по детски =)
задача написать то что мне нужно на perl или Си под linux
работать это должно максимально быстро, запросов которые искать будет очень много (тысячи), слов где искать тоже много (базы по 6-7 гигов, по 200-300 миллионов слов)
ася для инфы 9603308
о цене договоримся
Заявки фрилансеров
Похожие заказы
- $250Веб-программирование1 исполнительЗакрыт17 лет назад
- $70
Необходим помошник в создании простого чата (PHP+SQL+JavaScript). От вас будет требоваться удалленная консультация и иногда примеры кода. более подробно при связи только через ICQ 192-232-206 предложения можно отсылать и на почту. [email protected]
Веб-программирование3 заявкиЗакрыт17 лет назад Флеш Анимация Высокого Уровня Нужна т3 в приложение
Веб-программирование3 заявкиЗакрыт17 лет назадЕсть ряд пожеланий по доработке resultcrm.com. Список доработок готов направить по требованию. Пишите [email protected]
Веб-программирование3 заявкиЗакрыт17 лет назадСтандартный шаблон ShopCMS паровить стиль CSS ( Образец говый есть пременить стили ), и внести изменения в стандартый дизайн вставить в шапку 3 фото, поменять цвет полос, шрифта.
Веб-программирование1 исполнительЗавершен17 лет назад- $5
Нужно установить плагин автотрансфера (без использования wmsigner) для скрипт zmailcaher 2.23
Веб-программирование1 исполнительЗакрыт17 лет назад - $500
Нужно изготовить программа "Рассылка SMS" под заказ.
Веб-программирование1 исполнительЗакрыт17 лет назад Здравствуйте уважаемые. Нужен скрипт граббера для DLE. Функционал: 1. Скрипт устанавливается на DLE и грабит новости также с DLE. 2. Грабит вместе с картинками и ссылками. 3. ...
Веб-программирование3 заявкиЗакрыт17 лет назад- $140
Необходимо разработать сайт под ключ с хорошей системой управления, зеркало сайта www.revital.ru (дизайн есть готовый, но необходима верстка). Интересует цена и срок.
Веб-программирование1 исполнительЗакрыт17 лет назад - $30
Есть верстка, требуется посадить все это хозяйство на Джумлу. Денег 1500 руб. В ночи выберу исполнителя.
Веб-программирование1 исполнительЗавершен17 лет назад