Требуется разработка компонентов по машинному обучению и Natural Language Processing на Python. Идеальный кандидат должен иметь опыт работы с Anaconda и Jupyter, а также реальные проекты в области обработки текстов на английском языке. Проект предполагает длительное сотрудничество и постоянное общение с заказчиком. Консультационные услуги по Python также являются частью задачи.
Программа поиска в Excel-файле и сохранения в word-файле результатов
ТЕХНИЧЕСКОЕ ЗАДАНИЕ
Проблема:
Фильтр в EXCEL работает неправильно. При попытке найти через фильтр, если в ячейке большое
количество символов, текст не находится. Поэтому обычную функцию фильтра
использовать бесполезно. Необходимо обойти эту проблему таким образом:
- Есть 2 исходных файла:
б) Список поисковых запросов в txt-файле тоже в один столбец.
2. Список поисковых запросов загружается в память и на каждой ячейке (в файле Excel) проверяется с помощью поиска. Причем последовательность перебора идет таким образом:
В ячейка А1, идет поиск совпадения из файла txt, вначале из строчки 1, далее из строчки 2, из строчке Х… из последней строчки.
Далее переходим к ячейке А2, остальное идентично.
Если в какой-то ячейке, скажем А30 находится текст, он сохраняется в word-файл, в котором эти (все найденные термины из txt-файла) выделяются полужирным.
Например:
Ячейка А3 текст:
Бла1 Бла2 бла3, бла4! бла5? Бла6, Бла44
В txt файле находится текст:
бла2
бла4
Программа находит, что ячейка А3 соответствует и сохраняет (дописывает) в word-файл текст в таком виде:
«Бла1 Бла2 бла3, бла4! бла5? Бла6, Бла44»
Заметьте, не выделено «Бла44», хотя при обычном поиске Бла4 найдет вхождение в Бла44. Поиск должен опираться на то, что слово ограничено знаками препинания, пробелами, кавычками, скобками и пр. знаками.
Следующий поисковый запрос, в случае нахождения совпадения дописывается в конец word-файла.
Для тестирования поисковых запросов прикладываю файлы:
1. Тексты ЖЭ для тестирования (тот самый искомый Excel-файл), в котором ищем.
2. Поисковые запросы - тот самый искомый txt-файл (продублировал тоже самое в word-формате).
Выбранный исполнитель
Заявки фрилансеров
Похожие заказы
- Прикладное ПО2 заявкиЗакрыт4 года назад
Разработать скрипт, который сканирует директорию и преобразует текстовые метаданные файлов формата *.tiff в кодировку UTF8. Минимальный набор полей для обработки: Title, Subject, Tags, Comments, City. Необходимо обеспечить валидацию работы, чтобы все поля отображались на русском языке. Инструментарий для разработки не ограничен, требуется инструкция по настройке окружения.
Прикладное ПО1 заявкаЗакрыт4 года назадРазработка телеграм и вайбер ботов для интернет-магазинов и доставок с функцией автооплаты. Боты позволяют пользователям выбирать товары, добавлять их в корзину, вводить адрес доставки и оплачивать. Включает подробную инструкцию, аренду сервера на месяц и полное управление ботом.
Прикладное ПОнет заявокЗакрыт4 года назадТребуется разработать класс на C#, который будет парсить цены такси Максим. На вход подаются координаты начальной и конечной точек, а также город. На выходе необходимо получить всю информацию о поездке, предоставляемую сервисом.
Прикладное ПО7 заявокЗакрыт4 года назадТребуется разработать программное обеспечение для сбора данных о должниках с сайта ФССП. Необходимо реализовать возможность выбора субъекта и выгрузку всех столбцов в формате Excel.
Прикладное ПО2 заявкиЗакрыт4 года назадРазработать программу под Linux для совершения звонков через SIP телефонию. Программа должна проигрывать аудио и распознавать ответы 'да' или 'нет', выполнять HTTP запросы и обрабатывать различные сценарии. Использовать open-source технологии, такие как Asterisk и CMUSphinx. Код должен быть предоставлен после завершения работы.
Прикладное ПОнет заявокЗакрыт4 года назад- $50
Необходимо разработать интеграцию между Airtable и Advego на платформе Integromat. Функционал включает создание компаний и заказов, а также сбор и обновление информации по типу работы, тексту, тематике, языкам, уровням исполнителей и белым спискам. Требуется опыт работы с Integromat.
Прикладное ПО1 заявкаЗакрыт4 года назад Требуется разработать приложение для учёта товаров на складе с использованием Python и Django. Необходимо реализовать модели для хранения информации о товарах, а также два REST API эндпоинта: для CRUD-операций с товарами и для получения общей стоимости запасов. Приложение должно показывать общее количество различных товаров и суммарную стоимость каждого товара.
Прикладное ПО2 заявкиЗакрыт4 года назадТребуется разработать торговый бот на Python для Binance, который будет тестировать стратегии на исторических данных и торговать в реальном времени. Стратегия включает отскок от скользящей средней с установкой стопов и тейков в зависимости от ATR. Готовы предоставить условия для входа и выхода.
Прикладное ПО3 заявкиЗакрыт4 года назад