Требуется опытный специалист по Tesseract OCR для обучения и настройки системы. Необходим опыт работы с данным программным обеспечением. Задача включает в себя настройку и оптимизацию Tesseract для эффективной работы.
Разработка программы для анализа и сравнения текстовых pdf документов
Задача
Техническое задание на разработку программы
1. Название проекта
«Разработка программы для анализа и сравнения pdf документов»
2. Цель проекта
Разработать программу, которая сможет анализировать загруженные текстовые документы в формате PDF, сравнивать их между собой и с эталонным образцом, определяя ошибки и неточности. (сопоставлять ссылки одного документа на другой, даты действия документов их название, фамилии, названия юр лиц, количество листов итд). ПРОВЕРКА ОРФОГРАФИИ НЕ ТРЕБУЕТСЯ.
Отчеты:
Формирование отчета о найденных ошибках и неточностях.
Визуализация различий на документах.
Интерфейс должен позволять загружать PDF документы, включать/отключать уровни проверки (например, не сопоставляем даты). Кроме того система должна сопоставлять часть данных в документах с загруженными в нее исходными данными, например фамилии сотрудников и названия юр.лиц.
Алгоритм сравнения документов подробно пропишем текстовым документом. Кратко описание есть на видео по ссылке. https://disk.yandex.ru/d/avJ4zk1rjdB3nw
Рассматриваем вариант MVP с декстопным решением.
Заявки фрилансеров
Похожие заказы
- Прикладное ПО2 заявкиОткрыт14 дней назад
Требуется разработать графического бота для игры World of Warcraft, способного фармить золото по заданным маршрутам с возможностью настройки профилей и ротации способностей. Бот должен имитировать поведение игрока, минимизируя задержки в выполнении команд. Необходимо поддерживать запуск нескольких копий и работу на виртуальных машинах. Ожидается опыт в разработке ботов и знание игры.
Прикладное ПО3 заявкиОткрыт15 дней назад- $100
Требуется разработать простое приложение, которое создает защищенное подключение с использованием протокола VLESS/Xray. Необходимо реализовать проверку подписки через API, а также подключение к серверам через общий шлюз с последующей отправкой на менее загруженный сервер. Ожидается двухэтапное подключение.
Прикладное ПО1 заявкаОткрыт16 дней назад - $500
Шукаємо фрілансера для інтеграції SSO через SAML 2.0 в AIScreen.io. Завдання: налаштувати інтеграцію з Azure AD, Okta, OneLogin, Google Workspace, реалізувати автоматичну авторизацію та розробити UI для адмін-панелі. Вимоги: досвід роботи з SAML 2.0, Python/Node.js, знання SSO-провайдерів.
Прикладное ПОнет заявокОткрыт16 дней назад Требуется реализовать эндпоинт для стримингового скачивания медиа-файлов из CDN и интегрировать его в существующий бэкенд на Kotlin с использованием Spring. Имеется готовый метод генерации URL для скачивания файлов из CDN, использующего minio.
Прикладное ПО3 заявкиОткрыт16 дней назадСоздайте спайку из двух программ: Мастер для генерации ключей уровней 1-15 и Ведомая, активируемая ключом из первой программы. Ведомая должна иметь возможность генерировать ключи до уровня, на котором была активирована. Интерфейс должен быть простым — пара кнопок и окна для ввода-вывода. Задача подходит для студентов и начинающих разработчиков.
Прикладное ПО1 исполнительЗавершен15 дней назад- $100
Требуется отладить обработку Раруса для переноса данных в БП 3.0. Проблема заключается в том, что при загрузке XML документов на сервере происходит превышение максимального расхода памяти, что приводит к отключению системы. Необходимо оптимизировать процесс для избежания ошибок.
Прикладное ПО3 заявкиОткрыт16 дней назад - $20
Требуется разработка таблицы в Excel для прикладного ПО. Необходимо создать функциональную таблицу, которая будет удобна для работы с данными. Укажите, какие именно данные должны быть включены и какие функции таблицы должны быть реализованы.
Прикладное ПО7 заявокОткрыт17 дней назад Требуется разработать прикладное ПО для перехвата заказов от пользователей в водительском приложении такси. Программа должна учитывать определенные параметры для эффективной работы.
Прикладное ПО2 заявкиОткрыт17 дней назад- $36
Необходимо извлечь 71 таблицу из предоставленных PDF-файлов и сохранить их в Excel. Каждая таблица должна быть на отдельном листе, всего 12 файлов для каждого месяца. Все значения в формате зеленых галочек замените точкой в центре ячейки. Данные должны быть читаемыми и соответствовать примеру.
Прикладное ПО12 заявокОткрыт18 дней назад