Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Нужно улучшить работу передачи аудио файлов с сервера к клиенту (использую модуль socket для создания сервера.

Работа сервера:

На сервере преобразую текст(ответ голосового ассистента) в речь с помощью модуля torch(на нём запускается заранее натренированная нейросеть из интернета по преобразованию текста в речь), после того как получу: audio- переменная с аудио, подготавливаю ее к отправке к клиенту: audio=dumps(audio)- делаю это с помощью модуля pickle(from pickle import dumps), затем отсылаю переменную с аудио к клиенту (client_socket.sendall(audio))- перед отправкой, отправляю клиенту размер аудиопеременной (client_socket.sendall(bytes(f'{str(len(audio))', 'utf-8')) )

Работа клиента:

Клиент принимает информацию о размере переменной с аудио (size=client.recv(1024).decode('utf-8')), затем клиент получает аудиопеременную (audio=client.recv(int(size))) и преобразует ее в аудио для озвучки (audio=loads(audio)), используя- from pickle import loads, затем он все это воспроизводит с помощью- from sounddevice import play, stop (play(audio, 50000))

Проблема:

Все работает, но довольно часто выскакивает ошибка: pickle data was truncated 'utf-8' codec can't decode byte 0xbb in position 1: invalid start byte, на одних компьютерах эта ошибка выскакивает постоянно, на других часто, но не всегда, на третьих(в моей локальной сети) очень редко, предполагаю, что это связанно с качеством интернета и с тем, что файл довольно большого размера передается одним пакетом, а его данные повреждаются, что и приводит к ошибке, указанной выше

Tакже нужно улучшить-оптимизировать модуль, срабатывающий при обращении к голосовому ассистенту по имени(сейчас голосовой ассистент слушает речь(по предложениям), предложения определяются по паузам в речи, затем ищет свое имя в предложении, если он его находит, то подает запрос на сервер.

Необходимо, чтобы ассистент(модуль по преобразованию речи в текст) срабатывал при тригере(обращении к нему по имени), а после этого начинал уже слушать остальной текст. То есть ассистент должен начинать обработку речи(перевод речи в текст) только после того, как услышит тригер(обращении к нему по имени), для преобразования речи в текст я использую модуль PyAudio и Vosk(заранее натренированная нейросеть из интернета)

год назад
guest_1702817526155
год в сервисе
Был
год назад

Заявки фрилансеров

Нет заявок фрилансеров
  • Похожие заказы

  • Ищется опытный разработчик приложений Shopify для создания приложения, позволяющего клиентам запрашивать скидки на товары. Обязанности включают реализацию функционала, создание интерфейса для администраторов и интеграцию системы биллинга. Необходим опыт разработки для Shopify, знание архитектуры и API, а также отличные навыки командной работы.

    Закрыт
    год назад
  • Необходимо автоматизировать извлечение заданных химических элементов из предоставленного корпуса текста. Совпадения должны быть возвращены в порядке их появления. Результирующий DataFrame должен включать все соответствующие совпадения для указанных химических элементов. Обратите внимание на прикрепленный файл для деталей.

    Закрыт
    год назад
  • Требуется разработать алгоритм для построения и общего толкования натальных карт, а также для анализа по выбранному периоду: день, месяц, год. Использование нейронных сетей будет преимуществом. Проект включает создание прикладного ПО для удобного взаимодействия с пользователями.

    Закрыт
    год назад
  • $200

    Разработайте решение для интеграции GPT в Tinder, чтобы ИИ мог общаться с пользователями от лица модели. Необходимо, чтобы система анализировала переписку, читая и обрабатывая ответы для более естественного взаимодействия.

    Закрыт
    год назад
  • Требуется разработка и внедрение CRM системы для управления сделками на основе входящих писем от клиентов. Основные функции: видимость сделок для менеджеров, автоматизация распределения лидов, создание отчетов, интеграция с телефонией и мессенджерами. Необходимо обеспечить надежный почтовый сервер, исключающий задержки отправки писем.

    Закрыт
    год назад
  • Необхідно провести портування програми з Qt 4 на Qt 6. Включає в себе адаптацію коду та оновлення функціональності відповідно до нових стандартів Qt. Очікується високий рівень знань у програмуванні на C++ та досвід роботи з обома версіями Qt.

    Закрыт
    год назад
  • Необходимо разработать систему, состоящую из пяти основных сервисов на GO: Client Service, Trip Service, Driver Service, Location Service и Offering Service. Сервисы должны взаимодействовать через Kafka и использовать MongoDB и PostgreSQL для хранения данных. Асинхронный обмен сообщениями обеспечит интеграцию между сервисами и улучшит эффективность работы системы.

    Закрыт
    год назад
  • $100

    Требуется разработка Телеграм бота для знакомств. Необходимо создать функционал, который обеспечит взаимодействие пользователей. Подробности и требования к функционалу будут оговорены в процессе обсуждения.

    Закрыт
    год назад
  • Требуется создать скрипт на Telethon для автоматического выставления реакций на последние 5 постов в Telegram каналах. Необходимо учитывать собственные аккаунты и устанавливать реакции в диапазоне 4-8% от количества глаз. Реакции должны обновляться каждую минуту для новых постов и каждые 5 минут для старых. Поддержка нескольких каналов и возможность работы с аккаунтами в формате tdata.

    Закрыт
    год назад