Цель задания:

С помощью библиотеки Mahout провести пару экспериментов по кластеризации, имея набор данных с помощью алгоритмов машинного обучения k-Means и fuzzy k-Means.

Необходимо сделать следующее:

1) Настроить кластер(3 машины) Hadoop Cloudera и Apache Mahout (CDH)

2) Провести вышеописанный эксперимент и получить результаты

Алгоритмы не нужно реализовывать, они готовы и находятся в библиотеке Mahout.

Первый пункт не обязателен, главное провести эксперименты, можно на уже готовом кластере если есть возможности по аренде.

Возможно проведение эксперимента с помощью Spark и библиотеки MLlib.

6 лет назад
zondbeer
30 лет
8 лет в сервисе
Был
6 лет назад

Заявки фрилансеров

Нет заявок фрилансеров
  • Похожие заказы

  • Дано: 1. Рабочий профиль (напр. "vk.com/123"): логин и пароль  (для получения токена) 2. Список имен в формате [Имя]+[ ]+[Фамилия] (напр."Иван Иванов"). Формат файла-".txt". Каждое имя - на отдельной строке. 3. Критерии ...

    Закрыт
    6 лет назад
  • Чатбот службы такси (работа с БД)  Части Админ: добавление/удалие/блокировка водителей, аналитика по водителям.  Части Пассажир: заказ такси, указание адреса, звонок водителю, стоимость поездки, оценка поездки, пригласить друга  Части Водитель: принять заказ, выставить ...

    Закрыт
    6 лет назад
  • Нужно создать новый или поправить действующий сайт для работы с парсерами сайтов и файлов xml действующий написан на C sharp План прилагаю ТЗ по запросу

    Закрыт
    6 лет назад
  • Нужна программа, написанная на Python Программа для ведения проектами Чтобы можно было добавить проект и ресурсы и в итоге отследить по времени по диаграмме Ганта - это самая важная функция Ничего супер ...

    Закрыт
    6 лет назад
  • Нужно подобрать микрокомпьютер (он будет монтироваться на плату), который будет не дорогой, но способный выполнять этот функционал:  - подключаться к домашней WiFi сети (быть точкой доступа при первом подключении)  - иметь блютуз (пока ...

    Прикладное ПОнет заявок
    Закрыт
    6 лет назад
  • $30

    Имеется главный компьютер(сервер) и множество виртуальныхмашин(клиент1, клиент2……). На всех них, включая сервер, установлены одинаковые версии Windows 7 и ониодинаково настроены.   Нужна программа состоящая из двух файлов – серверной части иклиентской части: ...

    Закрыт
    6 лет назад
  • Написать нейросеть на c# для распознания образов. Входы - 20*20 (булевы). Выходы - около 10. Требуются минимальные затраты на дальнейшее обучение

    Закрыт
    6 лет назад
  • Есть компьютер с сенсорным экраном, Windows 10. Нужна программа для прорисовки собственной ручной подписи на экране. как это работает: Заранее определяем 2 папки: входящую и исходящую. (Можно в ...

    Прикладное ПО1 исполнитель
    Завершен
    6 лет назад