Комплексный анализ данных на R
Программа выполняет анализ данных для оценки логистической регрессии с использованием двух разных методов: метода наименьших квадратов (NLS) и метода максимального правдоподобия (MLE). Вот краткое описание шагов программы:
1. Шаг 1: Чтение и Подготовка данных:
- Происходит загрузка данных из файла Heart.csv
.
- Проверяется структура данных.
2. Шаг 2: Оценка NLS:
- Производится оценка логистической модели с использованием метода наименьших квадратов (NLS) с помощью алгоритма Гаусса-Ньютона.
- Преобразование категориальных переменных.
- Вычисление суммы квадратов остатков.
3. Шаг 3: Визуализация оценки NLS:
- Строится график суммы квадратов остатков для различных значений параметра $\beta_{\text{Age}}$ при фиксированных остальных параметрах.
4. Шаг 4: Оценка MLE:
- Производится оценка логистической модели с использованием метода максимального правдоподобия (MLE) с помощью функции glm
с семейством binomial
.
- Сводная информация о модели.
5. Шаг 5: Визуализация оценки MLE:
- Строится график логарифма правдоподобия для различных значений параметра $\beta_{\text{Age}}$.
6. Шаг 6: Повтор MLE с увеличенным объемом выборки:
- Производится повторное выполнение MLE на увеличенной выборке.
- Сравнение логарифма правдоподобия для оригинальной и увеличенной выборок.
Эта программа предназначена для исследования и сравнения двух методов оценки логистических моделей на основе данных о сердечных заболеваниях и является полезным инструментом для статистического анализа данных и моделирования.