Моделирование
Для обучения моделей машинного обучения и выполнения предсказаний вероятности на основе данных в платформе ANTAVIRA реализован модуль линейного моделирования, который включает в себя следующие алгоритмы машинного обучения:
- Логистическая регрессия;
- Линейная регрессия;
- Дерево решений;
- Лес решений.
В модуле линейного моделирования помимо выбора алгоритма машинного обучения Вам также предлагается настроить:
- Выполнение градиентного спуска при необходимости, включающее выбор типа спуска (подъем; спуск), правил отбора переменных (Логарифм правдоподобия; Ошибка 1,2 рода; Ошибка 1 рода; Ошибка 2 рода; AUC) и настройку количества итераций.
- Отбор переменных по IV/IG (В разработке) для того, чтобы платформа отбирала в моделирование только те переменные, значимость на целевую функцию которых превышает заданное Вами значение.
- Обучаемое значение (В разработке) (в случае если на этапе обработки значений переменных Вы выбрали способ, связанный с преобразованием признаков в категориальные: группировка, кластеризация, бинирование).
Логистическая Регрессия
При построении модели машинного обучения с использованием логистической регрессии Вам предлагается настроить следующие параметры:
- Регуляризация;
- Максимальное количество итераций;
- Алгоритм оптимизации;
- Штраф за ошибку.
Линейная Регрессия
Параметры, позволяющие осуществлять эксперименты, находятся в доработке.
Дерево Решений
Параметры, позволяющие осуществлять эксперименты, находятся в доработке.
Лес Решений
Параметры, позволяющие осуществлять эксперименты, находятся в доработке.