Моделирование
Для обучения моделей машинного обучения и выполнения предсказаний вероятности на основе данных в платформе ANTAVIRA реализован модуль линейного моделирования, который включает в себя следующие алгоритмы машинного обучения:
- Логистическая регрессия;
- Линейная регрессия;
- Дерево решений;
- Лес решений.
В модуле линейного моделирования помимо выбора алгоритма машинного обучения Вам также предлагается настроить:
- Выполнение градиентного спуска при необходимости, включающее выбор типа спуска (подъем; спуск), правил отбора переменных (Логарифм правдоподобия; Ошибка 1,2 рода; Ошибка 1 рода; Ошибка 2 рода; AUC) и настройку количества итераций.
- Отбор переменных по IV/IG (В разработке) для того, чтобы платформа отбирала в моделирование только те переменные, значимость на целевую функцию которых превышает заданное Вами значение.
- Обучаемое значение (В разработке) (в случае если на этапе обработки значений переменных Вы выбрали способ, связанный с преобразованием признаков в категориальные: группировка, кластеризация, бинирование).

Логистическая Регрессия
При построении модели машинного обучения с использованием логистической регрессии Вам предлагается настроить следующие параметры:
- Максимальное количество переменных;
- Максимальное количество итераций;
- Значение регуляризации;
- Минимальный порог IV вхождения переменных в модель;
- Алгоритм оптимизации;
- Критерий остановки в поиске коэффициентов регрессии;
- Градиентный спуск.

Линейная Регрессия
При построении модели машинного обучения с использованием линейной регрессии Вам предлагается настроить следующие параметры:
- Максимальное количество переменных;
- Минимальный порог IV вхождения переменных в модель;
- Тип коэффициентов регрессии;
- Градиентный спуск.
Дерево Решений
При построении модели машинного обучения с использованием дерева решений Вам предлагается настроить следующие параметры:
- Максимальная глубина дерева;
- Функция для измерения качества разделения;
- Минимальный порог IV вхождения переменных в модель;
- Максимальное количество переменных;
- Минимальное количество выборок, необходимое для разделения внутреннего узла;
- Минимальное количество отчетов, которое должно находиться в листовом узле;
- Градиентный спуск.
Лес Решений
При построении модели машинного обучения с использованием леса решений Вам предлагается настроить следующие параметры:
- Количество деревьев в лесу;
- Максимальная глубина дерева;
- Минимальное количество отчетов, которое должно находиться в листовом узле;
- Функция для измерения качества разделения;
- Максимальное количество переменных;
- Минимальный порог IV вхождения переменных в модель;
- Градиентный спуск.