Как работает алгоритм c4.5 деревьев принятия решений с числами? С словесными значениями более/менее понятно, но как он работает с цифрами? как определяет, что данный атрибут можно поделить на >50 и <50? думал, среднее значение, но нет

21 Авг 2019 в 06:10
104 +1
0
Ответы
1

Алгоритм C4.5, как и другие алгоритмы построения деревьев решений, работает с числовыми атрибутами следующим образом:

Сначала он выбирает лучший атрибут для разделения данных на разные классы (или значения целевой переменной). Это обычно делается с использованием метрик, таких как информационный прирост или коэффициент Джини.

Затем алгоритм определяет оптимальное значение для разделения данных на две части. В случае числовых атрибутов это может быть любое значение, которое дает наибольший прирост информации или минимальный коэффициент Джини.

Например, если у нас есть числовой атрибут "зарплата" и у нас есть два класса: ">50" и "<50", алгоритм C4.5 выберет оптимальное значение, которое наилучшим образом разделит данные на эти два класса. Это может быть не среднее значение, а любое другое значение, которое дает лучшее разделение данных.

После того, как атрибут разделен на две части, алгоритм рекурсивно продолжает деление каждой части дальше до достижения заданного критерия остановки.

Таким образом, алгоритм C4.5 работает с числовыми атрибутами, определяя оптимальные значения для разделения данных на разные классы на основе метрик информационного прироста или коэффициента Джини.

20 Апр в 13:22
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Название заказа не должно быть пустым
Введите email
Бесплатные доработки
Гарантированные бесплатные доработки
Быстрое выполнение
Быстрое выполнение от 2 часов
Проверка работы
Проверка работы на плагиат
Интересные статьи из справочника
Поможем написать учебную работу
Название заказа не должно быть пустым
Введите email
Доверьте свою работу экспертам
Разместите заказ
Наша система отправит ваш заказ на оценку 92 648 авторам
Первые отклики появятся уже в течение 10 минут
Прямой эфир