4.5.3. Отсечение ветвей.
Ряд проблем, порождённых размерностью задачи, может существенно снизить качество полученного решения. Одна из них связана с тем, что часть дерева, заканчивающаяся меткой класса, может быть порождена примерами, являющимися «шумными» в том смысле, что элемент выбран ошибочным образом.
Вторая связана с тем, что если число элементов велико, дерево может содержать ветви, порождённые случайными свойствами, являющиеся нерелевантными корректной классификации. Наконец, очень большие деревья трудно интерпретировать, и для пользователя они будут «черными ящиками».По всем указанным причинам иногда полезно сократить построенное дерево, отсекая некоторые ветви. В принципе, возможны два подхода к отсечению ветвей: онлайновый интерактивный и постсокращение. Онлайновое отсечение ветвей не позволяет дереву расти, когда значение функции полезности, связанное с разделением набора примеров, падает ниже некоторого порога. Постсокращение позволяет отсечь некоторые ветви дерева после завершения его построения.
Один из наиболее известных подходов к сокращению был разработан И. Братко [35]. И. Братко предложил отсекать ветви таким образом, чтобы минимизировать полную ожидаемую ошибку классификации на новых примерах. Для этой цели ошибка классификации подсчитывается для каждого узла в дереве. В листьях дерева для оценки ошибки используются методы теории вероятности. Например, можно использовать формулу Лапласа.
Для узлов, не являющихся листьями дерева решения, ошибка классификации вычисляется как взвешенная сумма ошибок классификации поддеревьев каждого из узлов. Вес полагается равным относительной частоте примеров, «передаваемых» из узла в соответствующие поддеревья. Далее ошибка классификации в «нелиственном» узле оценивается для случая отсечения ветвей, исходящих из него, так что он становится листом. Если эта оценка меньше, чем предыдущая, то соответствующие поддеревья отсекаются. Этот процесс распространяется от основания дерева к его листьям до тех пор, пока оценки ошибки уменьшаются.
Преимущества постсокращения по сравнению с интерактивными методами состоят в том, что при постсокращении можно учесть глобальные свойства дерева классификации, в то время как при интерактивном отсечении ветвей минимум ошибки может оказаться локальным. Возможны и комбинированные подходы.
Еще по теме 4.5.3. Отсечение ветвей.:
- Параграф двенадцатый. Горячие опухоли в заднем проходе и рожистое воспаление в нем, начинающееся и возникающее после болей от почечуйных шишек и отсечения их
- Тромбоз центральной артерии сетчатки или ее ветвей
- СВЯЗЬ ПАТОГЕНЕЗА И СИМПТОМОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ И ЕЕ ВЕТВЕЙ
- ПАТОГЕНЕЗ РАССТРОЙСТВ ВНЕШНЕГО ДЫХАНИЯ ВСЛЕДСТВИЕ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ И ЕЕ ВЕТВЕЙ
- Тромбоз центральной вены сетчатки и ее ветвей
- ИЗМЕНЕНИЯ ЛНІ ИОЛРХИТЕКТОННКИ ВЕТВЕЙ НАРУЖНЫХ СОННЫХ АРТЕРИЙ ПРИ ТЯЖЕЛЫХ НОСОВЫХ КРОВОТЕЧЕНИЯХ
- Алгоритм построения новых ветвей.
- Эмболия центрально іі артерии сет ч а тки и ее ветвей
- Методы измерения уровня давления в воротной вене и ее ветвей:
- ЭМБОЛИЗАЦИЯ ВЕТВЕЙ НАРУЖНЫХ СОННЫХ АРТЕРИЙ ПРИ ЛЕЧЕНИИ КРУПНЫХ СОСУДИСТЫХ ВНЕЦЕРЕКРАЛЬИЫХ ОБРАЗОВАНИЙ ГОЛОВЫ И ШЕИ.
- ЭМБОЛИЗАЦИЯ ВЕТВЕЙ НАРУЖНЫХ СОННЫХ АРТЕРИЙ В ЛЕЧЕНИИ КРУПНЫХ СОСУДИСТЫХ НОВООБРАЗОВАНИЙ ПОЛОСТИ НОСА, ОКОЛОНОСОВЫХ ПАЗУХ И НОСОГЛОТКИ