AdaBoost 详解
  VW0ZAOA6bLNz 2023年12月10日 34 0


AdaBoost

Boosting

Boosting 是指,仅通过训练精度比随机猜想(50%)稍高的学习器,通过集成的方式过建出强学习器。

其中boosting中最有名的是AdaBoost算法。AdaBoost是英文"Adaptive Boosting"(自适应增强)的缩写,它的自适应在于:前一个基本分类器被错误分类的样本的权值会增大,而正确分类的样本的权值会减小,并再次用来训练下一个基本分类器。同时,在每一轮迭代中,加入一个新的弱分类器,直到达到某个预定的足够小的错误率或达到预先指定的最大迭代次数才确定最终的强分类器。

AdaBoost 推导

设存在数据集 AdaBoost 详解_迭代 ,其中 AdaBoost 详解_迭代_02

考虑二分类问题

因为AdaBoost算法最终得到的学习器是由多个弱学习器集成而来的,由此设
AdaBoost 详解_迭代_03
其中 AdaBoost 详解_迭代_04为参数向量,代表第k个学习器的参数, AdaBoost 详解_权重_05为第k个学习器的权重,表示在最终学习器中第k个学习器在其中的权重。

其中最终决策为
AdaBoost 详解_迭代_06
当正确分类时,存在 AdaBoost 详解_权重_07

当错误分类时,存在 AdaBoost 详解_机器学习_08

其中AdaBoost分类的目标就是尽可能的正确分类,即最大限度时,错分的样本数目最少,由此构建目标函数
AdaBoost 详解_机器学习_09
其中在AdaBoost推导过程中,设 AdaBoost 详解_权重_10为前m个分类器的集成结果,即
AdaBoost 详解_权值_11
若写为增量表示,则为
AdaBoost 详解_机器学习_12
即前m个分类器集成的结果为前m-1个分类器集成的结果加上第m个分类器的结果 AdaBoost 详解_人工智能_13

由此前m个分类器的目标函数为
AdaBoost 详解_权重_14
AdaBoost 详解_迭代_15为前AdaBoost 详解_人工智能_16个分类器对AdaBoost 详解_权重_17对错分指数,易知这与第m个分类器的 AdaBoost 详解_迭代_18无关。即
AdaBoost 详解_人工智能_19
所以前m个分类器的目标函数可以写为
AdaBoost 详解_迭代_20
由此我们选择的参数 AdaBoost 详解_权重_21 应是使得目标函数最小的,即错分的样本最少
AdaBoost 详解_机器学习_22
其中:

AdaBoost 详解_机器学习_23是一个非0即1的函数,当 AdaBoost 详解_权值_24是函数 AdaBoost 详解_权重_25,即正确分类时,函数 AdaBoost 详解_机器学习_23为0,当错误分类时,函数 AdaBoost 详解_机器学习_27

AdaBoost 详解_人工智能_28为第m个分类器错误识别样本的平均权重。求 AdaBoost 详解_权值_29通常在选择第m个分类器时候,选择阈值 AdaBoost 详解_人工智能_30

所以优化目标可以改为:优化第m个分类器,使得错分样本对应的平均权重最小,即在第m个分类器的正确分类样本,尽可能时前m-1个分类器中错分指数大的样本即 AdaBoost 详解_迭代_15 大,求 AdaBoost 详解_权重_21。即可认为在集成过程中使得对 AdaBoost 详解_权重_17分类错误的学习器的AdaBoost 详解_迭代_15小,使得最终的学习器受到错分的影响最小。
AdaBoost 详解_权值_35
因为
AdaBoost 详解_权值_36
所以
AdaBoost 详解_迭代_37
由此设存在函数:
AdaBoost 详解_权重_38
对其求导数得到
AdaBoost 详解_权值_39
AdaBoost 详解_人工智能_40得到 AdaBoost 详解_迭代_41的取最小值时的 AdaBoost 详解_迭代_42AdaBoost 详解_迭代_43
AdaBoost 详解_机器学习_44
由此更新权重
AdaBoost 详解_权重_45
AdaBoost 详解_人工智能_46代入可得:

被第m个分类器正确分类的样本权值为:
AdaBoost 详解_迭代_47
被第m个分类器错误分类的样本权值为:
AdaBoost 详解_迭代_48
归一化:
AdaBoost 详解_人工智能_49

示例

当存在10个样本如图所示
假设在正确分类的样本权值,不变错误分类的样本权值为:AdaBoost 详解_人工智能_50的情况下

AdaBoost 详解_权值_51

首先初始化各分类器的权重
AdaBoost 详解_权值_52
可得:AdaBoost 详解_人工智能_53

然后对其使用 AdaBoost 详解_人工智能_54分类器,分类结果如图所示

AdaBoost 详解_权值_55

易知有三个样本被错误分类

其中正确分类的样本权值不变,错误分类的样本权值为:

AdaBoost 详解_权重_56
其中
AdaBoost 详解_权重_57
即被错分的样本乘上平均错分权重
AdaBoost 详解_机器学习_44
得到
AdaBoost 详解_机器学习_59
对其AdaBoost 详解_人工智能_60进行归一化处理
AdaBoost 详解_人工智能_61
对其使用 AdaBoost 详解_权重_62分类器,分类结果如图所示

AdaBoost 详解_权重_63

易知有三个样本被错误分类
AdaBoost 详解_机器学习_64
AdaBoost 详解_权值_65进行归一化
AdaBoost 详解_权重_66

对其使用 AdaBoost 详解_机器学习_67分类器,分类结果如图所示

AdaBoost 详解_权值_68

易知有一个样本被错误分类
AdaBoost 详解_迭代_69
综上所述

AdaBoost 详解_人工智能_70


【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年12月10日 0

暂无评论

推荐阅读