缪志敏1,胡谷雨1,丁 力1,赵陆文2,潘志松1
MIAO Zhi-min1,HU Gu-yu1,DING Li1,ZHAO Lu-wen2,PAN Zhi-song1
摘要: 在解决单分类问题的支持向量数据描述算法的基础上提出了适用于两类不平衡问题的I-SVDD(Imbalance-Support Vector Date Description)算法。该算法通过增加样本的分布信息,对带野值的SVDD算法中的C值重新进行了定义。采用该算法对UCI数据集和人工样本集进行实验表明,改进后的I-SVDD算法比带野值的SVDD算法的AUC值平均提高12%以上;比AdaBoost算法在正类查全率上平均提高35%,精确度也提高了2%以上。I-SVDD算法在保证少数类样本高分类精度前提下,还有效提高了全样本的分类精度,更符合现实不平衡问题中对少数类样本的处理要求。