二值化顾名思义就是将数变成两种值,一般非0即1。而在验证码处理中,如果直接使用灰度图,那么每个像素的值会在0-255,这样肯定会增加计算时间,而二值化后每个像素的值只是0和1。
原理:首先从训练样本矩阵中选择第一个特征进行划分,使每个子表中该特征的值全部相同(比如第一个特征是男女,则可以划分出两个子表,男表和女表),然后再在每个子表中选择下一个特征按照同样的规则继续划分更小的子表(比如第二个特征是年龄,我可以划分成三个子表(当然根据情况的不同而不同),小于18,大于18小于60,大...
朴素贝叶斯定理原理请参考:[链接][链接]即 后验概率 = 先验概率 * 调整因子在分类中,先验概率指样本中该类别占所有类别的概率,调整因子则是每个样本特征的概率乘积,举个例子。帅不帅性格上进不值不值得交朋友帅好不上进不值得不帅不好不上进不值得帅好上进值得不帅好上进值得这里的先验概率就是指:值得交朋友(1/2) ...
灰度图是一个二维数组,每个值都表示这个像素点的灰度值(0到255之间的一个值),数组的维度(shape)则表示这个图片的长宽(单位像素px),先看个例子
我来说一下sklearn中knn的属性和方法sklearn.neighbors.KNeighborsClassifier(n_neighbors = 5,weights ='uniform',algorithm ='auto',leaf_size = 30,