转发:https://zhuanlan.zhihu.com/p/62073090
作者:@Ai酱
统计就是根据样本估计总体的概率分布。概率是已知总体概率分布,求某个样本的概率。
举个高中常见的例子:
什么是统计?:不知道袋子里面多少球,现在从袋子取5次球。发现4次是红,1次是白。然后我们估计这个袋子红白比例可能是4:1。这就是统计,根据抽样来估计整体的样本分布规律。
什么是概率?:已知袋子有10个球,红球8个,白球2两个。现在问取出一个白球的概率是多少?这就是概率计算。已知总体分布,求某条样本的概率。
那么概率统计与机器学习的联系是什么?
答:数据挖掘和机器学习的模型训练过程是统计,而将一个数据输入训练好的模型得到数据的过程就是概率计算。
训练过程是从很多数据抽取样本,这不就是根据样本学习总体的概率分布么?
使用训练好的模型,进行分类预测,比如是分类模型一般输出一个数字,这个数字其实就是概率。使用训练好的模型就是,我们认为模型就是总体的概率分布,然后根据这个概率分布计算某种样本的概率。
总结:
概率统计与机器学习神经网络的联系?
训练是统计,预测和分类是概率计算。
推荐阅读:
- pytorch神经网络实践(1): 安装与初次使用pytorch搭建神经网络实践手写数字识别教程
- 如何理解那个把嫦娥送上天的卡尔曼滤波算法Kalman filter?
- 啤酒与尿布?机器学习之Apriori算法挖掘商品之间的关联性Python实现
欢迎关注我的知乎专栏适合初学者的机器学习神经网络理论到实践。