淘先锋技术网

首页 1 2 3 4 5 6 7

概率算法标准法?

概率计算方法一:频次算法

即分别考虑每种事件发生的频次,单个事件频次除总频次,即是概率值,或者单个事件频次除以其他事件频次,然后再转化为概率值。

例如:邮件箱中收到大量邮件,有诈骗邮件,有正常邮件。根据统计,诈骗邮件中出现文字:“中奖”占30%,出现“www.”占40%;正常邮件出现“中奖”占1%,出现“www.”占2%。数据统计显示邮箱中诈骗邮件占比为20%,随机抽取一封邮件发现含有“中奖”和“www.”,这封邮件是诈骗邮件的概率是多少。

想直接列出概率算式有点难度,通过频次计算就比较简单。

这封邮件要么是诈骗邮件,要么是正常邮件。

先考虑含有“中奖”和“www.”的正常邮件有多少:(1-20%) x 1% x 2% = 160 %%%

再考虑 含有“中奖”和“www.”的诈骗邮件有多少 20% x 30% x 40% = 240%%%

两者比值 160 :240 = 2:3

因为这封邮件不是正常邮件就是诈骗邮件,两者的概率之和是1,所以诈骗邮件的概率就是:

3 :(2+3)= 60%。

从这个例子中可以看出,用频次计算概率,就是分别考虑所有情况发生的频次,然后算出比值,然后再看总概率等于多少,若是互斥事件,总概率就是1,所以频次比就可以转化为概率值。这样用分别考虑各自的频次的方法就能降低思考难度。

再举个取球的例子,两个盒子,甲盒子装有70个白球30个红球,乙盒子装有20个白球80个红球。随意拿出一个盒子,取出一个球看颜色,再放回,连续取20次,发现10个白球10个红球。问拿出的盒子是甲的概率多少。

用频次算法极为简单,分别算频次。

甲盒子中拿出10个白球和10个红球的频次是 0.7^10 x 0.3^10

乙盒子同样算法 0.2^10 x 0.8^10

频次之比就是概率之比,因为是概率之和等于1,就很容易把频次比转化为概率。

在教科书中,针对 这类问题,发明条件概率概念和贝叶斯公式,甚至还用到阶乘的运算,这种做法并不能降低思考的难度,在我看来没有必要。

概率计算方法二:集合对应法:

举例:半径为1的圆,通过上面一点做弦,弦长小于根号2的概率多少

通过画图显示,直观就能判断,弦的数目对应圆上的点,这些点的集合就是弧长,因此弦的数目可以用弧长对应,小于根号2的弦和所有弦的数目就是弧长和圆周长的比值。有了这种对应关系,很容易计算出概率值50%。

再举个稍微复杂的例子:在0和2之间取2个值x, y。 问x^2 + y <2 的概率是多大。

画个直角坐标系,很直观地就能知道,所有的取值点的集合是面积,对应2 x 2的区域面积,x^2 +y <2的取值点就对应曲线 x^2 +y =2 到坐标原点的面积,用积分就能求出面积,然后两个面积比值就是概率。

再扩展下,在0和2之间取4个值 a,b,c,d,a^4+b^3 +c +d <2 的概率是多少。

同样是积分之后与 2^4相除,即是概率值。

在教科书 中,针对这类问题,发明了古典和几何概型,发明了概率函数,概率密度等概念,繁琐难记,其实通过画图,直觉就能判断出集合对应关系,把概率运算转化为图形长度,面积,体积或者4维以上的积分运算,从而大幅降低思考和计算的难度。

概率计算方法三:反向算法

有些场合,正面去计算比较麻烦,如果从反面去计算,即先计算它的相斥事件的概率,再用1去减就可以得出概率值。

如常用的例子:一个班级同学有40位,至少有两个同学生日相同的概率是多大。

这个例子如果从正面考虑,先计算所有情况的频次,再考虑生日相同的频次,太麻烦了。

如果反方向考虑,至少有两个同学生日相同的概率的反面就是所有同学生日都不同,这个反面概率计算出来后用1减就得出了生日相同的概率。所有生日都不同的概率就比较容易计算。随便先拉出第一个同学,占用了某天,然后再拉出下一位,生日不同的概率是364/365,再拉出第三位同学,前面两个同学占用了2个日子,所以第三个同学与前两个同学生日不同的概率是363/365,以此类推,这些概率都相乘就是所有同学生日都不同的概率值,用1减去这个长式子乘积就是至少有两个同学生日相同的概率值。

通过这个例子可以看出,有些场合,反向的概率值容易计算,然后用1去减就得出了正面的概率值,思考难度大幅降低。

以上的三种算法都不需要学习教科书中的公理化知识,只要通过直觉和经验,用算术思维就能想出来,思考容易,运算也容易。

java 贝叶斯 算法,概率算法标准法