
live and let die~ 人生几何,我不信命,但"算功"可以了解一下!
欲学算功,必先自宫~若不自宫,也能成功,先来两粒大力丸:数据类型+分布。数据类型(随机变量)就像是一盘磁带,
A面:离散数据,
B面:连续数据。
离散数据:是指随机变量只能取
有限个或者可列举
无穷多个值。
数据取值不连续,突出一个“
散”。
离散数据的一个典型栗子就是~
掷钢镚儿,因为抛钢镚儿就2种数值(结果),正或反。

你可以把
离散数据理解成武林剑侠必练的
梅花桩,桩桩独立有间隔(谁也别挨着谁),一个
桩就是一个数值。爱吃的老鼠们也可以将其理解为大米!
连续数据,可取
随性任意数值,突出一个“
滑”~爱吃主义的同志们可以将其理解为绵延细滑的"拉~面"!

举个
连续数据的
典型板栗子,火箭发射倒计时,时间就是一个典型连续数据~它能无限分割,只要原子时钟显示器位数够多。
连续数据就像开盘磁带机遇上陈年老胆机后孕育出的一条平滑细腻连绵丰满的音频谱,让你欲仙欲湿致幻致迷陶醉到不省人事。此处友情提示:视听器材,小玩怡情,猛烧伤肾,水深有坑!
分布~就是
50米速射一顿突突兔后靶子上的弹孔的筛状(数据在统计图中的形状)。常见的离散分布有二项分布、泊松分布、几何分布、负二项分布和多项分布等。

咳咳~敲黑板复习重点,瑞屁一下:
数据类型(随机变量)有2种:离散数据类型(例如开木仓打炮、抛钢镚儿的结果
) 、连续数据类型(例如时间、长度
)
2) 分布:数据在统计图中的形状(靶子上的筛状图
)概率分布就是将上面两个大力丸(数据类型+分布)糅合在一起成为“
大还丹”:
概率分布就是在
统计图中表示
概率,横轴数值,纵轴概率。
数据类型有A、B面,So,
概率分布也分:
A离散概率分布,B连续概率分布。
侬晓得为撒子一定要搞懂数据类型噻?就像米食和面食有不同烹饪方法,不同数据类型也对应不同的概率求法。
离散概率分布,我们关心的是取得一个
特定数值的概率。例如抛钢镚儿正面向上的概率为:p(x=正面)=1/2
连续概率分布,俺们更关心的是一个
特定范围的概率是多少。一想到那无穷无尽的取值就开始怀疑人生了,不可能列举每一个精确数值,故无法给出每一个数值的概率。
概率分布能顶个卵用么?当饭店老板开始研究客人点菜的概率分布时,他们发现,八大菜系中有几个菜系最畅销,于是就让厨子们重点研究这几种菜系的料理特征,以此满足食客特定的要求。牢记招牌菜系做法的好处就是:
化繁为简,标准模式化。
下次遇到类似的客官,厨师们直接套用“菜谱”(特殊分布的规律)来配菜烹调就OK了。咱来聊聊常见的南北口味(概率分布)~和四大菜籽!
1)南方的麻、辣、烫~3种离散概率分布:钢镚(二项分布,Binomial distribution
) U2(
泊松分布,poisson distribution
) 曹操(
几何分布,Geometric distribution
)2)北方的兰州拉面~连续概率分布:小正太(
常态分布,Normal distribution)
高斯分布(Gaussian distribution)

在开始介绍之前,你先回顾下这两个知识:
期望(体重):概率的平均值 、
标准差(腰围):衡量数据的波动大小
第1种:钢镚儿分布(二项分布)1. 钢镚儿分布有猫用呢?当你想买六合彩,如果中奖发生次数固定,而你感兴趣的是中头彩的次数,那么就可以用二项分布的公式快速计算出概率来。之后你可能不抱光靠中奖发家致富的空幻希望了。
2. 如何判断是不是钢镚儿分布?钢镚儿:代表事件有2种可能结果,胜者为王or败者为寇。
钢镚儿分布有
三个特点:
1)做某件事的次数(也叫试验次数)是固定的,用n表示。抛钢镚儿7次,发射8枚炮弹……
2)每次事件都有两个可能的结果(成功或失败,命中或脱靶)抛钢镚儿有2个结果:正面(成功),反面(失败)
3)每次成功的概率都是相等的,成功的概率用p表示 每次抛钢镚儿正面朝上的概率都是1/2,结局 / 结果
目的:你想知道成功x次的概率是多少? 比如你用这把老木仓
打靶3次,2次上靶的
概率是多少
?
这时候,
钢镚儿分布的公式就可秒算出了:
这个公式就是计算做某件事情n次,成功x次的概率的。例如,打靶5次(n),恰巧有3次上靶(x=3,上靶概率p=1/2),可以用公式计算出概率为31.25%(用Excel的BINOM.DIST函数)
钢镚儿分布经常要计算的概率还有这样一种情况:打靶5次,子弹至少有3次上靶(即x≥3)的概率是多少?
逆向思维,即最多2次上靶。只要我们先计算出最多2次上靶的概率p(x≤2),那么至少3次正面朝上的概率就是1-p(x≤2)。这样用逆向思维,就把一个复杂的问题,化解为简单的问题。因为求做多2次朝上的概率比较简单:p(x≤2)=p(0)+p(1)+p(2)
钢镚儿
期望值E(x)=np (表示某事情发生n次,预期成功多少次。)做任何事情之前,知道预期结果肯定对你
后面的决策有帮助。你打靶5次,每次概率是1/2,那么
期望值E(x)=5*1/2=2.5次,也就是有大约3次你可以上靶。
第2种:曹操分布其实我一直把
曹操分布,叫做
钢镚儿分布的孪生兄弟,因为他两太像了。只有一点不同(超人和我只是内裤穿的位置不一样)
1. 曹操有个鸟用?曹操鉴于之前败走华容道,现在特关心
第x次出兵征东吴老孙,能取得
第一次成功。因为在成功前这大白脸儿要失败(x-1)次。
2. 如何判断是不是曹操?只要符合下面
四个特点就可以判别:
1)做某事件次数(也叫试验次数)是固定的,用n表示,如交锋3次,射击5次
2)每一次事件都有两个可能的结果(胜或败,击中或脱靶)
3)每一次“成功”的概率都是相等的,成功的概率用p表示
4)你感兴趣的是,进行x次尝试这个事情,取得1st成功的概率是多大。
侬发现没?
曹操和钢镚儿只是目的不同。3. 曹操如何计算概率?曹操的期望值是E(x)=1/p。代表什么意思呢?假如你每次用肩扛导弹打美帝小飞机的成功概率是60%,同时你也符合曹操分布的特点,所以期望E(x)=1/p=1/0.6=1.67。所以你可以期望自己打1.67次(约等于2次)就会成功击中飞机。你说振奋不振奋!?
第3种U2分布(泊松分布)1. U2分布有灯笼用?想知道某个
时间范围内,
发生某件事情
x次的概率是多大。就可以用
U2分布轻松搞定。
2. 什么是U2分布(泊松分布)?符合以下
3个特点就是U2分布:
1)事件是独立事件(拦截U2就是独立事件)
2)在任意相同的时间范围内,事件发的概率相同(侵扰第1天内拦截概率与侵扰第2天内拦截概率相同)
3)你想知道某个时间范围内,发生某件事情x次的概率是多大(想知道侵扰侦查活动一周内U2被拦截的概率)

用x代表事情发的次数(例如3架U2被拦截),u代表给定时间范围内事情发生的平均次数(例如侦查侵扰中,10个月平均被拦截1架),概率计算公式为:有计算工具(Excel,Python,R)都可以直接计算出来这个概率,只要记住U2分布(
泊松分布)适合啥时候用就噢了。

举个栗子,周边岛链傀儡国拟针对我天朝搞无人机侦查项目,只知道1天内被我人民空军拦截的平均架次数为5个,你想知道1天内恰巧被拦截击中次数为7的概率是多少?
此时x=7,u=5(区间内发生的平均次数),代入公式求出概率为10.44%。Excel中的函数为POISSON.DIST就可以立马算出来。所以,傀儡国军部一曲凉凉否决了此项计划,决心从良了吼吼~
U2分布(泊松)概率还有一个重要性质,它的数学期望和方差相等,都等于uU2分布是钢镚分布n很大而P很小时的特殊形式
连续概率分布:高斯分布或
正态分布或
常态分布(Normal distribution)
这个分布在生活中太有用了,给我一种相见恨晚的“麻酥感”!
正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布

σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
钢镚儿和U2的小秘密:钢镚儿可以在n很大,p接近0时直接转化为U2!钢镚儿、U2都可以整容变成
小正太哦(就像南方的米可以加工成米粉一样噻),但是由于小正太是连续变量,所以需要加一个Continuity correction(米粉加工过程中需要加各种料一样嘛)。
谨记圆粉与扁粉的区别:钢镚儿转换时要n很大,p接近于5的条件。U2则不需要任何条件。
感谢围观!欢迎转发