百度做任務(wù)的網(wǎng)站百度搜索資源平臺(tái)token
目錄
1 正態(tài)分布相關(guān)的2個(gè)相關(guān)定理
1.1 大數(shù)定律:(證明了)分布的穩(wěn)定性
1.2 中心極限定理:(證明了)分布的收斂性
2 使用標(biāo)準(zhǔn)差和概率的2種思路
2.1 標(biāo)準(zhǔn)正態(tài)分布的曲線
2.2 兩種使用方式
2.3 第1種:按整數(shù)倍標(biāo)準(zhǔn)差δ 作為標(biāo)準(zhǔn)使用
2.3.1? ?比如3δ原則 /6西格瑪管理
2.3.2 還有LCL, UCL管理
2.2 第2種:按比較整的概率如95%對(duì)應(yīng)的標(biāo)準(zhǔn)差使用
3 應(yīng)用舉例1
4 應(yīng)用舉例2:造成誤差的原因不是樣本數(shù)占總體的比例,而是樣本的絕對(duì)數(shù)量!
關(guān)于正態(tài)分布,具體應(yīng)用
1 正態(tài)分布相關(guān)的2個(gè)相關(guān)定理
1.1 大數(shù)定律:(證明了)分布的穩(wěn)定性
- 大量試驗(yàn)結(jié)果穩(wěn)定性
- 頻率的穩(wěn)定性,
- 伯努利大數(shù)定律:樣本數(shù)多n變大,某個(gè)事件發(fā)生的頻度 =單次試驗(yàn)內(nèi)發(fā)生的概率
- 泊松大數(shù)定律:? ?樣本數(shù)多n變大,樣本平均值估計(jì) =總體平均值
1.2 中心極限定理:(證明了)分布的收斂性
- 分布的收斂性
- 隨機(jī)變量(如多次取樣的均值)會(huì)逐漸符合某一分布:正態(tài)分布
- 二項(xiàng)分布的極限分布是正態(tài)分布
- 無論一組變量獨(dú)立同分布,不管本身符合什么分布,但是有u和 δ^2。這組變量的樣本平均數(shù)(多次抽樣的平均數(shù)分分布)就服從 u和 δ^2/N的正態(tài)分布
2 使用標(biāo)準(zhǔn)差和概率的2種思路
2.1 標(biāo)準(zhǔn)正態(tài)分布的曲線
- 標(biāo)準(zhǔn)正態(tài)分布曲線,曲線下的面積可以表示概率
- 曲線上的每個(gè)點(diǎn),都是Xi值的標(biāo)準(zhǔn)值
- 標(biāo)準(zhǔn)值=xi-u/sd
2.2 兩種使用方式
- 我們根據(jù)不同的需要,確定了我們使用?2δ 還是2.58δ
- 如果有可能,我們使用其他標(biāo)準(zhǔn)的δ 都有可能,關(guān)鍵是根據(jù)需求來
- 當(dāng)我們需要以整數(shù)δ為標(biāo)準(zhǔn)來看概率時(shí),選擇 δ,2δ,3δ等
- 當(dāng)我們需要以比較整的概率時(shí)比如95%,99%時(shí),比如做假設(shè)檢驗(yàn)的適合,選擇 1.96δ,2.58δ等
2.3 第1種:按整數(shù)倍標(biāo)準(zhǔn)差δ 作為標(biāo)準(zhǔn)使用
按照 -3δ,-2δ,-1δ,1δ,2δ,3δ 這樣的整數(shù)倍δ來劃分區(qū)間
- 3δ,49.8%,99.99%
- 2.58δ,49.5%,99%
- 2δ,47.7%,95.45%
- 1.96δ,47.5%,95%
- δ,34.1%,68.5%
- -δ,34.1%,68.5%
- -1.96δ,47.5%,95%
- -2δ,47.7%,95.45%
- -2.58δ,49.5%,99%
- -3δ,49.8%,99.99%
2.3.1? ?比如3δ原則 /6西格瑪管理
- 標(biāo)準(zhǔn)正態(tài)分布與概率,3δ原則
- 不同的標(biāo)準(zhǔn)差δ對(duì)應(yīng)不同的概率
- 按照幾倍δ,去找對(duì)應(yīng)的概率,68.5%,95.45%,99.99%等
2.3.2 還有LCL, UCL管理
- LCL“Low control limit ?一般對(duì)應(yīng)-3δ
- UCL:UP control limit ? ?一般對(duì)應(yīng)+3δ
2.2 第2種:按比較整的概率如95%對(duì)應(yīng)的標(biāo)準(zhǔn)差使用
按概率 90% 95% 99%等比較整的概率去劃分標(biāo)準(zhǔn)正態(tài)分布的區(qū)間
- 3δ,49.8%,99.99%
- 2.58δ,49.5%,99%
- 2δ,47.7%,95.45%
- 1.96δ,47.5%,95%
- δ,34.1%,68.5%
- -δ,34.1%,68.5%
- -1.96δ,47.5%,95%
- -2δ,47.7%,95.45%
- -2.58δ,49.5%,99%
- -3δ,49.8%,99.99%
?
3 應(yīng)用舉例1
- 使用樣本均值 + 總體的標(biāo)準(zhǔn)差,去估計(jì) 總體均值的范圍
- 使用樣本均值 + 總體的標(biāo)準(zhǔn)差(樣本標(biāo)準(zhǔn)差),去估計(jì) 總體均值的范圍
我們?nèi)绻挥?個(gè)樣本,少數(shù)樣本,雖然不能直接推算總體樣本,但是可以這么估計(jì)范圍。
比如在95%區(qū)間內(nèi)
總體均值-1.96*標(biāo)準(zhǔn)差/sqrt(n) <= 樣本平均值<=總體均值-1.96*標(biāo)準(zhǔn)差/sqrt(n)
因此
總體平均值<=樣本平均值+1.96*標(biāo)準(zhǔn)差/sqrt(n)
總體平均值>=樣本平均值-1.96*標(biāo)準(zhǔn)差/sqrt(n)當(dāng)樣本數(shù)量n一直增大后
總體平均值<=樣本平均值+1.96*標(biāo)準(zhǔn)差/sqrt(n)=樣本平均值+0
總體平均值>=樣本平均值-1.96*標(biāo)準(zhǔn)差/sqrt(n) =樣本平均值-0
總體平均值=樣本平均值如果范圍從95%→99%后,形象的看為什么置信區(qū)間變大了
總體平均值<=樣本平均值+2.58 *標(biāo)準(zhǔn)差/sqrt(n)
總體平均值>=樣本平均值-2.58 *標(biāo)準(zhǔn)差/sqrt(n)
范圍變大,95%-99%,也就是置信區(qū)間變大了。而拒絕的空間α就很小了。這個(gè)計(jì)算實(shí)際存在理論上的問題。但是實(shí)際上我們?nèi)菀椎玫綐颖揪?#xff0c;但很難得到總體標(biāo)準(zhǔn)差,而如果用樣本的標(biāo)準(zhǔn)差去替代總體的,也是個(gè)辦法,因?yàn)闃颖痉讲畹姆帜笍腘改為(N-1)=總體方差,所以還是可以行得通的,但是肯定是有誤差的。
4 應(yīng)用舉例2:造成誤差的原因???????不是樣本數(shù)占總體的比例,而是樣本的絕對(duì)數(shù)量!
- 一個(gè)更奇怪的公式
- 95%時(shí)
- 樣本p-1.96*sqrt((N-n)/(N-1)*p*(1-p)/n) <總體P< 樣本p+1.96*sqrt((N-n)/(N-1)*p*(1-p)/n)
- 而(N-n)/(N-1) 樣本數(shù)量n比較小時(shí),趨近于1,故意忽略
- 樣本p-1.96*sqrt(p*(1-p)/n) <總體P< 樣本p+1.96*sqrt(p*(1-p)/n)
- 造成誤差的原因
- 不是樣本數(shù)占總體的比例,而是樣本的絕對(duì)數(shù)量!
- 反常識(shí)!