第 5 章 二项分布的应用的运用

二项分布:\(n\)次独立试验中,每次试验某时间出现的概率为\(p\),某件事不出现的概率为\(q\)(等于\(1-p\)),则对于某件事出现\(X\)次的概率分布为: \[b(x, n, p)=\mathrm{C}_{n}^{x} p^{x} q^{n-x}= \frac{n !}{x !(n-x) !}\]\(X\)是服从二项分布的随机变量,则\(E(X)=np,D(X)=np(1-p)\) 二项分布满足 \(p < q,np \geqslant 5\)\(p>q,nq \geqslant 5\)时,二项分布接近正态分布。

二项分布在教育研究中,主要用于解决含有机遇性质的问题。

5.1 判断题是否是猜测作答

有10道判断题,问答题者答对几题才能认为他是真会,或者说答对几题才能认为不是出于猜测因素?

猜错与猜对的概率 \(p=q=0.5,np =5\),此二项接近正态分布。 $ =n p=10 =5 \ ===1.58 $

由正态分布概率,当Z=4.645时,该店一下包含全体的95% 用原始分数表示\(\mu+1.645 \sigma=5+1.645 \times 1.58=7.6=8\),即10道题中猜对8道题以下的可能性为95%,猜对8-10道题的概率只有5%。因此可以推论说答对8道题以上者不是凭猜测(但做此结论,仍然有5%的可能会犯错。)

此问题可以直接用R语言中binom()二项分布函数计算。 pbinom(q, size, prob) qbinom(p, size, prob)

# qbinom(p, size, prob)
qbinom(0.95,10,0.5) 
## [1] 8

5.2 选择题是否是猜测作答

有10道单项选择题,每题4个选项,问答题者答对几题才能认为他是真会,或者说答对几题才能认为不是出于猜测因素?

此题中 \(n=10, p=0.25,q =0.75, np<5\),此题不接近正态分布,因直接用二项分布函数计算。

qbinom(0.95,10,0.25)
## [1] 5

5.3 猜对题数与概率

p <-  0.25
n <- c(10,15,30,40,60)
n_p <- qbinom(0.95,n,p)
n_q <- pbinom(n_p -1,n,p,lower.tail = F)
题目总数(单选4选1) 猜对题数 大于猜对题数概率
10 5 7.8%
15 7 5.7%
30 12 5.1%
40 15 5.4%
60 21 5.4%
p <-  0.5
n <- c(10,15,30,40,60)
n_p <- qbinom(0.97,n,p)
n_q <- pbinom(n_p -1,n,p,lower.tail = F)
题目总数(判断对错) 猜对题数 大于猜对题数概率
10 8 5.5%
15 11 6.0%
30 20 5.0%
40 26 4.0%
60 37 4.6%