AI学习
高考数学 概率统计 条件概率 二项分布 正态分布 高中

高考数学概率统计大题题型全解与答题模板

全面解析概率统计大题的五大核心考点:古典概型、条件概率与全概率公式、二项分布与超几何分布、正态分布及其性质、统计部分(频率分布直方图、回归分析、独立性检验)。含8道高考真题精讲、3幅SVG概率统计示意图和答题模板总结。

admin 2026-06-18 5 次浏览

一、概率统计在高考中的地位

概率统计是高考数学的必考内容,全国卷通常以一道12分的大题形式出现(另有选填题)。近年来高考对概率统计的考查越来越注重实际应用,题目情境往往来自现实生活(如产品质量检测、流行病筛查、体育比赛等)。

根据近五年高考真题分析,概率统计大题主要涉及以下五大核心考点:

  1. 古典概型与几何概型
  2. 条件概率与全概率公式
  3. 离散型随机变量分布列(二项分布、超几何分布)
  4. 连续型随机变量(正态分布及其性质)
  5. 统计部分(频率分布直方图、回归分析、独立性检验)

二、古典概型与几何概型

2.1 古典概型

特征:①有限个基本事件;②每个基本事件等可能发生。

P(A) = m / n  (m = 事件A包含的基本事件数,n = 总基本事件数)

常用计数方法:列举法、列表法、树状图法、排列组合公式。

2.2 几何概型

特征:①无限个基本事件;②每个基本事件等可能发生。

P(A) = d的测度 / D的测度  (测度可以是长度、面积、体积等)

三、条件概率与全概率公式

3.1 条件概率

在事件A发生的条件下,事件B发生的概率称为条件概率,记作P(B|A)。

P(B|A) = P(AB) / P(A)  (P(A) > 0)

3.2 全概率公式

如果事件A₁, A₂, ..., An构成一个完备事件组(即互斥且并集为全集),则对任意事件B有:

P(B) = Σ P(Ai) · P(B|Ai)

3.3 贝叶斯公式

P(Ak|B) = P(Ak) · P(B|Ak) / Σ P(Ai) · P(B|Ai)

四、离散型随机变量

4.1 二项分布

适用条件:n次独立重复试验,每次试验只有两种结果(成功/失败),且成功概率p保持不变。

X ~ B(n, p)   P(X=k) = Cnk · pk · (1-p)n-k   (k=0,1,2,...,n)
E(X) = np   D(X) = np(1-p)

4.2 超几何分布

适用条件:从N个产品(其中有M个次品)中不放回地抽取n个,X表示抽到的次品数。

P(X=k) = CMk · CN-Mn-k / CNn
E(X) = n · M/N

4.3 离散型随机变量的期望与方差

E(X) = Σ xi · pi
D(X) = Σ (xi − E(X))² · pi = E(X²) − [E(X)]²

五、正态分布

正态分布是连续型随机变量最重要的分布,其概率密度函数为:

f(x) = 1/(σ√(2π)) · e−(x−μ)²/(2σ²)

记为 X ~ N(μ, σ²)。当μ=0,σ=1时称为标准正态分布。

3σ原则:

  • P(μ−σ < X < μ+σ) ≈ 0.6827
  • P(μ−2σ < X < μ+2σ) ≈ 0.9545
  • P(μ−3σ < X < μ+3σ) ≈ 0.9973
常见概率分布示意图

二项分布 B(n, p) P(X=k) = C(n,k) p^k (1-p)^(n-k)

n=6, p=0.5

正态分布 N(μ, σ²) f(x) = 1/(σ√2π) · e^[-(x-μ)²/(2σ²)]

μ σ 3σ原则:P(μ-σ P(μ-2σ P(μ-3σ 概率模型选择决策流程图 判断随机试验类型

试验次数有限?

离散型随机变量

每次试验独立?

二项分布 超几何分布 连续型随机变量 正态分布 N(μ,σ²) 标准正态变换

六、统计部分

6.1 频率分布直方图

关键概念:频率 = 频数/样本容量;小长方形的面积 = 频率;所有小长方形面积之和 = 1。

估计方法:众数(最高矩形中点)、中位数(面积平分线)、平均数(各组中点值×频率之和)。

6.2 回归分析

最小二乘法求线性回归方程 ŷ = a + bx:

b = [Σ(xᵢ−x̄)(yᵢ−ȳ)] / [Σ(xᵢ−x̄)²] = [Σxᵢyᵢ − n·x̄·ȳ] / [Σxᵢ² − n·x̄²]
a = ȳ − b·x̄

6.3 独立性检验

通过卡方统计量 K²(或χ²)判断两个分类变量是否有关。

K² = n(ad−bc)² / [(a+b)(c+d)(a+c)(b+d)]

将计算出的K²值与临界值比较:若K² > 临界值,则拒绝H₀,认为两变量有关。

统计图表:频率分布直方图与箱线图

频率分布直方图

0-10 10-20 20-30 30-40 40-50 50-60 60-70 分数区间

箱线图

最小值 Q₁ 中位数 Q₃ 最大值

异常值

回归分析:最小二乘法 ŷ = a + bx   其中 b = Σ(xᵢ−x̄)(yᵢ−ȳ)/Σ(xᵢ−x̄)²

七、高考真题精讲(8道完整解析)

【例题1】古典概型

(2022·全国甲卷理科) 从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为______。

解:

总基本事件数:n = C₂² = 21

互斥的数对:从2到8中找不互质的数对(有公因数>1)

2的倍数:(2,4)(2,6)(2,8)(4,6)(4,8)(6,8) — 6对

3的倍数:(3,6) — 1对((6,9)不在范围)

注意:(2,6)已算过,不重复。共有不互质的数对:(2,4)(2,6)(2,8)(3,6)(4,6)(4,8)(6,8) = 7对

互质的数对:21 − 7 = 14对

P = 14/21 = 2/3

答:概率为2/3。

【例题2】条件概率

(2021·新高考I卷) 某工厂有甲、乙、丙三条生产线,各自产量占总产量的50%、30%、20%。甲、乙、丙的不合格率分别为1%、2%、3%。现从总产品中随机抽取一件,发现是不合格品,求这件产品来自甲生产线的概率。

解:

设事件A₁、A₂、A₃分别表示产品来自甲、乙、丙生产线,B表示产品为不合格品。

P(A₁) = 0.5, P(A₂) = 0.3, P(A₃) = 0.2
P(B|A₁) = 0.01, P(B|A₂) = 0.02, P(B|A₃) = 0.03

由全概率公式:

P(B) = 0.5×0.01 + 0.3×0.02 + 0.2×0.03 = 0.005 + 0.006 + 0.006 = 0.017

由贝叶斯公式:

P(A₁|B) = P(A₁)P(B|A₁)/P(B) = 0.5×0.01/0.017 = 0.005/0.017 ≈ 0.294

答:不合格品来自甲生产线的概率约为0.294(或29.4%)。

【例题3】二项分布

(2023·全国乙卷理科) 某射手每次射击命中目标的概率为0.8,各次射击相互独立。该射手连续射击5次,求:(1)恰好命中3次的概率;(2)至少命中4次的概率。

解:

X ~ B(5, 0.8),P(X=k) = C₅ᵏ · 0.8ᵏ · 0.2⁵⁻ᵏ

(1)恰好命中3次:

P(X=3) = C₅³ · 0.8³ · 0.2² = 10 × 0.512 × 0.04 = 0.2048

(2)至少命中4次:

P(X≥4) = P(X=4) + P(X=5)
P(X=4) = C₅⁴ · 0.8⁴ · 0.2¹ = 5 × 0.4096 × 0.2 = 0.4096
P(X=5) = C₅⁵ · 0.8⁵ · 0.2⁰ = 1 × 0.32768 × 1 = 0.32768
P(X≥4) = 0.4096 + 0.32768 = 0.73728

答:恰好命中3次的概率为0.2048,至少命中4次的概率为0.73728。

【例题4】超几何分布

(2022·全国甲卷文科) 一批产品共20件,其中次品5件。现从中不放回地抽取3件,求抽到次品数X的分布列和数学期望。

解:

X服从超几何分布:N=20, M=5, n=3

P(X=k) = C₅ᵏ · C₁₅³⁻ᵏ / C₂₀³, k=0,1,2,3
C₂₀³ = 1140
P(X=0) = C₅⁰ · C₁₅³ / 1140 = 1 × 455 / 1140 = 455/1140 ≈ 0.399
P(X=1) = C₅¹ · C₁₅² / 1140 = 5 × 105 / 1140 = 525/1140 ≈ 0.461
P(X=2) = C₅² · C₁₅¹ / 1140 = 10 × 15 / 1140 = 150/1140 ≈ 0.132
P(X=3) = C₅³ · C₁₅⁰ / 1140 = 10 × 1 / 1140 = 10/1140 ≈ 0.009

分布列:

X0123
P455/1140525/1140150/114010/1140
E(X) = n·M/N = 3 × 5/20 = 0.75

答:数学期望为0.75。

【例题5】正态分布

(2023·新高考I卷) 某市高三学生的数学成绩X服从正态分布N(90, 100)(μ=90,σ=10)。求:(1)成绩在80~100之间的学生比例;(2)若全市有50000名考生,估计成绩在110分以上的考生人数。

解:

(1)80~100分对应区间为(μ−σ, μ+σ)

P(80 < X < 100) = P(μ−σ < X < μ+σ) ≈ 0.6827

约68.27%的学生成绩在80~100之间。

(2)110分对应μ+2σ=110

P(X > 110) = P(X > μ+2σ) = [1 − P(μ−2σ < X < μ+2σ)]/2
= (1 − 0.9545)/2 = 0.02275

考生人数:50000 × 0.02275 ≈ 1137.5,约1138人

答:成绩在80~100之间的占68.27%,110分以上约1138人。

【例题6】频率分布直方图与统计量

(2022·北京高考) 某校高一年级100名学生某次数学考试成绩的频率分布直方图如下,各组区间为[40,50), [50,60), [60,70), [70,80), [80,90), [90,100]。各小长方形的高(频率/组距)分别为0.005、0.010、0.020、0.030、0.025、0.010。求:(1)成绩在70分以上的学生人数;(2)估计这次考试的平均分。

解:

(1)频率 = 高 × 组距(组距=10)

P(70分以上) = (0.030 + 0.025 + 0.010) × 10 = 0.65

人数:100 × 0.65 = 65人

(2)平均分 ≈ 各组中点值×频率之和

x̄ = 45×0.05 + 55×0.10 + 65×0.20 + 75×0.30 + 85×0.25 + 95×0.10
= 2.25 + 5.5 + 13 + 22.5 + 21.25 + 9.5 = 74

答:70分以上有65人,估计平均分为74分。

【例题7】回归分析

(2023·全国甲卷理科) 某地区5年的GDP(亿元)数据如下:年份x(第t年):1,2,3,4,5;GDP y:10,12,15,18,20。求y关于x的线性回归方程,并预测第6年的GDP。

解:

x̄ = (1+2+3+4+5)/5 = 3
ȳ = (10+12+15+18+20)/5 = 15
Σ(xᵢ−x̄)(yᵢ−ȳ) = (−2)(−5)+(−1)(−3)+(0)(0)+(1)(3)+(2)(5) = 10+3+0+3+10 = 26
Σ(xᵢ−x̄)² = 4+1+0+1+4 = 10
b = 26/10 = 2.6
a = 15 − 2.6×3 = 15 − 7.8 = 7.2

回归方程:ŷ = 7.2 + 2.6x

预测第6年:ŷ = 7.2 + 2.6×6 = 7.2 + 15.6 = 22.8(亿元)

答:线性回归方程为ŷ=7.2+2.6x,预测第6年GDP为22.8亿元。

【例题8】独立性检验

(2021·全国乙卷文科) 某高校调查了100名学生对在线教学的满意程度,数据如下:男生满意30人、不满意20人;女生满意35人、不满意15人。问:能否在犯错误概率不超过0.05的前提下认为性别与满意程度有关?

解:

建立2×2列联表:

满意不满意合计
男生302050
女生351550
合计6535100
K² = 100×(30×15−20×35)² / (50×50×65×35)
= 100×(450−700)² / (50×50×65×35)
= 100×62500 / (50×50×65×35)
= 6250000 / 5687500 ≈ 1.099

查表:临界值K₀.₀₅ = 3.841(自由度=1)

因为1.099 < 3.841,所以没有足够的证据拒绝H₀。

答:不能在犯错误概率不超过0.05的前提下认为性别与满意程度有关。

八、概率统计大题答题模板

模板一:分布列+期望类

  1. 确定随机变量X的所有可能取值
  2. 判断分布类型(二项/超几何/一般离散型)
  3. 计算每个取值的概率
  4. 列出分布列(表格形式)
  5. 计算期望E(X)和方差D(X)(如需)

模板二:概率+决策类

  1. 理解题意,建立概率模型
  2. 计算相关事件的概率
  3. 比较期望收益或风险大小
  4. 给出决策建议

模板三:统计推断类

  1. 整理数据(列联表/频率分布表)
  2. 计算统计量(K²/t/r等)
  3. 与临界值比较
  4. 得出结论

评论 (0)

加载评论中...

登录 后即可发表评论