一、概率统计在高考中的地位
概率统计是高考数学的必考内容,全国卷通常以一道12分的大题形式出现(另有选填题)。近年来高考对概率统计的考查越来越注重实际应用,题目情境往往来自现实生活(如产品质量检测、流行病筛查、体育比赛等)。
根据近五年高考真题分析,概率统计大题主要涉及以下五大核心考点:
- 古典概型与几何概型
- 条件概率与全概率公式
- 离散型随机变量分布列(二项分布、超几何分布)
- 连续型随机变量(正态分布及其性质)
- 统计部分(频率分布直方图、回归分析、独立性检验)
二、古典概型与几何概型
2.1 古典概型
特征:①有限个基本事件;②每个基本事件等可能发生。
常用计数方法:列举法、列表法、树状图法、排列组合公式。
2.2 几何概型
特征:①无限个基本事件;②每个基本事件等可能发生。
三、条件概率与全概率公式
3.1 条件概率
在事件A发生的条件下,事件B发生的概率称为条件概率,记作P(B|A)。
3.2 全概率公式
如果事件A₁, A₂, ..., An构成一个完备事件组(即互斥且并集为全集),则对任意事件B有:
3.3 贝叶斯公式
四、离散型随机变量
4.1 二项分布
适用条件:n次独立重复试验,每次试验只有两种结果(成功/失败),且成功概率p保持不变。
4.2 超几何分布
适用条件:从N个产品(其中有M个次品)中不放回地抽取n个,X表示抽到的次品数。
4.3 离散型随机变量的期望与方差
五、正态分布
正态分布是连续型随机变量最重要的分布,其概率密度函数为:
记为 X ~ N(μ, σ²)。当μ=0,σ=1时称为标准正态分布。
3σ原则:
- P(μ−σ < X < μ+σ) ≈ 0.6827
- P(μ−2σ < X < μ+2σ) ≈ 0.9545
- P(μ−3σ < X < μ+3σ) ≈ 0.9973
六、统计部分
6.1 频率分布直方图
关键概念:频率 = 频数/样本容量;小长方形的面积 = 频率;所有小长方形面积之和 = 1。
估计方法:众数(最高矩形中点)、中位数(面积平分线)、平均数(各组中点值×频率之和)。
6.2 回归分析
最小二乘法求线性回归方程 ŷ = a + bx:
6.3 独立性检验
通过卡方统计量 K²(或χ²)判断两个分类变量是否有关。
将计算出的K²值与临界值比较:若K² > 临界值,则拒绝H₀,认为两变量有关。
七、高考真题精讲(8道完整解析)
【例题1】古典概型
(2022·全国甲卷理科) 从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为______。
解:
总基本事件数:n = C₂² = 21
互斥的数对:从2到8中找不互质的数对(有公因数>1)
2的倍数:(2,4)(2,6)(2,8)(4,6)(4,8)(6,8) — 6对
3的倍数:(3,6) — 1对((6,9)不在范围)
注意:(2,6)已算过,不重复。共有不互质的数对:(2,4)(2,6)(2,8)(3,6)(4,6)(4,8)(6,8) = 7对
互质的数对:21 − 7 = 14对
答:概率为2/3。
【例题2】条件概率
(2021·新高考I卷) 某工厂有甲、乙、丙三条生产线,各自产量占总产量的50%、30%、20%。甲、乙、丙的不合格率分别为1%、2%、3%。现从总产品中随机抽取一件,发现是不合格品,求这件产品来自甲生产线的概率。
解:
设事件A₁、A₂、A₃分别表示产品来自甲、乙、丙生产线,B表示产品为不合格品。
由全概率公式:
由贝叶斯公式:
答:不合格品来自甲生产线的概率约为0.294(或29.4%)。
【例题3】二项分布
(2023·全国乙卷理科) 某射手每次射击命中目标的概率为0.8,各次射击相互独立。该射手连续射击5次,求:(1)恰好命中3次的概率;(2)至少命中4次的概率。
解:
X ~ B(5, 0.8),P(X=k) = C₅ᵏ · 0.8ᵏ · 0.2⁵⁻ᵏ
(1)恰好命中3次:
(2)至少命中4次:
答:恰好命中3次的概率为0.2048,至少命中4次的概率为0.73728。
【例题4】超几何分布
(2022·全国甲卷文科) 一批产品共20件,其中次品5件。现从中不放回地抽取3件,求抽到次品数X的分布列和数学期望。
解:
X服从超几何分布:N=20, M=5, n=3
分布列:
| X | 0 | 1 | 2 | 3 |
|---|---|---|---|---|
| P | 455/1140 | 525/1140 | 150/1140 | 10/1140 |
答:数学期望为0.75。
【例题5】正态分布
(2023·新高考I卷) 某市高三学生的数学成绩X服从正态分布N(90, 100)(μ=90,σ=10)。求:(1)成绩在80~100之间的学生比例;(2)若全市有50000名考生,估计成绩在110分以上的考生人数。
解:
(1)80~100分对应区间为(μ−σ, μ+σ)
约68.27%的学生成绩在80~100之间。
(2)110分对应μ+2σ=110
考生人数:50000 × 0.02275 ≈ 1137.5,约1138人
答:成绩在80~100之间的占68.27%,110分以上约1138人。
【例题6】频率分布直方图与统计量
(2022·北京高考) 某校高一年级100名学生某次数学考试成绩的频率分布直方图如下,各组区间为[40,50), [50,60), [60,70), [70,80), [80,90), [90,100]。各小长方形的高(频率/组距)分别为0.005、0.010、0.020、0.030、0.025、0.010。求:(1)成绩在70分以上的学生人数;(2)估计这次考试的平均分。
解:
(1)频率 = 高 × 组距(组距=10)
人数:100 × 0.65 = 65人
(2)平均分 ≈ 各组中点值×频率之和
答:70分以上有65人,估计平均分为74分。
【例题7】回归分析
(2023·全国甲卷理科) 某地区5年的GDP(亿元)数据如下:年份x(第t年):1,2,3,4,5;GDP y:10,12,15,18,20。求y关于x的线性回归方程,并预测第6年的GDP。
解:
回归方程:ŷ = 7.2 + 2.6x
预测第6年:ŷ = 7.2 + 2.6×6 = 7.2 + 15.6 = 22.8(亿元)
答:线性回归方程为ŷ=7.2+2.6x,预测第6年GDP为22.8亿元。
【例题8】独立性检验
(2021·全国乙卷文科) 某高校调查了100名学生对在线教学的满意程度,数据如下:男生满意30人、不满意20人;女生满意35人、不满意15人。问:能否在犯错误概率不超过0.05的前提下认为性别与满意程度有关?
解:
建立2×2列联表:
| 满意 | 不满意 | 合计 | |
|---|---|---|---|
| 男生 | 30 | 20 | 50 |
| 女生 | 35 | 15 | 50 |
| 合计 | 65 | 35 | 100 |
查表:临界值K₀.₀₅ = 3.841(自由度=1)
因为1.099 < 3.841,所以没有足够的证据拒绝H₀。
答:不能在犯错误概率不超过0.05的前提下认为性别与满意程度有关。
八、概率统计大题答题模板
模板一:分布列+期望类
- 确定随机变量X的所有可能取值
- 判断分布类型(二项/超几何/一般离散型)
- 计算每个取值的概率
- 列出分布列(表格形式)
- 计算期望E(X)和方差D(X)(如需)
模板二:概率+决策类
- 理解题意,建立概率模型
- 计算相关事件的概率
- 比较期望收益或风险大小
- 给出决策建议
模板三:统计推断类
- 整理数据(列联表/频率分布表)
- 计算统计量(K²/t/r等)
- 与临界值比较
- 得出结论
评论 (0)
登录 后即可发表评论