当前位置:首页 >> 数学 >>

【南方新课堂】2017高考(新课标)数学(文)二轮专题复习(课件)专题六第1讲统计与统计案例


专题六

概率与统计

第 1 讲 统计与统计案例

1.(2013· 全国Ⅰ卷)为了解某地区的中小学生的视力 情况,拟从该地区的中小学生中抽取部分学生进行调查, 事先已了解到该地区小学、初中、高中三个学段学生的视 力情况有较大差异,而男女视力情况差异不大.在下面的 抽样方法中,最合理的抽样方法是( ) (导学号 5

3130043)

A.简单随机抽样 C.按学段分层抽样

B.按性别分层抽样 D.系统抽样

解析:因为男女视力情况差异不大,但学段的视力情 况有较大差异,所以应按学段分层抽样. 答案:C

2.(2015· 重庆卷)重庆市 2013 年各月的平均气温(℃) 数据的茎叶图如下图,则这组数据的中位数是( )

A.19

B.20

C.21.5

D.23

解析:由茎叶图可知这组数据由小到大依次为 8,9, 12,15,18,20,20,23,23,28,31,32,所以中位数 20+20 为 =20. 2 答案:B

3.(2015· 福建卷)为了解某社区居民的家庭年收入与 年支出的关系, 随机调查了该社区 5 户家庭, 得到如下统 计数据表:
10. 0 11. 3 8.5 11. 9 9.8

收入x(万元) 8.2 8.6

支出y(万元) 6.2 7.5 8.0

^ ^ ^ ^ 根据上表可得回归直线方程 y = b x + a ,其中 b = ^ - ^- 0.76, a = y - b x .据此估计,该社区一户年收入为 15 万元家庭的年支出为( )

A.11.4 万元 B.11.8 万元 C.12.0 万元 D.12.2 万元
- 8.2+8.6+10.0+11.3+11.9 解析: x = =10, 5 - 6.2+7.5+8.0+8.5+9.8 y= =8, 5

^ ∴ a =8-0.76×10=0.4, ^ ∴回归直线 y =0.76x+0.4. ^ ∴当 x=15 时, y =0.76×15+0.4=11.8(万元). 答案:B

4.(2014· 全国Ⅰ卷)从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量指标值,由测量结果得 如下频数分布表:
质量指 标值分 组 频数

[75, 85) 6

[85, 95) 26

[95, 105) 38

[105, [115, 115) 125) 22 8

(1)作出这些数据的频率分布直方图;

(2)估计这种产品质量指标值的平均数及方差(同一组 中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的 这种产品符合“质量指标值不低于 95 的产品至少要占全 部产品 80%”的规定?

解:(1)频率分布直方图如图.

- (2) 质 量 指 标 值 的 样 本 平 均 数 为 x = 80×0.06 + 90×0.26+100×0.38+110×0.22+120×0.08=100. 质量指标值的样本方差为 s2=(-20)2×0.06+(-10)2 ×0.26+0×0.38+102×0.22+202×0.08=104. 所以这种产品质量指标值的平均数的估计值为 100, 方差的估计值为 104.

(3)质量指标值不低于 95 的产品所占比例的估计值为 0.38+0.22+0.08=0.68. 由于该估计值小于 0.8,故不能认为该企业生产的这 种产品符合“质量指标值不低于 95 的产品至少要占全部 产品 80%”的规定.

1.抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样, 三种抽样方法都是等概率抽样,体现了抽样的公平性, 但又各有其特点和适用范围. N 在系统抽样,如果遇到 不是整数的情况,可以先从 n 总体中随机剔除几个个体,使得总体中剩余的个体能被 样本容量整除.

2.统计中的四个数据特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:样本数据中,将数据按大小排列,位于 最中间的数据.如果数据的个数为偶数,就取中间两个 数据的平均数作为中位数.

(3)平均数:样本数据的算术平均数,即 - 1 x =n(x1+x2+?+xn). (4)方差与标准差. 1 -2 -2 -2 方差:s = [(x1- x ) +(x2- x ) +?+(xn- x ) ]. n
2

标准差:
s= 1 - 2 - 2 - 2 n[(x1- x ) +(x2- x ) +?+(xn- x ) ]

3.直方图的两个结论 频率 (1)小长方形的面积=组距× =频率. 组距 (2)各小长方形的面积之和等于 1. ^ ^ ^ - - 4.回归直线 y = b x+ a 经过样本点的中心点( x , y ), ^ ^ ^ 若 x 取一个值代入回归直线方程 y = b x+ a 中,可求出 y 的估计值.

5.独立性检验 对于取值分别是{x1, x2}和{y1, y2}的分类变量 X 和 Y, 其样本频数列联表是:
Y X x1 x2 总计 y1 a c y2 b d 总计 a+b c+ d n

a+c b+d

2 n ( ad - bc ) 则 K2= (其中 n (a+b)(c+d)(a+c)(b+d)

=a+b+c+d 为样本容量).

[例 1] (1)(2015· 北京卷)某校老年、中年和青年教师 的人数见下表,采用分层抽样的方法调查教师的身体状 况,在抽取的样本中,青年教师有 320 人,则该样本中的 老年教师人数为( )

类别 老年教师

人数 900

中年教师 1 800 青年教师 1 600 合计 A.90 B.100 4 300 C.180 D.300

(2)(2016· 长沙雅礼中学质检)在一次马拉松比赛中, 35 名运动员的成绩(单位:分钟)的茎叶图如图所示.

若将运动员按成绩由好到差编为 1~35 号, 再用系统 抽样方法从中抽取 7 人,则其中成绩在区间[139,151]上 的运动员人数是________.

解析:(1)设该样本中的老年教师人数为 x,由题意及 x 320 分层抽样的特点得 = ,故 x=180. 900 1 600 (2)依题意,可将编号为 1~35 号的 35 个数据分成 7 组,每组有 5 个数据. 在区间[139,151]上共有 20 个数据,分在 4 个小组 内,每组抽取 1 人,共抽取 4 人.
答案:(1)C (2)4

[规律方法] 1.在系统抽样的过程中,要注意分段间 隔,需要抽取 n 个个体,样本就需要分成 n 个组,则分 N 段间隔即为 n (N 为样本容量,且 N 能被 n 整除),首先确 定在第一组中抽取的个体的号码数, 再从后面的每组中按 规则抽取每个个体.

2. 分层抽样的关键是根据样本特征的差异进行分层, 实质是等比例抽样.分层抽样中分多少层、如何分层要视 具体情况而定,总的原则是层内样本的差异要小,两层之 间的样本差异要大,且互不重叠.

[变式训练 1] (1)某校高一年级有 900 名学生,其中 女生 400 名, 按男女比例用分层抽样的方法, 从该年级学 生中抽取一个容量为 45 的样本,则应抽取的男生人数为 ________.

(2)某班级有 50 名学生,现要利用系统抽样在这 50 名学生中抽出 10 名学生,将这 50 名学生随机编号 1~50 号,并分组,第一组 1~5 号,第二组 6~10 号,?,第 十组 46~50 号,若在第三组中抽得号码为 13 的学生, 则 在第八组中抽得号码为________的学生.

45 x 解析:(1)设男生抽取 x 人,则有 = , 900 900-400 解得 x=25.
(2)∵13=5×2+3,即第三组抽出的是第三名学生, 所以每一组都相应抽出第三名学生,∴在第八组中抽得号 码为 5×7+3=38 的学生. 答案:(1)25 (2)38

角度 1 茎叶图与样本的数字特征 [例 2-1] (2016· 广州调研)为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:℃)制成如图所示的茎叶图.考虑 以下结论:

①甲地该月 14 时的平均气温低于乙地该月 14 时的平 均气温; ②甲地该月 14 时的平均气温高于乙地该月 14 时的平 均气温; ③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;

④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差.

其中根据茎叶图能得到的统计结论的编号为( A.①③ B.①④ C.②③ D.②④

)

解析:甲地 5 天的气温为:26,28,29,31,31, - 26+28+29+31+31 其平均数为 x 甲= =29; 5 方差为 1 2 s甲= [(26-29)2+(28-29)2+(29-29)2+(31 5

-29)2+(31-29)2]=3.6;

标准差为 s 甲= 3.6. 乙地 5 天的气温为:28,29,30,31,32, - 28+29+30+31+32 其平均数为 x 乙= =30; 5 方差为 1 2 s乙= [(28-30)2+(29-30)2+(30-30)2+(31 5

-30)2+(32-30)2]=2;

- - 标准差为 s 乙= 2.∴ x 甲< x 乙,s 甲>s 乙. 答案:B

[规律方法] 1.平均数与方差都是重要的数字特征, 是对数据的一种简明描述, 它们所反映的情况有着重要的 实际意义.平均数、中位数、众数描述数据的集中趋势, 方差和标准差描述数据的波动大小.

2.众数、中位数、平均数与频率分布直方图的关系: (1)众数为频率分布直方图中最高矩形的底边中点的 横坐标.

(2)中位数为平分频率分布直方图面积且垂直于横轴 的直线与横轴交点的横坐标. (3)平均数等于频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和.

[变式训练 2] (1)(2015· 广东卷)已知样本数据 x1, - x2, ?, xn 的均值 x =5, 则样本数据 2x1+1, 2x2+1, ?, 2xn+1 的均值为________. (2)(2016· 江苏卷)已知一组数据 4.7,4.8,5.1,5.4, 5.5,则该组数据的方差是________.

解:(1)由频率分布直方图,该市居民该月用水量在 区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的 频率依次为 0.1,0.15,0.2,0.25,0.15. 所以该月用水量不超过 3 立方米的居民占 85%,用 水量不超过 2 立方米的居民占 45%.依题意,w 至少定为 3.

(2)由用水量的频率分布直方图及题意,得居民该月 用水费用的数据分组与频率分布表:

组号

1

2

3

4

5

6

7

8

分组 [2, 4] (4, 6] (6, 8] 频率 0.1 0.15 0.2

(8, (10, (12, (17, (22, 10] 12] 17] 22] 27]

0.25 0.15 0.05 0.05 0.05

根据题意,该市居民该月的人均水费估计为: 4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17 ×0.05+22×0.05+27×0.05=10.5(元).

角度 2 用样本的频率分布估计总体分布 [例 2-2] (2016· 四川卷)我国是世界上严重缺水的 国家,某市为了制定合理的节水方案,对居民用水情况 进行了调查. 通过抽样, 获得了某年 100 位居民每人的月 均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),?, [4,4.5]分成 9 组,制成了如图所示的频率分布直方图.

(1)求直方图中 a 的值; (2)设该市有 30 万居民,估计全市居民中月均用水量 不低于 3 吨的人数,说明理由; (3)估计居民月均用水量的中位数.

解:(1)由频率分布直方图,可知:月均用水量在[0, 0.5)的频率为 0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5, 4),[4,4.5)组的频率分别为 0.08,0.21,0.25,0.06,0.04, 0.02.

由 1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)= 0.5×a+0.5×a. 解得 a=0.30.

(2)由(1), 100 位居民月均用水量不低于 3 吨的频率为 0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计 30 万居民中月均 用水量不低于 3 吨的人数为 300 000×0.12=36 000.

(3)设中位数为 x 吨. ∵前 5 组的频率之和为 0.04+0.08+0.15+0.21+0.25 =0.73>0.5.

而前 4 组的频率之和为 0.04+ 0.08+ 0.15+ 0.21= 0.48<0.5, 所以 2≤x<2.5. 由 0.50×(x-2)=0.5-0.48,解得 x=2.04. 故可估计居民月均用水量的中位数为 2.04 吨.

[规律方法] 1.(1)抓住频率分布直方图各小长方形的面 积之和为 1,这是求解的关键; (2)根据频率分布直方图的频率来估计总体的数字特征.
2.本题易混淆频率分布条形图和频率分布直方图, 误把频率分布直方图纵轴的几何意义当成频率, 导致样本 数据的频率求错.

[变式训练 3] (2016· 北京卷)某市居民用水拟实行阶 梯水价.每人月用水量不超过 w 立方米的部分按 4 元/立 方米收费, 超出 w 立方米的部分按 10 元/立方米收费. 从 该市随机调查了 10 000 位居民,获得了他们某月用水量 数据, 整理得到如下频率分布直方图: (导学号 53130044)

(1)如果 w 为整数,那么根据此次调查,为使 80%以 上居民在该月的用水价格为 4 元/立方米,w 至少定为多 少? (2)假设同组中的每个数据用该组区间的右端点值代 替.当 w=3 时,估计该市居民该月的人均水费.
解:(1)由频率分布直方图,该市居民该月用水量在 区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的 频率依次为 0.1,0.15,0.2,0.25,0.15.

所以该月用水量不超过 3 立方米的居民占 85%,用水 量不超过 2 立方米的居民占 45%.依题意,w 至少定为 3. (2)由用水量的频率分布直方图及题意,得居民该月用 水费用的数据分组与频率分布表:
组 号 分 组 频 率 1 [2, 4] 0.1 2 3 4 5 6 7 8

(4, (6, (8, (10, (12, (17, (22, 6] 8] 10] 12] 17] 22] 27] 0.15 0.2 0.25 0.15 0.05 0.05 0.05

根据题意,该市居民该月的人均水费估计为: 4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17 ×0.05+22×0.05+27×0.05=10.5(元).

[例 3] (2015· 全国Ⅰ卷)某公司为确定下一年度投入 某种产品的宣传费,需了解年宣传费 x(单位:千元)对年 销售量 y(单位:t)和年利润 z(单位:千元)的影响.对近 8 年的年宣传费 xi 和年销售量 yi(i=1,2,?,8)数据作了 初步处理,得到下面的散点图及一些统计量的值.

(1)根据散点图判断,y=a+bx 与 y=c+d x哪一个 适宜作为年销售量 y 关于年宣传费 x 的回归方程类型(给 出判断即可,不必说明理由)? (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的 回归方程.

(3)已知这种产品的年利润 z 与 x, y 的关系为 z=0.2y -x.根据(2)的结果回答下列问题: ①年宣传费 x=49 时, 年销售量及年利润的预报值是 多少? ②年宣传费 x 为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v 2),?,(un,v n),其 回归直线 v=α+βu 的斜率和截距的最小二乘估计分别为

解:(1)由散点图可以判断,y=c+d x适宜作为年销 售量 y 关于年宣传费 x 的回归方程类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程.

^ ∴y 关于 w 的线性回归方程为 y =100.6+68w, ^ 因此 y 关于 x 的回归方程为 y =100.6+68 x.

(3)①由(2)知,当 x=49 时, ^ 年销售量 y 的预报值 y =100.6+68 49=576.6, ^ 年利润 z 的预报值 z =576.6×0.2-49=66.32.

②根据(2)的结果知,年利润 z 的预报值 ^ z =0.2(100.6+68 x)-x=-x+13.6 x+20.12. 13.6 ^ ∴当 x= =6.8,即 x=46.24 时, z 取得最大值. 2 故年宣传费为 46.24 千元时,年利润的预报值最大.

^ ^ [规律方法] 1.正确理解计算b,a的公式和准确地计 算是求回归方程的关键, 回归常数的确定则需要利用样本 点中心在回归直线上建立方程求解.
2.在分析实际中两个变量的相关关系时,可根据样 本数据作出散点图来确定两个变量之间是否具有相关关 系,若具有线性相关关系,则可通过线性回归方程估计和 预测变量的值.

[变式训练 4] (1)(2016· 赣中南五校联考)心理学家分 析发现视觉和空间想象能力与性别有关,某数学兴趣小 组为了验证这个结论,从所在学校中按分层抽样的方法 抽取 50 名同学(男 30 女 20), 给所有同学几何题和代数题 各一题,让各位同学自由选择一道题进行解答.选题情 况如下表:(单位:人)

题型 性别 男同学

几何题 代数题 总计 22 8 30

女同学 总计

8 30

12 20

20 50

由 2×2 列联表中数据可得 K2 的观测值 k≈5.556, 你 能有________的把握认为视觉和空间想象能力与性别有 关.

附表:
0.02 0.01 0.00

P ( K 2≥ k )

0.15

0.10 0.05

5

0

5

0.001

k

2.072

2.70 3.84 5.02 6.63 7.87 6 1 4 5 9

10.828

(2)(2016· 全国Ⅲ卷)如图是我国 2008 年至 2014 年生 活垃圾无害化处理量(单位:亿吨)的折线图.

(注:年份代码 1~7 分别对应年份 2008~2014) (导学号 53130046) ①由折线图看出,可用线性回归模型拟合 y 与 t 的关 系,请用相关系数加以说明.

②建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理量. 附注:


相关文章:
...数学(文)二轮专题复习(检测):专题七第2讲不等式选讲...
【南方新课堂】2017高考(新课标)数学(文)二轮专题复习(检测):专题七第2讲不等式选讲 Word版含解析_数学_高中教育_教育专区。数学学习资料 专题七 第2讲 选修 ...
...数学(文)二轮专题复习(检测):专题一第2讲不等式 Wor...
【南方新课堂】2017高考(新课标)数学(文)二轮专题复习(检测):专题一第2讲不等式 Word版含解析_数学_高中教育_教育专区。数学学习资料 专题一 函数与导数、不...
【南方新课堂】2017高考(新课标)数学(理)二轮专题复习...
【南方新课堂】2017高考(新课标)数学()二轮专题复习练习:专题第1讲立体几何中的计算与位置关系.doc_数学_高中教育_教育专区。专题第1讲 立体几何 立体...
【南方新课堂】2017高考(新课标)数学(理)二轮专题复习(...
【南方新课堂】2017高考(新课标)数学()二轮专题复习(检测):每日一题 规范练...业务所需的时间统计结果如下: 办理业务所需的时间(分) 频率 1 0.1 2 0....
【南方新课堂】2017高考(新课标)数学(理)二轮专题复习(...
【南方新课堂】2017高考(新课标)数学()二轮专题复习(检测):每日一题 规范练第五周 Word版含解析_数学_高中教育_教育专区。数学学习资料 每日一题第五周 题目...
【南方新课堂】2017高考(新课标)数学(文)二轮专题复习(...
【南方新课堂】2017高考(新课标)数学(文)二轮专题复习(检测):每日一题 规范练第三周 Word版含解析_高考_高中教育_教育专区。数学学习资料 每日一题第三周 题目...
...数学(文)二轮专题复习(检测):每日一题 规范练第一周...
【南方新课堂】2017高考(新课标)数学(文)二轮专题复习(...数学学习资料 每日一题第一周 题目 1] 星期一 ...对 西安市该年 4 月份的天气情况进行统计,结果如...
【南方新课堂】2017高考(新课标)数学(文)二轮专题复习(...
【南方新课堂】2017高考(新课标)数学(文)二轮专题复习(检测):每日一题 规范练第二周 Word版含解析_数学_高中教育_教育专区。数学学习资料 每日一题第二周 题目...
【南方新课堂】2017高考(新课标)数学(理)二轮专题复习(...
【南方新课堂】2017高考(新课标)数学()二轮专题复习(检测):每日一题 规范练第二周 Word版含解析_数学_高中教育_教育专区。数学学习资料 每日一题第二周 题目...
【南方新课堂】2017高考(新课标)数学(理)二轮专题复习(...
【南方新课堂】2017高考(新课标)数学()二轮专题复习(检测):每日一题 规范练第四周 Word版含解析_数学_高中教育_教育专区。数学学习资料 每日一题第四周 题目 ...
更多相关标签: