当前位置:首页 >> 数学 >>

统计案例 章末复习方案 课件(人教A选修1-2)


章末归纳总结

一、回归分析 1.回归分析 回归分析是对有相关关系的两个变量进行统计分 析.相关指数 R2 刻画回归的效果,其计算公式:R2=1 - ^ ∑i=1 (yi-y)2 ∑i=1
n n

,R2 的值越大,模型的拟合效果越好. (yi- y )2

2.建立回归模型的一般步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变 量是预报变量. (2)画出确定好的解释变量和预报变量的散点图,观察

它们之间的关系(如是否存在线性关系).
(3)由经验确定回归方程的类型(如我们观察到数据
^ ^=bx+a). ^ 呈线性关系.则选用线性回归方程y

(4)按一定规则估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(个别数据对应的 残差过大,或残差呈现不随机的规律性,等等),若残差存

在异常,则应检查数据是否有误,或模型是否合适等.
二、独立性检验 1.判断两个分类变量之间是否有关系的方式有三种: 三维柱形图、二维条形图和独立性检验.其中三维柱形图 和二维条形图只能粗略地判断两个分类变量是否有关系,

而独立性检验可以精确地得到可靠的结论.

2.独立性检验的一般步骤: (1)根据样本数据制成2×2列联表. (2)根据公式计算K2的值. (3)比较K2与临界值的大小关系作统计推断.

1.一个重要方程 对于一组具有线性相关关系的数据(x1,y1),(x2, ^ ^ ^ y2),?,(xn,yn),其线性回归直线方程为y =b x+a .

? ?xi- x ??yi- y ?
i=1

n

^ 其中b =

^ ^ ,a = y -b x .

? ?xi- x ?2
i=1

n

2.两个重要参数 (1)相关指数R2 相关指数R2是用来刻画回归模型的回归效果的,其值越 大,残差平方和越小,模型的拟合效果越好.

(2)随机变量K2
随机变量K2是用来判断两个分类变量在多大程度上相关 的变量.独立性检验即计算K2的观测值,并与教材中所给表 格中的数值进行比较,从而得到两个分类变量在多大程度上 相关.

3.几种重要图形 (1)散点图 散点图是进行线性回归分析的主要手段,其作用如下: 一是判断两个变量是否具有线性相关关系,如果样本点呈条 状分布,则可以断定两个变量有较好的线性相关关系;

二是判断样本中是否存在异常.

(2)残差图

残差图可以用来判断模型的拟合效果,其作用如下:
一是判断模型的精度,残差点所分布的带状区域越窄, 说明模型的拟合精度越高,回归方程的预报精度越高. 二是确认样本点在采集中是否有人为的错误. (3)等高条形图

等高条形图与表格相比,更能直观地反映出两个分类变
量间是否相互影响,常用等高条形图展示列联表数据的频率 特征.

4.2×2列联表 一般地,假设两个分类变量X和Y,它们的值域分别为 {x1,x2}和{y1,y2}.其样本频数列联表(也称2×2列联表)为
y1 y2 总计

x1
x2 总计

a
c a+c

b
d b+d

a+b
c+d a+b+c+d

1.(2012· 福建高考)某工厂为了对新研发的一种产品进行合

理定价,将该产品按事先拟定的价格进行试销,得到如
下数据:
单价x(元) 销量y(件) 8 90 8.2 84 8.4 83 8.6 80 8.8 75 9 68

^ (1)求回归直线方程y =bx+a,其中b=-20,a=--b-; y x (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系, 且该产品的成本是4元/件,为使工厂获得最大利润,该产品的 单价应定为多少元?(利润=销售收入-成本)

1 解:(1)由于 x = (x1+x2+x3+x4+x5+x6)=8.5, 6 1 y = (y1+y2+y3+y4+y5+y6)=80. 6 所以a= y -b x =80+20×8.5=250,从而回归直线方程为 ^ = y -20x+250. (2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250) =-20x2+330x-1 000 33 2 =-20(x- ) +361.25. 4 当且仅当x=8.25时,L取得最大值. 故当单价定为8.25元时,工厂可获得最大利润.

2.已知某种商品的价格x(元)与需求量y(件)之间的关系有
如下一组数据:
x 14 16 18 20 22

y

12

10

7

5

3

求y对x的回归直线方程,并说明回归模型拟合效果的好坏.

1 解: x = (14+16+18+20+22)=18, 5 1 y = (12+10+7+5+3)=7.4, 5

?xi2=142+162+182+202+222=1 660,
i=1 5

5

?y2=122+102+72+52+32=327, i
i=1 5

?xiyi=14×12+16×10+18×7+20×5+22×3=620,
i=1

?xiyi=14×12+16×10+18×7+20×5+22×3=620,
i=1

5

?xiyi-5 x y
i=1

5

^ 所以,b =

?x2-5 x 2 i
i=1

5

620-5×18×7.4 = 1 660-5×182

=-1.15, ^=7.4+1.15×18=28.1, a ^ 所以所求回归直线方程是:y =-1.15x+28.1.

列出残差表:
^ yi-y i yi- y
5

0 4.6
2

0.3 2.6

-0.4 -0.1

0.2

-0.4 -2.4 -4.4
5

^ 所以, ? (yi-y i) =0.3, ? (yi--)2=53.2, y
i=1 5 i=1

^ ? ?yi-y i?2
i=1

R2=1-
5 i=1

≈0.994, y ? ?yi--?2

所以回归模型的拟合效果很好.

[例2]

打鼾不仅影响别人休息,而且还可能与患某种

疾病有关,在某一次调查中,其中每一晚都打鼾的254人中,
患心脏病的有30人,未患心脏病的有224人,在不打鼾的1 379人中,患心脏病的有24人,未患心脏病的有1 355人, 利用图形判断打鼾与患心脏病是否有关.

[解] 根据题目所给的数据得到如下2×2列联表
患心脏病 每一晚都打鼾 不打鼾 合计 30 24 54 未患心脏病 224 1 355 1 579 合计 254 1 379 1 633

相应的等高条形图如图

图中两个深色的高分别表示每一晚都打鼾和不打鼾的 人中患心脏病的频率,从图中可以看出,每一晚都打鼾样

本中患心脏病的频率明显高于不打鼾样本中患心脏病的频
率,因此可以认为打鼾与患心脏病有关系.

[借题发挥]
用二维(等高)条形图可直观地反映两个分类变量之间 的比例差异,可粗略地反映出两个分类变量间是否有关.

[例3]

某电视台联合相关报社对“男女同龄退休”这

一公众关注的问题进行了民意调查,数据如下表所示:
赞同 男 198 反对 217 总计 415


总计

476
674

109
326

585
1 000

根据表中数据,能否在犯错误的概率不超过0.001的前提 下认为对这一问题的看法与性别有关系?

(P(K2≥10.828)≈0.001)

[解]

假设H0:“对这一问题的看法与性别无关”,

由列联表中的数据,可以得到K2的观侧值 n?ad-bc?2 k= ?a+b??c+d??a+c??b+d? 1 000×?198×109-217×476?2 = 415×585×674×326 ≈125.161>10.828, 又P(K2≥10.828)≈0.001, 故在犯错误概率不超过0.001的前提下认为对“男女同龄退 休”这一问题的看法与性别有关.

[借题发挥]
根据所给出的2×2列联表中的数据,计算K2的观测

值,如果K2的观测值很大,说明两个分类变量有关系的
可能性很大,如果K2的观测值比较小(小于2.706),则认 为没有充分的证据显示两个分类变量有关系.

3.在500人身上试验某种血清预防感冒的作用,把他们一
年中的感冒记录与另外500名未用血清的人的感冒记录作 比较,结果如表所示.问:能否在犯错误的概率不超过 1%的前提下认为该种血清能起到预防感冒的作用?
未感冒 使用血清 未使用血清 258 216 感冒 242 284 总计 500 500

总计

474

526

1 000

解:由列联表中的数据,求得K2的观测值为 1 000×?258×284-242×216?2 k= ≈7.075. 474×526×500×500 ∵k=7.075≥6.635, 查表得P(K2≥6.635)=0.01, 故我们在犯错误的概率不超过1%的前提下,即有99%的把握 认为该种血清能起到预防感冒的作用.

4.为了研究子女吸烟与父母吸烟的关系,调查了一千多名 青少年及其家长,数据如下:
父母吸烟 子女吸烟 237 父母不吸烟 83 总计 320

子女不吸烟
总计

678
915

522
605

1 200
1 520

分别利用图形和独立性检验方法判断父母吸烟对子女 是否吸烟有影响?

解:等高条形图,如图所示:

由图形观察可以看出父母吸烟者中子女吸烟的比例要比父

母不吸烟者中子女吸烟的比例高,因此可以在某种程度上
认为“子女吸烟与父母吸烟有关”.

由列联表中的数据得 K2 的观测值 1 520×?237×522-83×678?2 k= 320×1 200×915×605 ≈32.52>10.828. ∴在犯错误的概率不超过 0.001 的前提下认为“父母吸烟对子 女是否吸烟有影响”.

点此进入


赞助商链接
相关文章:
第一章 统计案例 单元测试(人教A版选修1-2)
搜试试 3 帮助 全部 DOC PPT TXT PDF XLS 百度文库 教育专区 高中教育 数学...第一章 统计案例 单元测试(人教A选修1-2)_数学_高中教育_教育专区。第一...
...第一章 统计案例章末过关检测卷 新人教A版选修1-2
搜试试 3 帮助 全部 DOC PPT TXT PDF XLS 百度文库 教育专区 高中教育 数学...2015-2016高中数学 第一章 统计案例章末过关检测卷 新人教A选修1-2_数学_...
第1章 统计案例 章末检测(人教B版选修1-2)
搜 试试 7 帮助 全部 DOC PPT TXT PDF XLS ...第1章 统计案例 章末检测(人教B版选修1-2)_数学...1 000 x2 i 25 121 16 25 9 4 200 a 5 b...
...学年高中数学(人教A版选修1-2)练习:1章 统计案例 单...
【全程复习方略】2014-2015学年高中数学(人教A选修1-2)练习:1章 统计案例 单元质量评估]_高中教育_教育专区。【全程复习方略】2014-2015学年高中数学(人教A版...
...第一章 统计案例章末过关检测卷 新人教A版选修1-2
高中数学 第一章 统计案例章末过关检测卷 新人教A选修1-2 - 章末过关检测卷(一) 第一章 (本部分在学生用书单独成册) 一、选择题(本大题共 12 小题,...
...(人教A版选修1-2)同步检测:第1章 统计案例 章末检测...
2013-2014学年高中数学(人教A选修1-2)同步检测:第1章 统计案例 章末检测 (Word版含答案)_高中教育_教育专区。2013-2014学年高中数学(人教A选修1-2)同步...
数学:第一章《统计案例》测试(2)(新人教A版选修1-2)
数学:第一章《统计案例》测试(2)(新人教A选修1-2) - 数学,全册上册下册,期中考试,期末考试,模拟考试,单元测试,练习说课稿,备课教案学案导学案
数学:第一章《统计案例》素材(新人教A版选修1-2)
数学:第一章《统计案例》素材(新人教A选修1-2)_理学_高等教育_教育专区。第一章 1.1 【要点梳理】 1、统计学提出假设 H 0 ,采用统计量 ? 2 ? 统计...
数学:第一章《统计案例》素材(新人教A版选修1-2)
搜 试试 7 帮助 全部 DOC PPT TXT PDF XLS 百度文库 教育专区 小学教育 ...数学:第一章《统计案例》素材(新人教A选修1-2)_数学_小学教育_教育专区。...
数学:第一章《统计案例》测试(2)(新人教A版选修1-2)
数学:第一章《统计案例》测试(2)(新人教A选修1-2) - 语文数学英语,全册上册下册,期中考试,期末考试,模拟考试,单元测试,练习说课稿,备课教案学案导学案
更多相关文章: