当前位置:首页 >> 数学 >>

2016-2017《创新设计》同步人教A版选修1-2cx11


第一章

统计案例

§ 1.1 回归分析的基本思想及其 初步应用

学习 目标

1.了解随机误差、残差、残差图的概念. 2.会通过分析残差判断线性回归模型的拟合效果. 3.掌握建立线性回归模型的步骤.

栏目 索引

知识梳理 题型探究
当堂检测

自主学习 重点突破
自查自纠

知识梳理

自主学习

知识点一 1.回归分析

线性回归方程

(1) 函数关系:函数关系是一种确定性的关系 .例如正方形的周长 C=4a ,
周长C与边长a之间就是一种确定性关系,对于自变量(边长)的每一个确定

的值,都有唯一确定的周长与之相对应.
(2)相关关系:当自变量取值一定时,因变量的取值带有一定的随机性的

两个变量之间的关系叫作相关关系.相关关系是一种非确定性关系.
回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法叫

作回归分析.

2.线性回归方程
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回归

直线y=bx+a的斜率和截距的最小二乘估计公式分别为

^= b

i=1

? ?xi- x ??yi- y ? ? ? x i - x ?2
n

n

i =1

?xiyi-n x y
2 - n x ?x2 i n

n



^ x ,其中( x , y )称为样本点的 ^ = y -b ,a

i=1

i=1

中心.

思考1 答案 思考2 答案

确定线性回归方程,只需得出哪两个量? 确定线性回归方程,只需确定a,b两个量即可. 回归分析中,利用线性回归方程求出的函数值一定是真实值吗? 不一定是真实值,利用线性回归方程求的值,在很多时候是个预

报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高 的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.

答案

知识点二

残差的概念

对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为 ^xi-a ^, ei= yi-bxi-a , i=1,2, …, n, 其估计值为^ ei=yi-^ yi=yi-b i=1,2, …, n,^ ei 称为相应于点(xi,yi)的 残差 .

答案

知识点三 1.残差图法

刻画回归效果的方式

作图时纵坐标为残差,横坐标 可以选为样本编号,或身高数据,或体重估
计值等,这样作出的图形称为残差图.在残差图中,残差点 比较均匀 地

落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽
度 越窄 ,说明模型拟合精度越高.
2.残差平方和法
2 ^ 残差平方和 ? (yi-yi) ,残差平方和 越小 ,模型拟合效果越好. i=1 n

答案

3.利用R2刻画回归效果
2 ^ ? y - y ? ? i i 2 预报 解释 ;R 表示 变量对于 变量变化的贡献率.R 越接 2 n

i=1

R =1-
2

i =1

2 ? y - y ? ? i

n

近于 1 ,表示回归的效果越好.

答案

返回

题型探究

重点突破

题型一 例1

求线性回归方程

在一段时间内,某种商品的价格x(万元)和需求量y(t)之间的一组数据为: 价格x 1.4 1.6 1.8 2 2.2

需求量y
(1)画出散点图; 解

12

10

7

5

3

散点图如图所示.

解析答案

(2)求出y对x的线性回归方程;

解析答案

(3)如果价格定为1.9万元,预测需求量大约是多少.
解 当 x=1.9 时,^ y=28.1-11.5×1.9=6.25(t),

所以价格定为1.9万元时,需求量大约是6.25 t.

反思与感悟

解析答案

跟踪训练1

某研究机构对高三学生的记忆力x和判断力y进行统计分析,

得下表数据: x 6 8 10 12

y

2

3

5

6

(1)请画出上表数据的散点图(要求:点要描粗); 解 如图:

解析答案

(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 ^ ^x+a ^; y=b

解析答案

(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. 解 由(2)中线性回归方程当x=9时,

^ y=0.7×9-2.3=4,预测记忆力为 9 的同学的判断力约为 4.

解析答案

题型二 线性回归分析
例2 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同

重量的6个物体进行测量,数据如下表所示:
x y 5 7.25 10 8.12 15 8.95 20 9.90 25 10.9 30 11.8

(1)作出散点图并求线性回归方程;

解析答案

(2)求出R2; 解 列表如下: yi-^ yi yi-y
6

0.05 -2.24
2

0.005 -1.37
6

-0.08 -0.54

-0.045 0.41

0.04 1.41

0.025 2.31

所以 ? (yi-^ yi) ≈0.013 18, ? (yi- y )2=14.678 4.
i =1 i=1

0.013 18 所以,R =1-14.678 4≈0.999 1,
2

回归模型的拟合效果较好.
解析答案

(3)进行残差分析. 解 由残差表中的数值可以看出第3 个样本点的残差比较大,需要确认 在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据, 重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过 0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高, 由以上分析可知,弹簧长度与拉力成线性关系.

反思与感悟

解析答案

跟踪训练2

已知某种商品的价格x(单位:元/件)与需求量y(单位:件)之

间的关系有如下一组数据: x y 14 12 16 10 18 7 20 5 22 3

求y对x的线性回归方程,并说明回归模型拟合效果的好坏.

解析答案

题型三 非线性回归分析
例3 下表为收集到的一组数据: x y 21 7 23 11 25 21 27 24 29 66 32 115 35 325

(1)作出x与y的散点图,并猜测x与y之间的关系;

解析答案

(2)建立x与y的关系,预报回归模型并计算残差;

解析答案

(3)利用所得模型,预报x=40时y的值.
解 当x=40时,y=e0.272×40-3.849≈1 131.

反思与感悟

解析答案

跟踪训练 3

为了研究甲型 H1N1 中的某种细菌随时间 x变化的繁殖个数 y,

收集数据如下: 天数x 繁殖个数y 1 6 2 12 3 25 4 49 5 95 6 190

求y对x的回归方程.

解析答案

易错点

忽视线性相关性的分析致误

例4 在一次抽样调查中测得变量x与y的一组样本数据如下表: x y 0.25 16 0.5 12 1 5 2 2 4 1

试建立y与x之间的回归方程.

点评

解析答案

返回

当堂检测

1

2

3

4

5

1.下列两个变量之间的关系不是函数关系的是( D ) A.角度和它的余弦值 B.正方形的边长和面积 C.正n边形的边数和内角度数和 D.人的年龄和身高 解析 函数关系就是一种变量之间的确定性的关系.A,B,C三项中的两个 变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ, g(a)=a2,h(n)=nπ-2π.D选项中的两个变量之间不是函数关系,对于年龄 确定的人群,仍可以有不同的身高.故选D.
解析答案

1

2

3

4

5

2.设一个线性回归方程为^ y=2-1.5x,则变量 x 增加一个单位时( C A.^ y平均增加 1.5 个单位 B.^ y平均增加 2 个单位 C.^ y平均减少 1.5 个单位 D.^ y平均减少 2 个单位
解析 由线性回归方程^ y=2-1.5x 中 x 的系数为-1.5,知 C 项正确.

)

解析答案

1

2

3

4

5

3.已知变量 x 与 y 正相关, 且由观测数据算得样本平均数 x =3,y =3.5, 则由该观测数据算得的线性回归方程可能是( A ) A.^ y=0.4x+2.3 C.^ y=-2x+9.5
解析

B.^ y=2x-2.4 D.^ y=-0.3x+4.4

因为变量 x 与 y 正相关,则在线性回归方程中,x 的系数应大于 0,

排除 C,D.将 x =3, y =3.5 分别代入 A,B 中的方程,只有 A 满足.故选 A.

解析答案

1

2

3

4

5

4.对具有线性相关关系的变量x,y,测得一组数据如下表: x 2 4 5 6 8

y

20

40

60

70

80

^,据此模型 根据上表,利用最小二乘法得它们的线性回归方程为^ y=10.5x+a 来预测当 x=20 时,y 的估计值为( )

A.210 C.211.5

B.210.5 D.212.5

解析答案

1

2

3

4

5

5.在研究硝酸钠的溶解度时,观察它在不同温度(x)的水中溶解度(y)的结果 如下表:

温度x
溶解度y

0
66.7

10
76.0

20
85.0

50
112.3

70
128.0

由此得到回归直线的斜率是________.

解析答案

课堂小结 回归分析的基本思路

(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是

否存在线性关系等);
^x (3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程^ y =b ^ ); +a

(4)按一定规则估计回归方程中的参数;

(5)提出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现
不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.
返回


相关文章:
2016-2017《创新设计》同步人教A版选修1-2cx11_图文.ppt
2016-2017《创新设计》同步人教A版选修1-2cx11 - 第一章 统计案
更多相关文章: