当前位置:首页 >> 数学 >>

选修2-3课件:3.1回归分析的基本思想第二课时


3.1 回归分析的基本思想 及其初步应用(二)

1

前置测评

? ? ? 1、 求回归直线方程 y ? bx ? a (最小二乘法):

?? b ? i ?1

? i X ? Y) ??(1x x? yi )( yn?x y i
n i i

n

? a ? Y ? bX
( X ,Y ) 为样本点的中心

?

? (xX ? i
i ?1
i ?1

nn

2
i

? X )x ?n

2 2

2

前置测评

2、我们通常用相关系数r来描述两个变量之间 线性相关关系的强弱。

r?

? x y ?n xy
i i i?1 n 2 ?? 2? ? n 2 2 ? ? xi ? n x ?? ? yi ? n y ? ? i?1 ?? i?1 ?

n

??

??

★其中:(1)|r|≤1; (2)|r|越接近于1,相关程度越强, |r|越接近于0,相关程度越弱; (3) b 与 r 同号。
3

前置测评

3、线性回归模型:

? y ? bx ? a ? e ? 2 ? E (e ) ? 0, D(e ) ? ?
其中:e是随机误差,均值E(e)=0,方差D(e)=σ2>0 当随机误差e恒等于0时,线性回归模型就变成一 次函数模型。即:一次函数模型是线性回归模型的特

殊形式。

4、相关系数r与随机误差e一般有什么关系?
4

? 随机误差 e ? y ? y
相应的随机误差为:

e的估计量

? ? e? y? y

样本点: x1 , y1 ),( x2 , y2 ), ... ,( xn , yn ) (

? ei ? yi ? yi ? yi ? bxi ? a, i ? 1,2,..., n
相应的随机误差估计值为:

? e i 称为相应于点 ( xi , yi ) 的残差

? ? ? ? ei ? yi ? yi ? yi ? bxi ? a, i ? 1,2,..., n
实际上即为具体到某 点的随机误差估计值。

1 n 2 1 2 ?i ? ? , b )( n ? 2) 为 ? 2 的估计量 ? ? ? e Q(a ? ? n?2 n ? 2 i ?1 ? ? Q(a , b ) 称为残差平方和。
5

残差分析
在研究两个变量间的关系时,首先要根据散点图来粗 略判断它们是否是线性相关,是否可以用线性回归模 ? ? ? 型来拟合数据.然后,可以通过残差 e1 , e2 ,? , en 来判 断模型拟合的效果,判断原始数据中是否存在可疑数 据.这方面的分析工作称为残差分析。

6

下表为女大学生身高和体重的原始数据以及相应的残 差数据:
编号 身高/cm 1 165 2 165 3 157 4 170 5 175 6 165 7 155 8 170

体重/kg
残差

48

57

50

54

64
1.137

61

43

59

? e

-6.373 2.627 2.419 -4.618

6.627 -2.883 0.382

以纵坐标为残差,横坐标为编号,作出图形(残差图) 来分析残差特性.

7

8 6 4 2

残差

0 -2 0 -4 -6 -8 编号 2 4 6 8 10

系列1

由图可知,第1个样本点和第6个样本点的残差比较大, 需要确认在采集这两个样本点的过程中是否有人为的 错误.如果数据采集有错误,就予以纠正,然后重新 利用线性回归模型拟合数据;如果数据采集没有错误, 8 则需要寻找其他原因.

问:如何刻画模型拟合的精度? 相关指数: 2 ? 1 ? R

? ( yi ? yi ) 2 ?
i ?1 n

n

★其中:

?( y
i ?1

i

? y)

2

(1)在含有一个解释变量的线性模型中,R2恰好等于相 关系数r的平方. (2)R2取值越大(越接近1),则残差平方和越小,即模 型的拟合效果越好.(实际上就是:|r|越大,则|e|越小) (3)在例1中我们可以求出R2=0.64,表明:“女大学 生的身高解释了64%的体重变化”,或者说“女大 学生的体重差异有64%是由身高引起的”。
9

建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是解释变量,哪 个变量是预报变量;

(2)画出确定好的解释变量和预报变量的散点图, 观察它们之间的关系(是否存在线性关系); 是否存在线性关系
(3)由经验确定回归方程的类型(如观察到数据呈线 性关系,则选用线性回归方程y=bx+a); (4)按一定规则估计回归方程中的参数(如最小二 乘法); (5)得出结果后分析残差图是否异常(个别数据对 应残差过大,或残差呈现不随机的规律性等),若存 在异常,则检查数据是否有误,或模型是否合适等. 10

例2、一只红铃虫的产卵数y和温度x有关,现收集了7 组观测数据列于下表,试建立y与x之间的回归方程. 温度x/0C 产卵数y/个 21 7 23 11 25 21 27 24 29 66 32 35

115 325

解:收集数据作散点图:
350 300 250
产卵数

200 150 100 50 0 0 10 20 温度 30 40

系列1

11

在散点图中,样本点没有分布在某个带状区域内, 因此两个变量不呈现线性相关关系,所以不能直接 利用线性回归方程来建立两个变量之间的关系. 根据已有的函数知识,可以发现样本点分布在某一条 指数函数曲线 参数. 令z=lny,则变换后样本点应该分布在直线z=bx+a (a=lnc1,b=c2)的周围.

y ? c1e

c2 x

的周围,其中c1和c2是待定

利用线性回归模型建立y和x之间的非线性回归方程. 当回归方程不是形如y=bx+a时,我们称之为非线性回 归方程.
12

X

21

23

25

27

29

32

35

z 1.946 2.398 3.045 3.178 4.190 4.745 5.784

? z 所得线性回归方程为:

? 0.272 x ? 3.849

y ? c1e

c2 x

a=lnc1,b=c2

所以红铃虫的产卵数对温度的非线性回归方程为:

? y

(1)

?e

0.272 x ? 3.849

13

还可以拟合成什么函数模型?
350 300 250
产卵数

200 150 100 50 0 0 10 20 温度 30 40

系列1

若看成样本点集中在某二次曲线y=c3x2+c4的附近.
作变换t=x2,建立y与t之间的线性回归方程:y=c3t+c4.
14

t y

441 7
350 300 250

529 11

625 21

729 24

841 66

1024 1225 115 325

产卵数

200 150 100 50 0 0 500 1000 温度的平方 1500

系列1

? (2) ? 0.367t ? 202.543 y ? (2) ? 0.367 x 2 ? 202.543 15 y y关于x的二次回归方程为:

利用残差计算公式:

? y

(1)

?e

0.272 x ? 3.849

? (2) ? 0.367 x 2 ? 202.543 y
0.272 xi ? 3.849

? ei
X

(1)

? ? yi ? yi
23

(1)

? yi ? e

, i ? 1,2,?,7
32 35

? ? ei (2) ? yi ? yi (2) ? yi ? 0.367 xi 2 ? 202.543, i ? 1,2,?,7
21 25 27 29

Y

7

11

21

24

66

115

325

? ei(1) 0.557 -0.101 1.875 -8.950 9.230 -13.381 34.675 ? ei(2) 47.696 19.400 -5.832 -41.000 -40.104 -58.265 77.968

? ? ? Q ? ? ei2 Q(1) ? 1550.538, Q(2) ? 15448.431. 由残差平方和:?
或由条件R2分别为0.98和0.80,同样可得它们的效果.
16 故指数函数模型的拟合效果比二次函数的模拟效果好.

n

i ?1

给定样本点: x1 , y1 ),( x2 , y2 ), ... ,( xn , yn ) (
两个含有未知参数(a、b为未知参数)的模型:

? y

(1)

? f ( x, a )

? (2) ? g( x, b) y

如何比较它们的拟合效果:
(1)分别建立对应于两个模型的回归方程
(2) ? ? (1) ? f ( x, a ) ? ? y y ? g( x , b ) ? ? a , b 分别是参数a和b的估计值.

(2)分别计算两个回归方程的残差平方和 n n ? ? ? ? Q (1) ? ( y ? y (1) )2 Q (2) ? ( y ? y (2) ) 2

?
i ?1

i

i

?
i ?1

i

i

? ? ,则 y(1) (3)若 Q(1) ? Q(2) ?

? 反之, y

(2)

? ? g( x, b )的拟合效果好.

? ? f ( x, a ) 的拟合效果好;

习题3.1

A组 1、3

18


赞助商链接
相关文章:
...数学人教A版选修2-3教案:3.1回归分析的基本思想及其...
2017学年高中数学人教A版选修2-3教案:3.1回归分析的基本思想及其初步应用第一课时 Word版含解析 - 高中数学必修,PPT,PPT课件,数学练习说课稿,备课教案学案导学案,...
...数学人教A版选修2-3练习:3.1 回归分析的基本思想及...
搜试试 3 悬赏文档 全部 DOC PPT TXT PDF XLS 广告 百度文库 教育专区 ...2016-2017学年高中数学人教A版选修2-3练习:3.1 回归分析的基本思想及其初步应用...
...人教A版选修2-3课前导引:3.1回归分析的基本思想及其...
2017学年高中数学人教A版选修2-3课前导引:3.1回归分析的基本思想及其初步应用 Word版含解析_数学_高中教育_教育专区。高中数学必修,PPT,PPT课件,数学练习说课稿,...
...人教A版选修2-3课后训练:3.1 回归分析的基本思想及...
2017学年高中数学人教A版选修2-3课后训练:3.1 回归分析的基本思想及其初步应用 Word版含解析_数学_高中教育_教育专区。高中数学必修,PPT,PPT课件,数学练习说课稿,...
...人教A版数学选修2-3导学案:3.1回归分析的基本思想及...
2015-2016学年高二人教A版数学选修2-3导学案:3.1回归分析的基本思想及其初步应用_高二数学_数学_高中教育_教育专区。31 回归分析的基本思想及其初步应用 3.1.1 ...
...人教A版选修2-3课堂导学:3.1回归分析的基本思想及其...
2017学年高中数学人教A版选修2-3课堂导学:3.1回归分析的基本思想及其初步应用 Word版含解析_数学_高中教育_教育专区。高中数学必修,PPT,PPT课件,数学练习说课稿,...
...选修2-3:3.1回归分析的基本思想及其初步应用第1课时...
湖北省巴东一中高二数学教案 选修2-3:3.1回归分析的基本思想及其初步应用第1课时_数学_高中教育_教育专区。§3.1 回归分析的基本思想及其初步(1)【学情分析】 :...
...选修2-3《3.1.1回归分析的基本思想及其初步应用》教...
搜 试试 7 帮助 全部 DOC PPT TXT PDF XLS 百度文库 教育专区 高中教育 ...§3.2 回归分析(2) 一.问题情境 1.情境:下面是一组数据的散点图,若求出...
...课时提升卷(十八) 第三章 3.1 回归分析的基本思想及...
高中数学人教A版选修2-3课时提升卷(十八) 第三3.1 回归分析的基本思想及其初步应用_数学_高中教育_教育专区。高中数学人教A版选修2-3课时提升卷 ...
...3.1回归分析的基本思想及其初步应用第3课时教案 新...
湖北省巴东一中高中数学 3.1回归分析的基本思想及其初步应用第3课时教案 新人教版选修2-3_数学_高中教育_教育专区。§3.1 回归分析的基本思想及其初步(3) 【学情...
更多相关标签: