线性回归方程 思考下列问题: 两个变量之间的常见关系有几种? (1)函数关系 函数关系是一种确定性的关系,变量之 间的关系可以用函数表示。 (2)相关关系 变量之间有一定的联系,但不能完全用函 数来表示。 练习 1、球的体积和球的半径具有( A ) A. 函数关系 B. 相关关系 C. 不确定关系 D. 无任何关系 2、下列两个变量之间的关系不是函数关系的是 D ( ) A. 角的度数和正弦值 B. 速度一定时,距离和时间的关系 C. 正方体的棱长和体积 D. 日照时间和水稻的亩产量 问题: 某小卖部为了了解热茶销售量与气温之间 的关系,随机统计并制作了某6天卖出热茶的 杯数与当天气温的对照表: 气温/0C 杯数 26 20 18 24 13 34 10 38 4 50 -1 64 如果某天的气温是-50C,你能根据这些数 据预测这天小卖部卖出热茶的杯数吗? 表示具有相关关系的两个变量的一组数据 的图形,叫做散点图. 为了了解热茶销售与 气 26 18 13 10 4 -1 气温的大致关系,我 温 杯 们以横坐标 表示气温, 20 24 x 34 38 50 64 数 纵坐标y表示热茶销量, 建立平面直角坐标系, 将表中数据构成的6个 数对所表示的点在坐标 y F 60 50 40 30 20 10 5 你发现这些点 有什么规律? E D C B A 系中标出,得到如下散点图: -5 0 15 25 35 x 答:都分布在同一条直线的附近。 选择怎样的直线才能近似地表示热茶销量 与气温之间的关系? 可以有多种思考方案: (1)选择能反映直线变化的两个点,例如取 (4,50),(18, 24) 这两点的直线; (2)取一条直线,使得位于该直线一侧和 另一侧的点的个数基本相同; (3)多取几组点,确定几条直线方程,再分 别算出各条直线斜率、截距的平均值,作为 所求直线的斜率、截距; ……………… 怎样的直线最好呢? 建构数学 ? ? bx ? a 的直线拟合散点图中 用方程为 y 的点,应使得该直线与散点图中的点最接近 那么,怎样衡量直线 y ? ? bx ? a 与图中六 个点的接近程度呢? 我们将表中给出的自变量 ? y x 的六个值 带入直线方程,得到相应的六个值: 26b ? a,18b ? a,13b ? a,10b ? a, 4b ? a, ?b ? a 它们与表中相应的实际值应该越接近越好. 所以,我们用类似于估计平均数时的思想,考虑 离差的平方和: 2 2 Q(a, b) ? (26b ? a ? 20) ? (18b ? a ? 24) ? (13b ? a ? 34) ? (10b ? a ? 38) 2 2 ? (4b ? a ? 50)2 ? (?b ? a ? 64)2 ? 1286b ? 6a ? 140ab ? 3820b ? 460a ? 10172 2 2 Q(a, b) 是直线 ? ? bx ? a 与各散点 y 在垂直方向(纵轴方向)上的距离的平方和,可 以用来衡量直线与六个点的接近程度. 先把a看做常数,那么Q是关于b的二次函数.易 140a ? 3820 知,当 b ? ? 2 ?1286 时,Q取得最小值. 同理,把b看做常数,那么Q 是关于a的二次函数. 140b ? 460 当 a?? 时,Q取得最小值.因此,当 12 140b ? 460 a?? 12 所求直线方程为 y ?-1.6477x+57.5568 ? 1