当前位置:首页 >> 研究生入学考试 >>

2008年中国人民大学805统计学考研专业课真题及答案


点这里,看更多考研真题
考研学习中, 专业课占的分值较大。对于考研专业课复习一定要引起高度的 重视,中公考研为大家整理了 2008 年中国人民大学 845 社会理论考研专业课真 题及答案, 并且可以提供中国人民大学考研专业课辅导,希望更多考生能够在专 业课上赢得高分,升入理想的院校。

中国人民大学 805 统计学 2008 年硕士研究生入学考试试题 2008 年人大统计学专业课初试题及答案

试题
一、 (10 分)07 年香港一则报道说: “随着经济的增长,香港低收入家庭的比例在增长, 其中低收入的家庭是指低于中位数的家庭。 ”请你从统计的角度对该报道做简要评论。

二、 (10 分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分 析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。

三、 (10 分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以 建立什么样的预测模型?请你写出模型形式并加以简要说明。

四、 (30 分) 食品厂家说: 净含量是每袋不低于 250g。 但有消费者向消协反映不是 250g, 消协据此要求厂家自检,同时消协也从中随机抽取 20 袋检验。 (1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由; (2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理 由; (3)消协抽取 20 袋,数据如下(略) ,得 p 值为 0.4297,在α =0.5 的显著水平下,检 验假设意味着什么?p 值的含义是什么? (4)据样本数据得该食品每袋平均重量 95%置信区间(241.1,257.5),你认为这种食品 实际平均重量是否在该区间?为什么?

中公考研,让考研变得简单!更多资料,请关注中公考研网

点这里,看更多考研真题

五、 (15 分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。 (1)请具体指明这些假设有哪些? (2)说明这些假设所发挥的主要作用; (3)请讨论这些假设最终产生的影响。

六、 (15 分) 在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种, 并不包括整群抽样,请说明你赞同与否并详列理由。

七、 (30 分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明: (1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点? (2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?

八、 (30 分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考 虑许多因素。 (1)以大坝为例,概略说明需考虑的主要因素; (2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出 计算坝高详细的具体步骤。 (画出框图,并尽量避免过多使用文字)

2008 年人大统计学专业课初试题参考 解答
一、用中位数来描述家庭收入数据的集中趋势有优点亦有不足。 1.中位数是指一组数据排序后处于中间位置的变量值,不受极端值影响,对 偏斜程度较大的顺序或数值型数据代表性较好, 所以它能够排除过高收入 或过低收入带来的不良影响。 2.作为描述数据集中趋势的指标,中位数的应用远不及平均值广泛,中位数 只是一组数据中的一个值,因而对整个香港家庭收入信息有较大浪费;而 中公考研,让考研变得简单!更多资料,请关注中公考研网

点这里,看更多考研真题
平均值能包含所有收入信息,而且具有优良的数学性质,不过它易受极端 值的影响,主要适用于测度偏斜度不大的数据。 3.用中位数作为判别低收入的指标,那么低收入的比例一直都是 50%,这显 然与“比例在增长”相矛盾。

二、方差分析表面上是检验多总体均值是否相等,本质上是研究变量间的关系, 即通过各总体均值是否相等来判断分类型自变量对数值型因变量是否有显 著影响,其中需要分析数据变异的来源,所以叫做方差分析。 观察到的数据一般是参差不齐的,我们用 SST(总平方和)度量数据总 的变异, 将它分解为可追溯到来源的部分变异 SSE (组内平方和) 与 SSA (组 间平方和)之和,若后者的平均 MSA(组间均方)明显比前者的平均 MSE(组 内均方) 大, 就认为自变量对因变量有显著影响。 在方差分析的基本假定下, 上述问题形式上就转化为检验各总体均值是否相等的问题。 所谓基本假定就 是,各总体服从正态分布;各总体方差相同;各观测值相互独立。

三、有多种预测模型可供选择: 1.时间序列分解模型 ①加法模型: xt ? Tt ? St ? It ; ②乘法模型: xt ? Tt ? St ? It ; ③混合模型: xt ? St ? Tt ? It , xt ? St ? (Tt ? It ) 。 其中 xt 为时刻 t 的序列值, Tt , St , I t 分别表示趋势、季节性、随机 波动,下同。 2.季节多元回归模型
xt ? a0 ? a1t ? b1Q1 ? b2Q2 ? b3Q3 ? I t ? ??? ? ? ???? ?
趋势 季节成分 随机波动

其中 Qi (i ? 1, 2,3) 为 0-1 虚拟变量。 3.ARIMA(p,q,d,T)模型(求和自回归移动平均模型) 中公考研,让考研变得简单!更多资料,请关注中公考研网

点这里,看更多考研真题
??( B)?T ?d xt ? ?( B)? t ? 2 ? E (? t ) ? 0, Var (? t ) ? ? , E (? s? t ) ? 0 ( s ? t ) ?E( x ? ) ? 0 (s ? t ) s t ?
符号说明 a. B 为一阶延迟算子( Bxt ? xt ?1 ) ; b. ?(B) ? 1 ? ?1B ??? ? p B p (? p ? 0) 为自回归系数多项式; c. ?(B) ? 1??1B ????q Bq (?q ? 0) 为移动平均系数多项式; d. ?d ? (1 ? B)d 为 d 阶差分算子,用于消除趋势成分; e. ?T 为步长为周期 T 的 T 步差分算子,用于消除季节成分。

四、 (1)厂家从自身利益出发,当然希望每袋平均重量 ? ? 250 g ,这样有利于提 高产品销量,于是可以把 ? ? 250 g 放在“被保护”的位置,而原假设正 具有“被保护”的特性,于是可提出如下检验假设:

? H 0 : ? ? 250 g ? ? H1 : ? ? 250 g
(2)从消费者利益出发,我们担心每袋平均重量 ? ? 250 g ,如果要我们相信

? ? 250 g ,那么厂家就得拿出充分的证据来证明,所以 ? ? 250 g 应放
在“不利”的位置,即放在备择假设中,于是有:

? H 0 : ? ? 250 g ? ? H1 : ? ? 250 g
(3)在 ? ? 0.5 的显著性水平和(2)中的检验假设下, p ? 0.4297 ? ? 意味着

? ? 250 是显著不成立的,即拒绝原假设,我们可以相信厂家所言。
p 值的含义是当原假设为真时,检验统计量取其实现值以及更极端值的概率,它
是检验的真实显著性水平。 (4)这里的区间(241.1,257.5)是一个确定的区间,而食品的实际平均重量 中公考研,让考研变得简单!更多资料,请关注中公考研网

点这里,看更多考研真题
要么在其中,要么不在其中,无概率可言。该区间是 95%的随机置信区 间的一个实现,后者的意思是食品的实际平均重量以 95%的概率落入其 中。 五、经典多元线性回归模型为
y ? X? ??

其中 y 是 n 维随机向量, X 是 n ? ( p ? 1) 设计矩阵,? 是 p ? 1 维系数向量,? 是 n 维随机误差向量。 关于自变量 x1 ,?, x p 的假设主要有: 1.自变量都是确定性变量。 回归分析中的自变量与因变量地位是不等的,其 中后者是随机的, 这与相关分析二者都是随机的不同。从而自变量与随机 误差(以及因变量)也就不相关,保证了回归分析理论的顺利进行。 2.自变量不存在多重共线性。这就要求设计矩阵 X 列满秩,进而观测次数 (样本量) n 必须大于自变量个数 p 。该假设保证了 ? 的普通最小二乘估 计可表示为
? ? (X ? ? X )?1 X ? y

并且具有良好的数学性质, 更方便了进一步的假设检验和回归分析的实际 操作与应用。否则出现多重共线性,就会带来上述诸多方面的麻烦。

六、常见的(概率)抽样方式有①简单随机抽样、②分层抽样、③整群抽样、④ 多阶段抽样和⑤系统抽样,其中简单随机抽样是最基本的,是其他抽样方式 的基础。所谓基本抽样方式,我觉得以不同的标准或不同的思维角度会得出 不同的分类方式,比如: 1.如果将整群抽样(通常指一阶)看作特殊的二阶段抽样(二阶段抽样比 100%) ,则有①②④⑤四种基本抽样方式。 2.如果又将分层抽样视为特殊的二阶段抽样(一阶段抽样比 100%) ,则有① ④⑤三种基本抽样方式。 3.如果将系统抽样看作特殊的分层抽样(每层抽一个单元)或者特殊的整群 中公考研,让考研变得简单!更多资料,请关注中公考研网

点这里,看更多考研真题
抽样(只抽一个群) ,则有①②③④四种基本抽样方式。

七、贝叶斯判别分析的原理是将贝叶斯统计思想用于判别分析。具体说来,设有
k 个总体 G1 ,?, Gk ,分别有密度函数 p1 ( x),?, pk ( x) (一般假定总体都服从

正态分布,协方差阵都相等,各均值有显著差异) ,已知出现这 k 个总体的 先验概率为 q1 ,?, qk 。 我们希望给出一种判别法,也就是给出空间 R m 的一种 划分: D ? {D1 ,?, Dk } ,当 x 落入 Di 时,将其判给 Gi ,使得在该判别法下所 带来的平均损失

ECM ( D) ? ? qi ? L( j | i) P( j | i)
i ?1 j ?1

k

k

达 到 最 小 。 其 中 L( j | i ) 为 样 品 来 自 Gi 而 被 判 给 G j 的 错 判 损 失 ,

P( j | i )?

Dj

?

p x i ( x ) d为错判概率。

(1)与聚类分析数据都是未知类别的相比,贝叶斯判别分析的数据结构中有一 部分数据是已知类别的,还有一部分属于待判别归类的未知类别的。 (2)贝叶斯判别法最终是将样品判给平均损失最小的总体。而其他判别法, 比如距离判别法是将样品判给相距最小的总体; 逐步判别法是先选择最 优判别变量,再结合其它判别法进行判别等等。

八、 (1)建造大坝是一项复杂的工程,要综合水利、建筑、地质、数学、统计等 多学科的知识,要考虑方方面面的因素。就其中坝高设计这一点来说, 要考虑的主要因素我认为有河流宽度与两岸高度、周围地质构造、河水 各季度平均流量、地域旱涝特征,还有建坝的预估资金和时间等等。 (2)具体步骤如下: ①制定计算坝高的详细计划; ②确定影响坝高的主要指标; ③充分收集整理指标数据; 中公考研,让考研变得简单!更多资料,请关注中公考研网

点这里,看更多考研真题
④综合利用各学科知识建立坝高数学模型; ⑤检验优化模型; ⑥利用模型计算坝高估计值,给出置信度和置信区间。 流程图如下:

4.2

中国人民大学 805 统计学 2009 年硕士研究生入学考试试题
2009 年人大统计学专业课初试题及答案

试题
一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取 n=16 的随机样本,均值为 24,方差为 64;从第二个总体中抽取 n=36 的随机样本,均值为 20, 方差为 49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、 在何种情形下, 回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程

X t ? A cos(?t ? ? ) ,其中频率 ? 和振幅 A 都是常数,而相位 ? 是一个 X t }是否平稳?说明原因。

在区间[-π,π]上服从均匀分布的随机变量。问{

四、 把一个总体分为三层, 各层的权重和预估的比例见下表。 待估计的参数为总体比例。 如采用奈曼分层抽样, 请说明需要多大的样本容量才能与样本容量为 600 的无放回简单随机

中公考研,让考研变得简单!更多资料,请关注中公考研网

点这里,看更多考研真题
抽样有相同的估计量方差。 (假设各层总体单位数量

N h 都充分大, 忽略“有限总体校正系数”)

层 1 2 3

总体权重 0.5 0.3 0.2

预估的层内总体比例 0.5 0.7 0.6

五、与人大出版社 21 世纪统计学系列教材之《统计学》 (第二版)第四章习题第 10 题 是一样的。 六、若有线性回归模型 , ,则 ,其中 ,

(1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选 40 只白鼠,将其随机分为 20 对,再随机分为两组。 第一组 10 对白鼠中每一对的两只分别关在不同的笼中喂养; 第二组 10 对白鼠中每一对的两 只关在同一个笼中喂养。 每对白鼠中随机抽取一只喂以实验的安眠药, 在三个不同的时间点 记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于 不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定 40 只白鼠的初始 活动状态相同。请详细阐述你用何种方法分析安眠药的效果?

八、某大学从教师中抽取一个随机样本进行满意度调查。1 分表示非常不满意,100 分 表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则 (1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果) 。 (2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

职 称

男 调查人数 满意度

女 调查人数 满意度

中公考研,让考研变得简单!更多资料,请关注中公考研网

点这里,看更多考研真题
教 30 授 副 30 教授 讲 30 师 74 30 75 83 30 80 88 30 82

本内容由中公考研辅导老师整理,获取更多中国人民大学考研专业课资料、专业 课辅导、高分学长考研经验,请关注中公考研网。

中公考研,让考研变得简单!更多资料,请关注中公考研网


赞助商链接
相关文章:
2017年中国人民大学805统计学考研真题(回忆版)
2017年中国人民大学805统计学考研真题(回忆版) - 2017 年中国人民大学 805 统计学考研真题(回忆版) 1.证明:2n+1 个样本中位数,几乎处处收敛到 1/2. 2....
2017年人大统计学(学硕)805真题
2017年人大统计学(学硕)805真题_研究生入学考试_高等教育_教育专区。2017 年...2016年中国人民大学805统... 1页 免费 中国人民大学805统计学2... 暂无评价...
2016中国人民大学805统计学真题回忆版
2016中国人民大学805统计学真题回忆版 - 2016 年中国人民大学 805 统计学真题回忆版 8 个题 除第 1 题 10 分外另外 7 个题一题 20 分 1 请给出一个满足...
中国人民大学统计学院统计学考研真题_图文
中国人民大学统计学院统计学考研真题 - 中国人民大学统计学院[统计学]考研专业课资料册 目 录 一、考研资讯 ......
人大805统计学真题
人大805统计学真题_研究生入学考试_高等教育_教育专区。15 年真题 1.一 1000 ...2013年人大805统计学初试... 4页 1下载券 2016年中国人民大学805统... ...
人大统计学考研历年真题(03-09)参考答案
8 统计之都 COS—Capital Of Statistics 2008 年人大统计学专业课试题参考...中国人民大学805统计学1... 暂无评价 79页 ¥30.00 人民大学2003-2009年...
人大统计学专业课考研历年初试题1998-2011_图文
2008 年人大统计学专业课试题 人大考研真题一、 ...805 321 547 123 143 2014 533 1490 1271 903 ...2016年中国人民大学统计... 暂无评价 1页 免费 ...
中国人民大学统计学考研参考书目与考试科目
凯程考研,中国最权威的考研辅导班 中国人民大学统计学考研参考书目与考 试科目初试: 805-统计学 《概率论》,李贤平,高等教育出版社 《数理统计基础》 , 陆璇 , ...
人大统计学考研真题
人大统计学考研 历年真题精华版 历年真题精华版 (03...年人大统计学 2008 年人大统计学专业课试题一、 ...2007年中国人民大学805统... 暂无评价 17页 免费 ...
中国人民大学应用统计考研参考书目与考试科目
凯程考研,中国最权威的考研辅导班 中国人民大学应用统计考研参考书目与 考试科目初试: 432-统计学统计学》 第四版 贾俊平 中国人民大学出版社 配套习题 《应用...
更多相关文章: