数学人教版新课标B3.2 回归分析习题
展开《回归分析》复习问答
一、【问】回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.相关关系又分线性相关关系和非线性相关关系,如何利用回归分析的方法对两个具有线性相关关系的变量进行研究呢?
【答】利用回归分析的方法对两个具有线性相关关系的变量进行研究的步骤为:①画出两个变量的散点图;②求回归直线方程;③用回归直线方程进行预报.其中求回归直线方程是关键.而对于线性回归模型来说,估计模型中的未知参数a和b的最好方法就是用最小二乘估计和,其计算公式为,.
例1 某地10户家庭的年收入和年饮食支出的统计资料如下表:
年收入 (万元) | 2 | 4 | 4 | 6 | 6 | 6 | 7 | 7 | 8 | 10 |
年饮食支出 (万元) | 0.9 | 1.4 | 1.6 | 2.0 | 2.1 | 1.9 | 1.8 | 2.1 | 2. 2 | 2.3 |
(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系;
(2)如果某家庭年收入为9万元,预测其年饮食支出.
解析:(1)由题意知,年收入x为解释变量,年饮食支出y为预报变量,作散点图(如图所示).
从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.
,,
,,
.
.
从而得到回归直线方程为.
(2)万元.
点评:①是斜率的估计值,说明年收入x每增加一万元,年饮食支出y就增加0.172万元,这表明了年饮食支出与年收入具有正的线性相关关系.②对于该家庭年收入为9万元,由回归方程得到的年饮食支出的预报值2.346万元,并不能说该家庭的年饮食支出一定是2.346万元.一般说来,不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.
二、【问】上面说到,判断解释变量x与预报变量y是否具有线性相关关系,先作出散点图,从点的分布特征来判定是否线性相关.那么,如果作图不准,出现误差怎么办?怎样更好地判定两个变量相关关系的强弱?
【答】作相关性检验,通过作散点图,并观察所给的数据列成的点是否在一条直线的附近来判定,这样做既直观又方便,因而对解决相关性检验问题比较常用,但在作图中,由于存在误差,有时很难说这些点是不是分布在一条直线的附近,这时就很难判断两个变量之间是否具有相关关系.因此,给定样本数据,单纯由散点图判定其是否大致在一条直线附近主观性太强,回归分析时还通常用相关系数r来检验两个变量之间线性相关关系的强弱.样本相关系数的具体计算公式为:的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常当r大于0.75时,认为两个变量有很强的线性相关关系.
例2 为了了解某地母亲身高x与女儿身高y的相关关系,现随机测得10对母女的身高,所得数据如下表所示:
母亲身高(cm) | 159 | 160 | 160 | 163 | 159 | 154 | 159 | 158 | 159 | 157 |
女儿身高(cm) | 158 | 159 | 160 | 161 | 161 | 155 | 162 | 157 | 162 | 156 |
试对x与y进行回归分析,并预报当母亲身高为161cm时,女儿的身高为多少?
解析:作线性相关性检验,,
,
,.
因此.
表明x与y有线性相关关系,因而求回归直线方程有必要.
又,.
由此可得回归直线方程为.斜率的估计值反映出当母亲身高每增加1cm时,女儿身高平均增加0.78cm,可以理解为女儿身高中不受母亲身高影响的部分.当母亲身高为cm时,预报女儿身高为cm,这就是说当母亲身高为161cm时,女儿身高大致也为161cm.
点评:本题是一个回归分析类问题 .解决这一问题,首先应对问题进行必要的相关性检验,如果x与y之间具有线性相关关系,再求出对应的回归直线的方程,最后利用回归直线方程由解释变量x的值得到预报变量y的值.
注意:如果不先作相关性检验,我们虽然也可以求出x与y的回归直线方程,但这时的回归直线方程也许没有任何实际价值,它也就不能反映变量x与y之间的变化规律,只有在x与y之间具有相关关系时,求回归直线方程才具有实际意义.
三、【问】如何比较两个不同回归模型的拟合效果?
【答】首先建立回归模型,其基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性相关关系等);③由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程);④按一定规则估计回归方程中的参数(如最小二乘法);⑤得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等.
建立起回归模型后,利用残差分析的方法来比较两个不同回归模型的拟合效果.其方法是:对于由给定的样本点而得到的两个回归方程和,分别计算两个回归方程的残差平方和与;若,则的效果比的好;反之,的效果不如的好.
四、【问】上面主要研究了线性回归问题,那么如何用回归分析的方法对非线性回归问题进行统计分析呢?
【答】对于非线性回归问题进行回归分析的方法是:
(1)若问题中已给出经验公式,这时可以将解释变量进行交换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.
(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图象作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量变换,将问题化为线性回归分析问题来解决.
例3 某种图书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:
1 | 2 | 3 | 5 | 10 | 20 | 30 | 50 | 100 | 200 | |
10.15 | 5.52 | 4.08 | 2.85 | 2.11 | 1.62 | 1.41 | 1.30 | 1.21 | 1.15 |
检验每册书的成本费y与印刷册数的倒数之间是否有线性相关关系,如果有,求出y对x的回归方程.
解析:首先作变量变换,令,则题目所给数据变成如下表所示的数据:
1 | 0.5 | 0.33 | 0.2 | 0.1 | 0.05 | 0.03 | 0.02 | 0.01 | 0.005 | |
10.15 | 5.52 | 4.08 | 2.85 | 2.11 | 1.62 | 1.41 | 1.30 | 1.21 | 1.15 |
可以求得,由,因此变量与之间具有较强的线性相关关系,并且,,最后回代可得.
因此与的回归方程为.
点评:本题中y与x之间不具有线性回归关系,因而是非线性回归分析问题,通过变量变换,即令,并通过对u与y作相关性检验,判定出y与u之间具有较强的线性相关关系后,求出y对u的回归直线方程,最后再回代,得到y对x的回归方程.
五、【问】如何进行独立性检验?
【答】若要推断的论述为:“X与Y有关系”,判断结论成立的可能性的方法是:
(1)三维柱形图与二维条形图可用于粗略地判断两个分类变量是否有关系.
①在三维柱形图中,主对角线上两个柱形高的乘积ad与副对角线上两个柱形高的乘积bc相差越大,两个分类变量X与Y有关系的可能性就越大.
②在二维条形图中,可以估计图形满足的个体中具有的个体所占的比例,也可以估计满足条件的个体中具有的个体所占的比例,两个比例相差越大,X与Y有关系的可能性就越大.但是三维柱形图和二维条形图无法精确地给出所得结论的可靠程度,因而只做粗略估计,而不做具体运算.
(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算检验随机变量的值,其值越大,说明“与有关系”成立的可能性越大.
独立性检验的一般步骤是:①假设两个分类变量X与Y无关系;②计算出的观测值;③把k的值与临界值比较确定X与Y有关系的程度或无关系.
数学选修1-21.1回归分析的基本思想及其初步应用同步达标检测题: 这是一份数学选修1-21.1回归分析的基本思想及其初步应用同步达标检测题,
人教版新课标B选修1-21.2回归分析习题: 这是一份人教版新课标B选修1-21.2回归分析习题,共3页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
数学选修1-21.1回归分析的基本思想及其初步应用课后复习题: 这是一份数学选修1-21.1回归分析的基本思想及其初步应用课后复习题,共3页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。