2022届高考数学理一轮复习新人教版课件:第十章统计统计案例第三节变量间的相关关系与统计案例
展开1.相关关系与回归方程(1)相关关系的分类:①正相关:从散点图上看,点分布在从______到______的区域内;②负相关:从散点图上看,点分布在从______到______的区域内.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在________附近,则称这两个变量之间具有线性相关关系,这条直线叫做________.
③r的绝对值越接近1,表明两个变量的线性相关性____;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.2.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
1.两种关系——函数关系与相关关系(1)区别:①函数关系是一种确定性关系,相关关系是一种非确定性关系.②函数关系是一种因果关系,相关关系不一定是因果关系,也可能是伴随关系.(2)联系:对线性相关关系求回归方程后,可以通过确定的函数关系对两个变量间的取值进行估计.
3.回归分析的意义回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为解释变量,因变量y称为预报变量.4.独立性检验利用独立性假设、随机变量K2来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
两个分类变量X和Y是否有关系的判断标准:统计学研究表明:当K2≤2.706时,认为没有充分证据显示X与Y有关系;当K2>3.841时,有95%的把握说X与Y有关;当K2>6.635时,有99%的把握说X与Y有关;当K2>10.828时,有99.9%的把握说X与Y有关.
1.(基础知识:回归分析的相关指数)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是 ( )A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25
3.(基础知识:独立性检验)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:
类型 1 相关关系的判断 [例1] (1)(2021·云南昆明诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
根据表中数据,下列说法正确的是( )A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系解析:利润率随人均销售额增大而增大是相关关系,而不是函数关系.答案:A
(2)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A.r2
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
类型 3 非线性回归分析 [例3] 为方便市民出行,倡导低碳出行.某市公交公司推出利用支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,在推广期内采用随机优惠鼓励市民扫码支付乘车.该公司某线路公交车队统计了活动推广期第一周内使用扫码支付的情况,其中x(单位:天)表示活动推出的天数,y(单位:十人次)表示当天使用扫码支付的人次,整理后得到如图所示的统计表1和散点图.
方法总结1.利用散点图判断两个变量是否有相关关系是比较简便的方法:(1)在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.(2)如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系.
解析:(1)散点图如图所示.
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
(2)根据抽查数据,可得2×2列联表:
方法总结1.独立性检验的原理独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信度,首先假设该结论不成立.即假设结论“两个分类变量没有关系”成立.在该假设下构造的随机变量K2应该很小.如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明不合理.
2.独立性检验的一般步骤(1)根据样本数据列出2×2列联表.(2)计算随机变量K2的观测值k,查表确定临界值k0.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”.
[对点训练] 某次模拟考试中,某校共有100名学生参加考试,其中语文考试成绩低于130分的占95%,数学成绩的频率分布直方图如图所示:
(1)如果成绩不低于130分的为特别优秀,这100名学生中本次考试语文、数学成绩特别优秀的大约各多少人?(2)如果语文和数学两科都特别优秀的共有3人.①从(1)中的这些同学中随机抽取2人,求这两人两科成绩都特别优秀的概率;②根据以上数据,完成2×2列联表,并分析是否有99.9%的把握认为语文特别优秀的同学,数学也特别优秀.
解析:(1)该校共有100名学生参加考试,其中语文考试成绩低于130分的占95%,语文成绩特别优秀的概率为P1=1-0.95=0.05,语文成绩特别优秀的同学有100×0.05=5(人);数学成绩特别优秀的频率为P2=0.002×20=0.04,数学成绩特别优秀的同学有100×0.04=4(人).
1.(2020·高考全国卷Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+b ln x解析:由散点图可以看出,点大致分布在对数型函数的图象附近.
2.(2020·高考全国卷Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
解析:(1)由所给数据,得该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:
(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,补全下列2×2列联表,并根据列联表的独立性检验,判断是否有85%的把握认为经常使用共享单车与年龄有关?
使用共享单车情况与年龄列联表
(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人数为随机变量X,求X的分布列与数学期望.
解析:(1)补全的列联表如下:
备战2024高考一轮复习数学(理) 第十章 统计与统计案例 第二节 变量间的相关关系与统计案例课件PPT: 这是一份备战2024高考一轮复习数学(理) 第十章 统计与统计案例 第二节 变量间的相关关系与统计案例课件PPT,共55页。PPT课件主要包含了函数关系,相关关系,非确定性,正相关,负相关,线性相关,回归直线,最小二乘法,答案C,答案A等内容,欢迎下载使用。
高考数学(文数)一轮复习课件 第十章 算法初步、统计、统计案例 第四节 变量间的相关关系 统计案例(含详解): 这是一份高考数学(文数)一轮复习课件 第十章 算法初步、统计、统计案例 第四节 变量间的相关关系 统计案例(含详解),共30页。
高考数学(理数)一轮复习课件:第十章 统计与统计案例 第二节 统计案例 (含详解): 这是一份高考数学(理数)一轮复习课件:第十章 统计与统计案例 第二节 统计案例 (含详解),共51页。