题型04 统计与概率解答题(独立性检验、分布列、回归方程及决策方案设计)-高考数学必考重点题型技法突破
展开统计案例
目录
一、独立性检验 1
二、三种分布的应用 6
12
三、回归方程及应用 12
四、决策问题与最优化问题 23
25
一、独立性检验
独立性检验的一般步骤
①根据样本数据制成2×2列联表;
②根据公式K2=计算K2的值;
③查表比较K2与临界值的大小关系,作出统计判断.
1、某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:K2=.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【解】 (1)由调查数据知,男顾客中对该商场服务满意的比率为=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.
女顾客中对该商场服务满意的比率为=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.
(2)K2=≈4.762.
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
2、某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名。现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表。
分数段
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100)
男
3
9
18
15
6
9
女
6
4
5
10
13
2
(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;
(2)规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”。
优分
非优分
总计
男生
女生
总计
100
附表及公式
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
K2=
【解析】 (1)男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,
女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,
从男、女生各自的平均分来看,并不能判断数学成绩与性别有关。
(2)由频数分布表可知:在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:
优分
非优分
总计
男生
15
45
60
女生
15
25
40
总计
30
70
100
可得K2=≈1.79,
因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”。
3、为了解某校学生参加社区服务的情况,采用按性别分层抽样的方法进行调查,已知该校共有学生960人,其中男生560人,从全校学生中抽取了容量为n的样本,得到一周参加社区服务时间的统计数据如下表:
超过1小时
不超过1小时
男
20
8
女
12
m
(1)求m,n的值;
(2)能否有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关?
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
K2=
解:(1)由已知,该校有女生400人,故=,得m=8,
从而n=20+8+12+8=48.
(2)作出2×2列联表如下:
超过1小时的人数
不超过1小时的人数
总计
男
20
8
28
女
12
8
20
合计
32
16
48
K2==≈0.685 7<3.841.
所以没有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关.
4、读书可以使人保持思想活力,让人得到智慧启发,让人滋养浩然正气书籍是文化的重要载体,读书是承继文化的重要方式某地区为了解学生课余时间的读书情况,随机抽取了名学生进行调查,根据调查得到的学生日均课余读书时间绘制成如图所示的频率分布直方图,将日均课余读书时间不低于分钟的学生称为“读书之星”,日均课余读书时间低于分钟的学生称为“非读书之星”:已知抽取的样本中日均课余读书时间低于分钟的有人
(1)求的值;
(2)根据已知条件完成下面的列联表,并判断是否有以上的把握认为“读书之星”与性别有关?
非读书之星
读书之星
总计
男
女
总计
(3)将上述调查所得到的频率视为概率,现从该地区大量学生中,随机抽取名学生,每次抽取名,已知每个人是否被抽到互不影响,记被抽取的“读书之星”人数为随机变量,求的分布列和期望
附:,其中.
【解析】(1)
解得:,
所以.
(2)因为,所以“读书之星”有
从而列联表如下图所示:
非读书之星
读书之星
总计
男
女
总计
将列联表中的数据代入公式计算得
因为,所以没有以上的把握认为“读书之星”与性别有关
(3)将频率视为概率,即从该地区学生中抽取一名学生是“读书之星”的概率为.
由题意可知
所以
,
所以的分布列为
故.
二、三种分布的应用
求分布列的一般步骤
①先判断随机变量的取值范围,再判断服从哪种分布
②利用二项分布和超几何分布的公式求对应随机变量的概率
③列出分布列,根据题目要求列出数学期望和方差
1、将一个半径适当的小球放入如图所示的容器最上方的入口处,小球自由下落,在下落的过程中,小球将遇到黑色障碍物3次,最后落入A袋或B袋中,已知小球每次遇到障碍物时,向左、右两边下落的概率分别是,.
(1)分别求出小球落入A袋和B袋中的概率;
(2)在容器的入口处依次放入4个小球,记ξ为落入B袋中的小球的个数,求ξ的分布列、均值和方差.
解 (1)设M=“小球落入A袋”,N=“小球落入B袋”,
则P(M)=××+××=,
所以P(N)=1-P(M)=1-=.
(2)易知ξ~B,
则ξ的分布列为
P(ξ=k)=Ck4-k(k=0,1,2,3,4),
E(ξ)=4×=,
D(ξ)=4××=.
2、某大学志愿者协会有10名同学,成员构成如表所示.表中部分数据不清楚,只知道从这10名同学中随机抽取1名同学,该名同学的专业为数学的概率为.
专业
性别
中文
英语
数学
体育
男
n
1
m
1
女
1
1
1
1
现从这10名同学中随机选取3名同学参加社会公益活动(每名同学被选到的可能性相同).
(1)求m,n的值;
(2)求选出的3名同学恰为专业互不相同的男生的概率;
(3)设ξ为选出的3名同学中是女生或专业为数学的人数,求随机变量ξ的分布列、均值及方差.
解 (1)设事件A为“从10名同学中随机抽取1名同学,该名同学的专业为数学”,
由题意,可知数学专业的同学共有(1+m)名,
则P(A)==,解得m=3.
因为m+n+6=10,所以n=1.
(2)设事件B为“选出的3名同学恰为专业互不相同的男生”,则P(B)==.
(3)由题意,可知这10名同学中是女生或专业为数学的人数为7,ξ的可能取值为0,1,2,3.
P(ξ=0)==,
P(ξ=1)===,
P(ξ=2)===,
P(ξ=3)===.
所以ξ的分布列为
ξ
0
1
2
3
P
均值E(ξ)=0×+1×+2×+3×=.
方差D(ξ)=2×+2×+2×+2×=.
3、为了了解校园噪音情况,学校环保协会对校园环境噪音值(单位:分贝)进行了50天的监测,得到如下统计表:
环境噪音值
(单位:分贝)
[55,57]
(57,59]
(59,61]
(61,63]
(63,65]
(65,67]
频数
1
4
12
20
8
5
(1)根据该统计表,求这50天校园噪音值的样本平均数(同一组的数据用该组的组中值作代表);
(2)若环境噪音值超过65分贝,视为重度噪音污染,环境噪音值不超过59分贝,视为轻度噪音污染,把由上述统计表算得的频率视作概率,回答下列问题:
①求周一到周五的5天中恰有两天校园出现重度噪音污染而其余3天都是轻度噪音污染的概率;
②学校要举行为期3天的“汉字听写大赛”校园选拔赛,把这3天校园出现的重度噪音污染天数记为X,求X的分布列和方差D(X).
解 (1)由数据可知样本平均数为
=61.8(分贝).
(2)①由题意,知出现重度噪音污染的概率为,
出现轻度噪音污染的概率为,
设事件A为“周一至周五的5天中恰有两天校园出现重度噪音污染而其余3天都是轻度噪音污染”,
则P(A)=C23=.
②由题意,得X~B,
则随机变量X的分布列为
P(X=k)=Ck3-k,k=0,1,2,3.
所以D(X)=np(1-p)=0.27.
4、某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40件产品作为样本称出它们的质量(单位:克),质量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图如图.
(1)根据频率分布直方图,求质量超过505克的产品数量;
(2)在上述抽取的40件产品中任取2件,设X为质量超过505克的产品数量,求X的分布列,并求其均值;
(3)从该流水线上任取2件产品,设Y为质量超过505克的产品数量,求Y的分布列.
解 (1)质量超过505克的产品的频率为
5×0.05+5×0.01=0.3,
所以质量超过505克的产品数量为40×0.3=12(件).
(2)质量超过505克的产品数量为12件,则质量未超过505克的产品数量为28件,X的可能取值为0,1,2,X服从超几何分布.
P(X=0)==,
P(X=1)==,
P(X=2)==,
∴X的分布列为
X
0
1
2
P
∴X的均值为E(X)=0×+1×+2×=.
(3)根据样本估计总体的思想,取一件产品,该产品的质量超过505克的概率为=.
从流水线上任取2件产品互不影响,该问题可看成2重伯努利试验,质量超过505克的件数Y的可能取值为0,1,2,且Y~B,
P(Y=k)=C×k×2-k,k=0,1,2,
∴P(Y=0)=C×2=,
P(Y=1)=C××=,
P(Y=2)=C×2=.
∴Y的分布列为
Y
0
1
2
P
5、为检测某种抗病毒疫苗的免疫效果,某药物研究所科研人员随机选取200只小白鼠,并将该疫苗首次注射到这些小白鼠体内.独立环境下试验一段时间后检测这些小白鼠的某项医学指标值并制成如图的频率分布直方图(以小白鼠医学指标值在各个区间上的频率代替其概率):
(1)根据频率分布直方图,估计200只小白鼠该项医学指标平均值(同一组数据用该组数据区间的中点值表示);
(2)若认为小白鼠的该项医学指标值X服从正态分布N(μ,σ2),且首次注射疫苗的小白鼠该项医学指标值不低于14.77时,则认定其体内已经产生抗体;进一步研究还发现,对第一次注射疫苗的200只小白鼠中没有产生抗体的那一部分群体进行第二次注射疫苗,约有16只小白鼠又产生了抗体.这里μ近似为小白鼠医学指标平均值,σ2近似为样本方差s2.经计算得s2=6.92,假设两次注射疫苗相互独立,求一只小白鼠注射疫苗后产生抗体的概率p(精确到0.01).
附:参考数据与公式≈2.63,若X~N(μ,σ2),则
①P(μ﹣σ<X≤μ+σ)=0.6827;
②P(μ﹣2σ<X≤μ+2σ)=0.9545;
③P(μ﹣3σ<X≤μ+3σ)=0.9973.
【解答】解:(1)由频率分布直方图可得:
X
12
14
16
18
20
22
24
p
0.04
0.12
0.28
0.36
0.10
0.06
0.04
则;
(2)∵μ﹣σ=17.40﹣2.63=14.77,
∴,
记事件A表示首先注射疫苗后产生抗体,则p(A)=0.8414,可得,
因此200只小白鼠首先注射疫苗后有200×0.8414≈168只产生抗体,有200﹣168=32只没有产生抗体.
故注射疫苗后产生抗体的概率.
6、学校准备筹建数学建模学习中心,为了了解学生数学建模(应用)能力,专门对高二报名的100名学生进行了数学建模闭卷测试,得分在45~95之间,分为[45,55),[55,65),[65,75),[75,85),
[85,95]五组,得到如图所示的频率分布直方图,其中第三组的频数为40.
(1)请根据频率分布直方图估计样本的平均数和方差s2(同一组中的数据用该组区间的中点值代表);
(2)根据样本数据,可认为参与建模测试的学生分数X近似服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①求P(47.2<X<79.9);
②学校为鼓励学生积极参与数学建模活动,决定对本次测试中90.8分以上的同学进行表彰.若某班正好有6人参与了这次测试,求这个班至少有1人获得表彰的概率.
参考数据:若X~N(μ,σ2),则P(μ﹣σ<X<μ+σ)=0.6826,P(μ﹣2σ<X<μ+2σ)=0.9544,
≈10.9,0.95446≈0.76,0.97725≈0.89,0.97726≈0.87.
解:(1)由频率分布直方图可知组距=l0,第三组频数为40,总共有100人,
则第三组频率=0.4,根据频率之和为1,可知第4组的频率为1﹣0.1﹣0.25﹣0.4﹣0.1=0.15,
所以,
s2=(50﹣69)2×0.1+(60﹣69)2×0.25+(70﹣69)2×0.4+(80﹣69)2×0.15+(90﹣69)2×0.1=192×0.1+92×0.25+12×0.4+112×0.15+212×0.1=119;
(2)(i)∵,
∴,
==0.8185;
(ii)记“6人中至少1人获得表彰”为事件A,
则=0.0228,
所以P(A)=1﹣P(A)=1﹣(1﹣0.0228)6=1﹣0.97726=1﹣0.87=0.13.
三、回归方程及应用
回归方程求解一般步骤
相关系数r的判定:,r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.
1、在2018年俄罗斯世界杯期间,莫斯科的部分餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:
等级代码数值x
38
48
58
68
78
88
销售单价y/元
16.8
18.8
20.8
22.8
24
25.8
(1)已知销售单价y与等级代码数值x之间存在线性相关关系,求y关于x的线性回归方程(系数精确到0.1);
(2)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?
参考公式:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为=,=-. 参考数据:xiyi=8 440,x=25 564.
解:(1)由题意,得==63,
==21.5,
==≈0.2,
=-=21.5-0.2×63=8.9.
故所求线性回归方程为=0.2x+8.9.
(2)由(1),知当x=98时,y=0.2×98+8.9=28.5.
所以估计该等级的中国小龙虾销售单价为28.5元.
2、近年来,国资委.党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
10
13
25
24
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:
愿意参与管理
不愿意参与管理
男性村民
150
50
女性村民
50
(1)求出相关系数的大小,并判断管理时间与土地使用面积是否线性相关?
(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?
(3)若以该村的村民的性别与参与管理意愿的情况估计贫困县的情况,则从该贫困县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的分布列及数学期望.
参考公式:
其中.临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
参考数据:
【答案】(1)线性相关;(2)有;(3)详见解析.
【解析】
(1)依题意:
故
则,
故管理时间与土地使用面积线性相关.
(2)依题意,完善表格如下:
愿意参与管理
不愿意参与管理
总计
男性村民
150
50
200
女性村民
50
50
100
总计
200
100
300
计算得的观测值为
故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性.
(3)依题意,的可能取值为0,1,2,3,从该贫困县中随机抽取一名,则取到不愿意参与管理的男性村民的概率为,
故
故的分布列为
X
0
1
2
3
P
则数学期望为
(或由,得
3、班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.
(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)
(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表:
学生序号
1
2
3
4
5
6
7
数学成绩
60
65
70
75
85
87
90
物理成绩
70
77
80
85
90
86
93
①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为,求的分布列和数学期望;
②根据上表数据,求物理成绩关于数学成绩的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分?
附:线性回归方程,
其中,.
76
83
812
526
【答案】(1)不同的样本的个数为.
(2)①分布列见解析,.
②线性回归方程为.可预测该同学的物理成绩为96分.
【解析】
(1)依据分层抽样的方法,24名女同学中应抽取的人数为名,
18名男同学中应抽取的人数为名,
故不同的样本的个数为.
(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名,
∴的取值为0,1,2,3.
∴,,
,.
∴的分布列为
0
1
2
3
∴.
②∵,.
∴线性回归方程为.
当时,.
可预测该同学的物理成绩为96分.
4、某公司为了了解年研发资金投人量(单位:亿元)对年销售额(单位:亿元)的影响.对公司近年的年研发资金投入量和年销售额的数据,进行了对比分析,建立了两个函数模型:①,②,其中、、、均为常数,为自然对数的底数.并得到一些统计量的值.令,,经计算得如下数据:
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(ⅰ)根据(1)的选择及表中数据,建立关于的回归方程;
(ⅱ)若下一年销售额需达到亿元,预测下一年的研发资金投入量是多少亿元?
附:①相关系数,
回归直线中公式分别为:,;
②参考数据:,,.
【答案】(1)模型的拟合程度更好;(2)(ⅰ);(ⅱ)亿元.
【解析】
(1)设和的相关系数为,和的相关系数为,由题意,
,
,
则,因此从相关系数的角度,模型的拟合程度更好;
(2)(ⅰ)先建立关于的线性回归方程,
由,得,即;
由于,,
所以关于的线性回归方程为,
所以,则;
(ⅱ)下一年销售额需达到亿元,即,代入,得,
又,所以,所以,
所以预测下一年的研发资金投入量约是亿元.
某芯片公司为制定下一年的研发投入计划,需了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响.该公司对历史数据进行对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.
现该公司收集了近12年的年研发资金投入量xi和年销售额yi的数据,i=1,2,⋯,12,并对这些数据作了初步处理,得到了右侧的散点图及一些统计量的值.令ui=xi2,vi=lnyi(i=1,2,⋯,12),经计算得如下数据:
x
y
i=112(xi−x)2
i=112(yi−y)2
u
v
20
66
770
200
460
4.20
i=112(ui−u)2
i=112(ui−u)(yi−y)
i=112(vi−v)2
i=112(xi−x)(vi−v)
3125000
21500
0.308
14
(1)设ui和yi的相关系数为r1,xi和vi的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型;
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ii)若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元?
附:①相关系数r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2,回归直线y=a+bx中斜率和截距的最小二乘估计公式分别为:b=i=1n(xi−x)(yi−y)i=1n(xi−x)2,a=y−bx;
② 参考数据:308=4×77,90≈9.4868,e4.4998≈90.
【答案】(1)模型y=eλx+t的拟合程度更好;(2)(i)v=0.02x+3.84;(ii)32.99亿元.
【解析】
(1)r1=i=112(ui−u)(yi−y)i=112(ui−u)2i=112(yi−y)2=215003125000×200=2150025000=4350=0.86,
r2=i=112(xi−x)(vi−v)i=112(xi−x)2i=112(vi−v)2=14770×0.308=1477×0.2=1011≈0.91,
则r1
由y=eλx+t,得lny=t+λx,即v=t+λx.
由于λ=i=112(xi−x)(vi−v)i=112(xi−x)2=14770≈0.018,
t=v−λx=4.20−0.018×20=3.84,
所以U额R0关于x的线性回归方程为v=0.02x+3.84,
所以lny=0.02x+3.84,则y=e0.02x+3.84.
(ii)下一年销售额y需达到90亿元,即y=90,
代入y=e0.02x+3.84得,90=e0.02x+3.84,
又e4.4998≈90,所以4.4998≈0.02x+3.84,
所以x≈4.4998−3.840.02=32.99,
所以预测下一年的研发资金投入量约是32.99亿元
6、某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
月份
1
2
3
4
5
6
广告投入量/万元
2
4
6
8
10
12
收益/万元
14.21
20.31
31.8
31.18
37.83
44.67
他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
xiyi
x
7
30
1 464.24
364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
①剔除异常数据后,求出(1)中所选模型的回归方程;
②广告投入量x=18时,(1)中所选模型收益的预报值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为:==,=-.
解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.
(2)①剔除异常数据,即3月份的数据后,得
=×(7×6-6)=7.2,
=×(30×6-31.8)=29.64.
xiyi=1 464.24-6×31.8=1 273.44,
x=364-62=328.
====3,
=-=29.64-3×7.2=8.04.
所以y关于x的回归方程为=3x+8.04.
②把x=18代入①中所求回归方程得=3×18+8.04=62.04.
故预报值为62.04万元.
7、噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D(单位:分贝)与声音能量I(单位:W/cm2)之间的关系,对测量得到的声音强度Di和声音能量Ii(i=1,2…,10)数据作了初步处理,得到如下散点图及一些统计量的值.
1 (Ii-)
(Wi-)2
(Ii-I)(Di-)
(Wi-)(Di-)
1.04×10-11
45.7
-11.5
1.56×10-21
0.51
6.88×10-11
5.1
表中Wi=lg Ii,=Wi,
(1)根据散点图判断,D=a1+b1I与D=a2+b2lg I哪一个适宜作为声音强度D关于声音能量I的回归方程类型?(给出判断即可,不必说明理由)
(2)根据表中数据,求声音强度D关于声音能量I的回归方程;
(3)当声音强度大于60分贝时属于噪音,会产生噪音污染,城市中某点P共受到两个声源的影响,这两个声源的声音能量分别是I1和I2,且+=1010.
已知点P的声音能量等于声音能量I1与I2之和,请根据(1)中的回归方程,判断点P是否受到污染的干扰,并说明理由.
附:对于一组数据(μ1,v1),(μ2,v2),…,(μ1n,vn),其回归直线=+μ的斜率和截距的最小二乘估计分别为=,=-.
解:(1)根据散点图判断,模型D=a2+b2lg I更适合.
(2)令Wi=lg Ii,先建立D关于W的线性回归方程,
由于===10,
所以=-=160.7,
所以D关于W的线性回归方程是=10W+160.7,
即D关于I的回归方程是=10lg I+160.7.
(3)点P的声音能量为I=I1+I2,
因为+=1010,
所以I=I1+I2=10-10(I1+I2)=10-10≥9×10-10,
当且仅当=时等号成立.
根据(1)中的回归方程知,点P的声音强度D的预报值为min=10lg(9×10-10)+160.7=10lg 9+60.7>60,
所以点P会受到噪声污染的干扰.
四、决策问题与最优化问题
1、某销售公司在当地、两家超市各有一个销售点,每日从同一家食品厂一次性购进一种食品,每件200元,统一零售价每件300元,两家超市之间调配食品不计费用,若进货不足食品厂以每件250元补货,若销售有剩余食品厂以每件150回收.现需决策每日购进食品数量,为此搜集并整理了、两家超市往年同期各50天的该食品销售记录,得到如下数据:
销售件数
8
9
10
11
频数
20
40
20
20
以这些数据的频数代替两家超市的食品销售件数的概率,记表示这两家超市每日共销售食品件数,表示销售公司每日共需购进食品的件数.
(1)求的分布列;
(2)以销售食品利润的期望为决策依据,在与之中选其一,应选哪个?
【答案】(1)见解析;(2) .
【解析】
(1)由已知一家超市销售食品件数8,9,10,11的概率分别为 .
取值为16,17,18,19,20,21.
,;
; ;
;
所以的分布列为
16
17
18
19
20
21
22
(2) 当时,记为销售该食品利润,则的分布列为
1450
1600
1750
1900
1950
2000
2050
当时,记为销售该食品利润,则的分布列为
1400
1550
1700
1850
2000
2050
2100
因为 ,故应选.
2、某健身馆在2019年7、8两月推出优惠项目吸引了一批客户.为预估2020年7、8两月客户投入的健身消费金额,健身馆随机抽样统计了2019年7、8两月100名客户的消费金额,分组如下:(单位:元),得到如图所示的频率分布直方图:
(1)若把2019年7、8两月健身消费金额不低于800元的客户,称为“健身达人”,经数据 处理,现在列联表中得到一定的相关数据,请补全空格处的数据,并根据列联表判断是否有的把握认为“健身达人”与性别有关?
健身达人
非健身达人
总计
男
10
女
30
总计
(2)为吸引顾客,在健身项目之外,该健身馆特别推出健身配套营养品的销售,现有两种促销方案.
方案一:每满800元可立减100元;
方案二:金额超过800元可抽奖三次,每次中奖的概率为,且每次抽奖互不影响,中奖1次打9折,中奖2次打8折,中奖3次打7折.
若某人打算购买1000元的营养品,请从实际付款金额的数学期望的角度分析应该选择哪种优惠方案.
(3)在(2)中的方案二中,金额超过800元可抽奖三次,假设三次中奖结果互不影响,且三次中奖的概率为,记为锐角的内角,
求证:
附:
【答案】(1)列联表见解析,有的把握认为“健身达人”与性别有关系;
(2)所以选择方案二更划算;
(3)见解析.
【解析】
(1)列联表如下:
健身达人
非健身达人
总计
男
10
40
50
女
20
30
50
总计
30
70
100
因为,
因此有的把握认为“健身达人”与性别有关系;
(2)若选择方案一:则需付款900元;
若选择方案二:设付款元,则可能取值为700,800,900,1000.
,
,
,
,
所以(元),
因为,所以选择方案二更划算;
(3)∵是锐角三角形,
∴,则三次抽奖机会中,该顾客至少中一次的概率为:
由概率的定义可知:,故有:
.
3、某单位准备购买三台设备,型号分别为已知这三台设备均使用同一种易耗品,提供设备的商家规定:可以在购买设备的同时购买该易耗品,每件易耗品的价格为100元,也可以在设备使用过程中,随时单独购买易耗品,每件易耗品的价格为200元.为了决策在购买设备时应购买的易耗品的件数.该单位调查了这三种型号的设备各60台,调査每台设备在一个月中使用的易耗品的件数,并得到统计表如下所示.
每台设备一个月中使用的易耗品的件数
6
7
8
型号A
30
30
0
频数
型号B
20
30
10
型号C
0
45
15
将调查的每种型号的设备的频率视为概率,各台设备在易耗品的使用上相互独立.
(1)求该单位一个月中三台设备使用的易耗品总数超过21件的概率;
(2)以该单位一个月购买易耗品所需总费用的期望值为决策依据,该单位在购买设备时应同时购买20件还是21件易耗品?
【答案】(1)(2)应该购买21件易耗品
【解析】
(1)由题中的表格可知
A型号的设备一个月使用易耗品的件数为6和7的频率均为;
B型号的设备一个月使用易耗品的件数为6,7,8的频率分别为;
C型号的设备一个月使用易耗品的件数为7和8的频率分别为;
设该单位一个月中三台设备使用易耗品的件数分别为,则
,,,
设该单位三台设备一个月中使用易耗品的件数总数为X,
则
而
,
,
故,
即该单位一个月中三台设备使用的易耗品总数超过21件的概率为.
(2)以题意知,X所有可能的取值为
;
;
;
由(1)知,,
若该单位在购买设备的同时购买了20件易耗品,设该单位一个月中购买易耗品所需的总费用为元,则的所有可能取值为,
;
;
;
;
;
若该单位在肋买设备的同时购买了21件易耗品,设该单位一个月中购买易耗品所需的总费用为元,则的所有可能取值为,
;
;
;
;
,所以该单位在购买设备时应该购买21件易耗品
4、2017年11月河南省三门峡市成功入围“十佳魅力中国城市”,吸引了大批投资商的目光,一些投资商积极准备投入到“魅力城市”的建设之中.某投资公司准备在2018年年初将四百万元投资到三门峡下列两个项目中的一个之中.
项目一:天坑院是黄土高原地域独具特色的民居形式,是人类“穴居”发展史演变的实物见证.现准备投资建设20个天坑院,每个天坑院投资0.2百万元,假设每个天坑院是否盈利是相互独立的,据市场调研,到2020年底每个天坑院盈利的概率为,若盈利则盈利投资额的40%,否则盈利额为0.
项目二:天鹅湖国家湿地公园是一处融生态、文化和人文地理于一体的自然山水景区.据市场调研,投资到该项目上,到2020年底可能盈利投资额的50%,也可能亏损投资额的30%,且这两种情况发生的概率分别为p和.
(1)若投资项目一,记为盈利的天坑院的个数,求(用p表示);
(2)若投资项目二,记投资项目二的盈利为百万元,求(用p表示);
(3)在(1)(2)两个条件下,针对以上两个投资项目,请你为投资公司选择一个项目,并说明理由.
【答案】(1) (2) (3)见解析
【解析】
(1)解:由题意
则盈利的天坑院数的均值.
(2)若投资项目二,则的分布列为
2
-1.2
盈利的均值.
(3)若盈利,则每个天坑院盈利(百万元),
所以投资建设20个天坑院,盈利的均值为
(百万元).
①当时,,
解得.
.故选择项目一.
②当时,,
解得.
此时选择项一.
③当时,,解得.
此时选择项二.
5、某公司准备投产一种新产品,经测算,已知每年生产万件的该种产品所需要的总成本(万元),依据产品尺寸,产品的品质可能出现优、中、差三种情况,随机抽取了1000件产品测量尺寸,尺寸分别在,,,,,,(单位:)中,经统计得到的频率分布直方图如图所示.
产品的品质情况和相应的价格(元/件)与年产量之间的函数关系如下表所示.
产品品质
立品尺寸的范围
价格与产量的函数关系式
优
中
差
以频率作为概率解决如下问题:
(1)求实数的值;
(2)当产量确定时,设不同品质的产品价格为随机变量,求随机变量的分布列;
(3)估计当年产量为何值时,该公司年利润最大,并求出最大值.
【答案】(1);(2)见解析(3)年产量时,该公司年利润取得最大值,最大利润为138万.
【解析】
(1)由题意得,解得;
(2)当产品品质为优时频率为,此时价格为;
当产品品质为中时频率为,此时价格为;
当产品品质为差时频率为,此时价格为;
以频率作为概率,可得随机变量的分布列为:
0.5
0.2
0.3
(3)设公司年利润为,则
整理得,
显然当时,,时,,
∴当年产量时,取得最大值.
估计当年产量时,该公司年利润取得最大值,最大利润为138万.
6、某企业拥有3条相同的生产线,每条生产线每月至多出现一次故障.各条生产线是否出现故障相互独立,且出现故障的概率为.
(1)求该企业每月有且只有1条生产线出现故障的概率;
(2)为提高生产效益,该企业决定招聘名维修工人及时对出现故障的生产线进行维修.已知每名维修工人每月只有及时维修1条生产线的能力,且每月固定工资为1万元.此外,统计表明,每月在不出故障的情况下,每条生产线创造12万元的利润;如果出现故障能及时维修,每条生产线创造8万元的利润;如果出现故障不能及时维修,该生产线将不创造利润,以该企业每月实际获利的期望值为决策依据,在与之中选其一,应选用哪个?(实际获利=生产线创造利润-维修工人工资)
【答案】(1) (2)应选用
【解析】
(1)设3条生产线中出现故障的条数为,则,
因此
(2)①当时,设该企业每月的实际获利为万元,
若,则;
若,则;
若,则;
若,则;
又,,
,
此时,实际获利的均值
②当时,设该企业每月的实际获利为万元,
若,则;
若,则;
若,则;
若,则;
因为,
于是以该企业每月实际获利的期望值为决策依据,在与之中选其一,应选用
7、以下是新兵训练时,某炮兵连8周中炮弹对同一目标的命中情况的柱状图:
(1)计算该炮兵连这8周中总的命中频率p0,并确定第几周的命中频率最高;
(2)以(1)中的p0作为该炮兵连甲炮兵对同一目标的命中率,若每次发射相互独立,且炮兵甲发射5次,记命中的次数为X,求X的方差;
(3)以(1)中的p0作为该炮兵连炮兵对同一目标的命中率,试问至少要用多少枚这样的炮弹同时对该目标发射一次,才能使目标被击中的概率超过0.99.
(取lg 0.4=-0.398)
解:(1)这8周总命中炮数为40+45+46+49+47+49+53+52=381,总未命中炮数为32+34+30+32+35+33+30+28=254,所以p0==0.6.
因为>,所以根据表中数据易知第8周的命中频率最高.
(2)由题意可知X~B(5,0.6),
则D(X)=5×0.6×(1-0.6)=1.2.
(3)由1-(1-p0)n>0.99,
即1-0.4n>0.99,得0.4n<0.01,
所以n>log0.4 0.01==-=≈5.025,
故至少要用6枚这样的炮弹同时对该目标发射一次,才能使目标被击中的概率超过0.99.
备战2024年高考数学重难点题型突破讲义 重难点专题45 离散型随机变量及其分布列十四大题型汇总-【划重点】(新高考通用): 这是一份备战2024年高考数学重难点题型突破讲义 重难点专题45 离散型随机变量及其分布列十四大题型汇总-【划重点】(新高考通用),文件包含重难点专题45离散型随机变量及其分布列十四大题型汇总原卷版docx、重难点专题45离散型随机变量及其分布列十四大题型汇总解析版docx等2份试卷配套教学资源,其中试卷共203页, 欢迎下载使用。
专题6 概率-高一数学下学期期末必考重点题型技法突破(人教版201必修第二册): 这是一份专题6 概率-高一数学下学期期末必考重点题型技法突破(人教版201必修第二册),文件包含专题6概率-高一数学下学期期末必考重点题型技法突破人教版201必修第二册解析版docx、专题6概率-高一数学下学期期末必考重点题型技法突破人教版201必修第二册原卷版docx等2份试卷配套教学资源,其中试卷共27页, 欢迎下载使用。
题型06 函数与导数题型(不等式证明与恒成立问题、极值点偏移与零点问题)-高考数学必考重点题型技法突破: 这是一份题型06 函数与导数题型(不等式证明与恒成立问题、极值点偏移与零点问题)-高考数学必考重点题型技法突破,文件包含题型06函数与导数题型不等式证明与恒成立问题极值点偏移与零点问题解析版docx、题型06函数与导数题型不等式证明与恒成立问题极值点偏移与零点问题原卷版docx等2份试卷配套教学资源,其中试卷共48页, 欢迎下载使用。