2026全国版高考数学一轮基础知识练--11.2 成对数据的统计分析(含解析)

2026全国版高考数学一轮基础知识练--11.2 成对数据的统计分析(含解析)


2026全国版高考数学一轮
11.2 成对数据的统计分析
五年高考
考点1 变量间的相关关系
1.(2023天津,7,5分,易)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).
计算得样本相关系数为0.864 2,利用最小二乘法求得相应的经验回归方程为=
0.750 1x+0.610 5.根据以上信息,如下判断正确的为 (  )
A.花萼长度与花瓣长度不存在相关关系
B.花萼长度与花瓣长度负相关
C.花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值约为5.861 2 cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.864 2
2.(2024天津,3,5分,易)下列散点图中,样本相关性系数最大的是 (  )
    
    
3.(2020课标Ⅰ,文5,理5,5分,易)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是 (  )
A.y=a+bx    B.y=a+bx2
C.y=a+bex    D.y=a+bln x
4.(2022全国乙理,19,12分,中)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6
根部横截面积xi 材积量yi 0.04 0.25 0.06 0.40 0.04 0.22 0.08 0.54 0.08 0.51 0.05 0.34
样本号i 7 8 9 10 总和
根部横截面积xi 材积量yi 0.05 0.36 0.07 0.46 0.07 0.42 0.06 0.40 0.6 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数=,≈1.377.
5.(2020课标Ⅱ理,18,12分,中)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数=,≈1.414.
考点2 独立性检验
1.(2024全国甲理,17,12分,易)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异 能否有99%的把握认为甲、乙两车间产品的优级品率存在差异
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率,如果,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了 (≈12.247)
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
2.(2020新高考Ⅰ,19,12分,中)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
   SO2 PM2.5   
[0,50] (50,150] (150,475]
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
  SO2 PM2.5  
[0,150] (150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
三年模拟
基础强化练
1.(2025届福建龙岩一中开学考,1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为 (  )
A.-1    B.0    C.    D.1
2.(2024湖南名校联合体第三次联考,3)某校数学兴趣小组在某座山测得海拔高度x(单位:千米)与气压y(单位:千帕)的六组数据(xi,yi)(i=1,2,…,6),并将其绘制成如下散点图,分析研究发现B点相关数据不符合实际,删除B点后重新进行回归分析,则下列说法正确的是(  )
A.删除点B后,样本数据的两变量x,y正相关
B.删除点B后,相关系数r的绝对值更接近于1
C.删除点B后,新样本的残差平方和变大
D.删除点B后,解释变量x与响应变量y相关性变弱
3.(多选)(2025届湖北武汉调研,9)某科技公司统计了一款App最近5个月的下载量如表所示,若y与x线性相关,且经验回归方程为=-0.6x+,则
月份编号x 1 2 3 4 5
下载量y/万次 5 4.5 4 3.5 2.5
A.y与x负相关
B.=5.6
C.预测第6个月的下载量是2.1万次
D.残差绝对值的最大值为0.2
4.(2024安徽六安一中月考,15)某学校有A,B两家餐厅,A餐厅有2种套餐选择,B餐厅有4种套餐选择,且这6种套餐各不相同.A餐厅距离教学楼相比于B餐厅要近很多,经调查发现,100名不同性别的学生选择餐厅用餐的情况如表:
男 女
在A餐厅用餐 40 20
在B餐厅用餐 15 25
(1)求某天甲、乙两名同学选择同一套餐用餐的概率;
(2)依据α=0.005的独立性检验,能否认为性别与选择餐厅之间有关联
附:χ2=.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
5.(2024江西吉安六校协作体联考,16)2023年10月国家发展改革委等部门联合印发了《加快“以竹代塑”发展三年行动计划》,该计划将推动“以竹代塑”高质量发展,助力减少塑料污染,并将带动竹产业新一轮的增长.下表为2019年—2023年中国竹产业产值规模y(单位:千亿元),其中2019年—2023年的年份代码x依次为1~5.
x 1 2 3 4 5
y 2.89 3.22 3.82 4.34 5.41
(1)记第i+1年与i年(i=1,2,3,4)中国竹产业产值规模y差值的2倍的整数部分分别为ni,从n1,n2,n3,n4中任取2个数相乘,记乘积为X,求X的分布列与期望;
(2)根据以上数据及相关系数,判断能否用线性回归模型拟合中国竹产业产值规模y与年份x之间的关系.
参考数据:yi=19.68,xiyi=65.20,≈1.99,≈3.16.
相关系数r=.若|r|≥0.75,则认为y与x有较强的相关性.
能力拔高练
1.(2024湖南邵阳二中模拟,6)某学习小组对一组数据(xi,yi)(i=1,2,3,…,7)进行回归分析,甲同学首先求出经验回归方程为=5x+4,样本点的中心为(2,m).乙同学对甲的计算过程进行检查,发现甲将数据(2,3)误输成(3,2),将这两个数据修正后得到经验回归方程为=kx+7,则实数k= (  )
A.
2.(多选)(2025届广东广州摸底,9)中欧班列是推进“一带一路”沿线国家道路联通、贸易畅通的重要举措.在中欧班列带动下,某外贸企业出口额逐年提升,以下为该企业近6个月的出口额情况统计,若已求得y关于x的经验回归方程为=28x+,则 (  )
月份编号x 1 2 3 4 5 6
出口额y/万元 16 25 43 77 102 159
A.y与x成正相关
B.样本数据y的第40百分位数为34
C.当x=3时,残差的绝对值最小
D.用模型y=enx+m描述y与x的关系更合适
3.(2024湖北荆州适应性考试,13)某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得=8,=5,x+7.4,则k的值为    ;为判断拟合效果,通过经验回归方程求得预测值(i=1,2,…,8),若残差平方和(yi-)2≈0.28,则决定系数R2≈    .
4.(2025届四川成都简阳实验学校月考,17)随着移动互联网技术的发展,直播带货已经成为热门的销售方式.通过主播的详细介绍,顾客对商品有更全面的了解,小张统计了某新手主播开启直播带货后从1月份到5月份每个月的销售量yi(万件)(i=1,2,3,4,5)的数据,得到如图所示的散点图.
(1)根据散点图判断,模型①y=a+bx与模型②y=c+dx2哪一个更适宜作为月销售量y关于月份代码x的回归方程 (给出判断即可,不必说明理由)并求出y关于x的回归方程(计算结果精确到0.01);
(2)随机调查了220名市民对直播带货的认可程度,得到的部分数据如表:
认可 不认可
50岁以下市民 70 50
50岁及以上市民 40 60
依据小概率值α=0.01的独立性检验,分析市民对直播带货认可程度是否与年龄有关联.
参考公式与数据:,=55,=979,xiyi=80.8,tiyi=335.6,其中ti=, χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
5.(2025届四川成都列五中学入学考,16)为了了解高中学生课后自主学习数学时间(x分钟/天)和他们的数学成绩(y分)的关系,某实验小组做了调查,得到一些数据.
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
(1)求数学成绩y与学习时间x的相关系数(精确到0.001);
(2)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合,并求出y关于x的回归直线方程,并由此预测每天课后自主学习数学时间为100分钟时的数学成绩(参考数据:xiyi=22 820,yi=435,=38 999,107.42≈11 540,xi的方差为200);
(3)基于上述调查,某校提倡学生周末在校自主学习.经过一学期的实施后,抽样调查了220位学生.按照是否参与周末在校自主学习以及成绩是否有进步统计,得到2×2列联表.依据表中数据及小概率值α=0.001的独立性检验,分析“周末在校自主学习”与“成绩进步”是否有关.
没有进步 有进步 合计
参与周末 在校自主学习 35 130 165
未参与周末 在校自主学习 25 30 55
合计 60 160 220
附:方差:s2=(xi-)2.相关系数:r=.
回归方程x+,, χ2=.
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
11.2 成对数据的统计分析
五年高考
考点1 变量间的相关关系
1.(2023天津,7,5分,易)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).
计算得样本相关系数为0.864 2,利用最小二乘法求得相应的经验回归方程为=
0.750 1x+0.610 5.根据以上信息,如下判断正确的为 (  )
A.花萼长度与花瓣长度不存在相关关系
B.花萼长度与花瓣长度负相关
C.花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值约为5.861 2 cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.864 2
答案 C 
2.(2024天津,3,5分,易)下列散点图中,样本相关性系数最大的是 (  )
    
    
答案 A 
3.(2020课标Ⅰ,文5,理5,5分,易)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是 (  )
A.y=a+bx    B.y=a+bx2
C.y=a+bex    D.y=a+bln x
答案 D 
4.(2022全国乙理,19,12分,中)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6
根部横截面积xi 材积量yi 0.04 0.25 0.06 0.40 0.04 0.22 0.08 0.54 0.08 0.51 0.05 0.34
样本号i 7 8 9 10 总和
根部横截面积xi 材积量yi 0.05 0.36 0.07 0.46 0.07 0.42 0.06 0.40 0.6 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数=,≈1.377.
解析 (1)估计该林区这种树木平均一棵的根部横截面积为=0.06(m2),平均一棵的材积量为=0.39(m3).
(2)样本相关系数=
=
=
=≈0.97.
计算相关系数=时,需要将分子、分母稍加变换,采用题设中给出的数据求解
即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.
(3)设这种树木的根部横截总面积为X m2,总材积量为Y m3,则,则Y==1 209,
所以该林区这种树木的总材积量的估计值为1 209 m3.
5.(2020课标Ⅱ理,18,12分,中)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数=,≈1.414.
解析 (1)由已知得样本平均数yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
≈0.94.
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
考点2 独立性检验
1.(2024全国甲理,17,12分,易)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异 能否有99%的把握认为甲、乙两车间产品的优级品率存在差异
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率,如果,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了 (≈12.247)
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
解析 (1)列联表如下:
优级品 非优级品
甲车间 26 24
乙车间 70 30
K2==4.687 5,
∵3.841<4.687 5<6.635,
∴有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题知=0.64,
∵p=0.5,∴p+1.65
=0.5+≈0.567,
∵,∴可以认为生产线智能化升级改造后,该工厂的优级品率提高了.
2.(2020新高考Ⅰ,19,12分,中)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
   SO2 PM2.5   
[0,50] (50,150] (150,475]
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
  SO2 PM2.5  
[0,150] (150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
解析 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为=0.64.
(2)根据抽查数据,可得2×2列联表:
  SO2 PM2.5  
[0,150] (150,475]
[0,75] 64 16
(75,115] 10 10
(3)根据(2)的列联表得
K2=≈7.484.
由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
三年模拟
基础强化练
1.(2025届福建龙岩一中开学考,1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为 (  )
A.-1    B.0    C.    D.1
答案 D 
2.(2024湖南名校联合体第三次联考,3)某校数学兴趣小组在某座山测得海拔高度x(单位:千米)与气压y(单位:千帕)的六组数据(xi,yi)(i=1,2,…,6),并将其绘制成如下散点图,分析研究发现B点相关数据不符合实际,删除B点后重新进行回归分析,则下列说法正确的是(  )
A.删除点B后,样本数据的两变量x,y正相关
B.删除点B后,相关系数r的绝对值更接近于1
C.删除点B后,新样本的残差平方和变大
D.删除点B后,解释变量x与响应变量y相关性变弱
答案 B 
3.(多选)(2025届湖北武汉调研,9)某科技公司统计了一款App最近5个月的下载量如表所示,若y与x线性相关,且经验回归方程为=-0.6x+,则
月份编号x 1 2 3 4 5
下载量y/万次 5 4.5 4 3.5 2.5
A.y与x负相关
B.=5.6
C.预测第6个月的下载量是2.1万次
D.残差绝对值的最大值为0.2
答案 ACD 
4.(2024安徽六安一中月考,15)某学校有A,B两家餐厅,A餐厅有2种套餐选择,B餐厅有4种套餐选择,且这6种套餐各不相同.A餐厅距离教学楼相比于B餐厅要近很多,经调查发现,100名不同性别的学生选择餐厅用餐的情况如表:
男 女
在A餐厅用餐 40 20
在B餐厅用餐 15 25
(1)求某天甲、乙两名同学选择同一套餐用餐的概率;
(2)依据α=0.005的独立性检验,能否认为性别与选择餐厅之间有关联
附:χ2=.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
解析 (1)一共有6种套餐,甲、乙各选择一种,共有62=36种情况,
甲、乙两名同学选择同一种套餐有6种情况,
所以甲、乙两名同学选择同一套餐的概率P=.
(2)零假设为H0:性别与选择餐厅之间没有关联,
χ2=≈8.249>7.879,
根据小概率值α=0.005的独立性检验,推断H0不成立,
所以依据α=0.005的独立性检验,认为性别与选择餐厅之间有关联.此推断犯错误的概率不超过0.005.
5.(2024江西吉安六校协作体联考,16)2023年10月国家发展改革委等部门联合印发了《加快“以竹代塑”发展三年行动计划》,该计划将推动“以竹代塑”高质量发展,助力减少塑料污染,并将带动竹产业新一轮的增长.下表为2019年—2023年中国竹产业产值规模y(单位:千亿元),其中2019年—2023年的年份代码x依次为1~5.
x 1 2 3 4 5
y 2.89 3.22 3.82 4.34 5.41
(1)记第i+1年与i年(i=1,2,3,4)中国竹产业产值规模y差值的2倍的整数部分分别为ni,从n1,n2,n3,n4中任取2个数相乘,记乘积为X,求X的分布列与期望;
(2)根据以上数据及相关系数,判断能否用线性回归模型拟合中国竹产业产值规模y与年份x之间的关系.
参考数据:yi=19.68,xiyi=65.20,≈1.99,≈3.16.
相关系数r=.若|r|≥0.75,则认为y与x有较强的相关性.
解析 (1)由题得n1=0,n2=n3=1,n4=2,所以X的所有可能取值为0,1,2,
P(X=0)=,P(X=1)=,P(X=2)=,
所以X的分布列为
X 0 1 2
P
所以E(X)=0×.
(2)由题意得=3,(xi-)2=10,
xiyi=65.20,yi=19.68,≈1.99,
所以=65.20-3×19.68=6.16,
所以r=≈0.98>0.75.
因为y与x的相关系数大于0.75,所以y与x的线性相关程度高,可以用线性回归模型拟合y与x的关系.
能力拔高练
1.(2024湖南邵阳二中模拟,6)某学习小组对一组数据(xi,yi)(i=1,2,3,…,7)进行回归分析,甲同学首先求出经验回归方程为=5x+4,样本点的中心为(2,m).乙同学对甲的计算过程进行检查,发现甲将数据(2,3)误输成(3,2),将这两个数据修正后得到经验回归方程为=kx+7,则实数k= (  )
A.
答案 A 
2.(多选)(2025届广东广州摸底,9)中欧班列是推进“一带一路”沿线国家道路联通、贸易畅通的重要举措.在中欧班列带动下,某外贸企业出口额逐年提升,以下为该企业近6个月的出口额情况统计,若已求得y关于x的经验回归方程为=28x+,则 (  )
月份编号x 1 2 3 4 5 6
出口额y/万元 16 25 43 77 102 159
A.y与x成正相关
B.样本数据y的第40百分位数为34
C.当x=3时,残差的绝对值最小
D.用模型y=enx+m描述y与x的关系更合适
答案 AD 
3.(2024湖北荆州适应性考试,13)某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得=8,=5,x+7.4,则k的值为    ;为判断拟合效果,通过经验回归方程求得预测值(i=1,2,…,8),若残差平方和(yi-)2≈0.28,则决定系数R2≈    .
答案 -0.3;0.98
4.(2025届四川成都简阳实验学校月考,17)随着移动互联网技术的发展,直播带货已经成为热门的销售方式.通过主播的详细介绍,顾客对商品有更全面的了解,小张统计了某新手主播开启直播带货后从1月份到5月份每个月的销售量yi(万件)(i=1,2,3,4,5)的数据,得到如图所示的散点图.
(1)根据散点图判断,模型①y=a+bx与模型②y=c+dx2哪一个更适宜作为月销售量y关于月份代码x的回归方程 (给出判断即可,不必说明理由)并求出y关于x的回归方程(计算结果精确到0.01);
(2)随机调查了220名市民对直播带货的认可程度,得到的部分数据如表:
认可 不认可
50岁以下市民 70 50
50岁及以上市民 40 60
依据小概率值α=0.01的独立性检验,分析市民对直播带货认可程度是否与年龄有关联.
参考公式与数据:,=55,=979,xiyi=80.8,tiyi=335.6,其中ti=, χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解析 (1)由散点图可知,随着x的增加,y的增加幅度不一致,是非线性的关系,所以选模型②y=c+dx2更适宜,
由t=x2,得y=c+dt,
可得×55=11,×(2.2+2.4+3.8+5.6+8)=4.4,
则d=≈0.25,
因此c==4.4-0.25×11=1.65,所以y=1.65+0.25t,
即y关于x的回归方程为y=1.65+0.25x2.
(2)零假设为H0:市民对直播带货认可程度与年龄无关联,
χ2=≈7.333>6.635,
依据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为市民对直播带货认可程度与年龄有关联,此推断犯错误的概率不超过0.01.
5.(2025届四川成都列五中学入学考,16)为了了解高中学生课后自主学习数学时间(x分钟/天)和他们的数学成绩(y分)的关系,某实验小组做了调查,得到一些数据.
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
(1)求数学成绩y与学习时间x的相关系数(精确到0.001);
(2)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合,并求出y关于x的回归直线方程,并由此预测每天课后自主学习数学时间为100分钟时的数学成绩(参考数据:xiyi=22 820,yi=435,=38 999,107.42≈11 540,xi的方差为200);
(3)基于上述调查,某校提倡学生周末在校自主学习.经过一学期的实施后,抽样调查了220位学生.按照是否参与周末在校自主学习以及成绩是否有进步统计,得到2×2列联表.依据表中数据及小概率值α=0.001的独立性检验,分析“周末在校自主学习”与“成绩进步”是否有关.
没有进步 有进步 合计
参与周末 在校自主学习 35 130 165
未参与周末 在校自主学习 25 30 55
合计 60 160 220
附:方差:s2=(xi-)2.相关系数:r=.
回归方程x+,, χ2=.
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解析 (1)=50,=87,
又xi(i=1,2,3,4,5)的方差为(xi-)2=200,
(yi-)2=(65-87)2+(78-87)2+(85-87)2+(99-87)2+(108-87)2=484+81+4+144+441=1 154,
则r=≈0.996.
(2)由(1)知r≈0.996接近1,故y与x之间具有极强的线性相关关系,可用线性回归模型进行拟合,
=1.07,
=87-1.07×50=33.5,故=1.07x+33.5.当x=100时,=140.5,
故预测每天课后自主学习数学时间达到100分钟时的数学成绩为140.5分.
(3)零假设为H0:周末在校自主学习与成绩进步无关联,
χ2=≈12.22,
因为12.22>10.828,所以依据α=0.001的独立性检验,推断H0不成立,即认为“周末自主学习”与“成绩进步”有关联,此推断犯错误的概率不超过0.001.
精品试卷·第 2 页 (共 2 页)
()

0 条评论

目前没有人发表评论

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。