《高三數(shù)學二輪復習 第1部分 專題3 突破點8 回歸分析、獨立性檢驗 理-人教高三數(shù)學試題》由會員分享,可在線閱讀,更多相關《高三數(shù)學二輪復習 第1部分 專題3 突破點8 回歸分析、獨立性檢驗 理-人教高三數(shù)學試題(10頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、突破點8 回歸分析、獨立性檢驗
提煉1
變量的相關性
(1)正相關:在散點圖中,點散布在從左下角到右上角的區(qū)域.
(2)負相關:在散點圖中,點散布在從左上角到右下角的區(qū)域.
(3)相關系數(shù)r:當r>0時,兩變量正相關;當r<0時,兩變量負相關;當|r|≤1且|r|越接近于1,相關程度越高,當|r|≤1且|r|越接近于0,相關程度越低.
提煉2
線性回歸方程
方程=x+稱為線性回歸方程,其中=,=-.(,)稱為樣本中心點.
提煉3
獨立性檢驗
(1)確定分類變量,獲取樣本頻數(shù),得到列聯(lián)表.
(2)求觀測值:k=.
(3)根據(jù)臨界值表,作出正確判斷.如果k≥kα,
2、就推斷“X與Y有關系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”.
回訪1 變量的相關性
1.(2015·全國卷Ⅱ)根據(jù)下面給出的2004年至2013年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結(jié)論中不正確的是( )
圖8-1
A.逐年比較,2008年減少二氧化硫排放量的效果最顯著
B.2007年我國治理二氧化硫排放顯現(xiàn)成效
C.2006年以來我國二氧化硫年排放量呈減少趨勢
D.2006年以來我國二氧化硫年排放量與年份正相關
D 對于A選項,由圖知從2007年到2008年二氧化硫排放量下降得最多,故A正確.對于
3、B選項,由圖知,由2006年到2007年矩形高度明顯下降,因此B正確.對于C選項,由圖知從2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正確.由圖知2006年以來我國二氧化硫年排放量與年份負相關,故選D.]
2.(2012·全國卷)在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據(jù)的樣本相關系數(shù)為( )
A.-1 B.0
C. D.1
D 樣本點都在直線上時,其數(shù)據(jù)的估計值與真實值是相等的,即y
4、i=i,代入相關系數(shù)公式r==1.]
3.(2015·全國卷Ⅰ)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.
圖8-2
(xi-)2
(wi-)2
(xi-)(yi-)
(wi-)(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中wi=,w]=wi.
(1)根據(jù)散點圖判斷,y=a+bx與y=c+d哪一個適宜作為年銷
5、售量y關于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關于x的回歸方程;
(3)已知這種產(chǎn)品的年利潤z與x,y的關系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問題:
①年宣傳費x=49時,年銷售量及年利潤的預報值是多少?
②年宣傳費x為何值時,年利潤的預報值最大?
附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線v=α+βu的斜率和截距的最小二乘估計分別為=,=-.
解] (1)由散點圖可以判斷,y=c+d適宜作為年銷售量y關于年宣傳費x的回歸方程類型.2分
(2)令w=,先建立y關于w的線
6、性回歸方程.
由于===68,
=- =563-68×6.8=100.6,4分
所以y關于w的線性回歸方程為=100.6+68w,
因此y關于x的回歸方程為=100.6+68.6分
(3)①由(2)知,當x=49時,
年銷售量y的預報值=100.6+68=576.6,
年利潤z的預報值=576.6×0.2-49=66.32.8分
②根據(jù)(2)的結(jié)果知,年利潤z的預報值
=0.2(100.6+68)-x=-x+13.6+20.12.10分
所以當==6.8,即x=46.24時,取得最大值.
故年宣傳費為46.24千元時,年利潤的預報值最大.12分
回訪2 獨立性檢驗
4
7、.(2012·遼寧高考)電視傳媒公司為了解某地區(qū)電視觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調(diào)查.下面是根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時間的頻率分布直方圖:
圖8-3
將日均收看該體育節(jié)目時間不低于40分鐘的觀眾稱為“體育迷”.
(1)根據(jù)已知條件完成下面的2×2列聯(lián)表,并據(jù)此資料你是否認為“體育迷”與性別有關?
非體育迷
體育迷
合計
男
女
10
55
合計
(2)將上述調(diào)查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機抽樣方法每次抽取1名觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數(shù)為
8、X.若每次抽取的結(jié)果是相互獨立的,求X的分布列,期望E(X)和方差D(X).
附:K2=,
P(K2≥k)
0.05
0.01
k
3.841
6.635
解] (1)由頻率分布直方圖可知,在抽取的100人中,“體育迷”有25人,從而2×2列聯(lián)表如下:
非體育迷
體育迷
合計
男
30
15
45
女
45
10
55
合計
75
25
100
2分
將2×2列聯(lián)表中的數(shù)據(jù)代入公式計算,得
k===≈3.030.因為3.030<3.841,所以沒有理由認為“體育迷”與性別有關.6分
(2)由頻率分布直方圖知抽到“體育迷”的頻率為0.25
9、,將頻率視為概率,即從觀眾中抽取一名“體育迷”的概率為.8分
由題意知X~B,從而X的分布列為
X
0
1
2
3
P
10分
E(X)=np=3×=,
D(X)=np(1-p)=3××=.12分
熱點題型1 回歸分析
題型分析:高考命題常以實際生活為背景,重在考查回歸分析中散點圖的作用、回歸方程的求法和應用,難度中等.
在一次抽樣調(diào)查中測得樣本的5組數(shù)據(jù),得到一個變量y關于x的回歸方程模型,其對應的數(shù)值如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
(1)試作出散點圖,根據(jù)散點圖判斷,y=a+b
10、x與y=+m哪一個適宜作為變量y關于x的回歸方程模型?(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立變量y關于x的回歸方程;
(3)根據(jù)(2)中所求的變量y關于x的回歸方程預測:當x=3時,對應的y值為多少?(保留四位有效數(shù)字)
解] (1)作出變量y與x之間的散點圖,如圖所示,
2分
由圖可知變量y與x近似地呈反比例函數(shù)關系,
那么y=+m適宜作為變量y關于x的回歸方程模型.4分
(2)由(1)知y=+m適宜作為變量y關于x的回歸方程模型,令t=,則y=kt+m,由y與x的數(shù)據(jù)表可得y與t的數(shù)據(jù)表如下:
t
4
2
1
0.5
0.2
11、5
y
16
12
5
2
1
……………6分
作出y與t的散點圖,如圖所示.
8分
由圖可知y與t近似地呈線性相關關系.
又=1.55,=7.2,iyi=94.25,=21.312 5,
所以k==≈4.134 4,m=-k=7.2-4.134 4×1.55≈0.8,
所以y=4.134 4t+0.8,
所以y關于x的回歸方程為y=+0.8.10分
(3)由(2)得y關于x的回歸方程是y=+0.8,
當x=3時,可得y=+0.8≈2.178.12分
1.正確理解計算,的公式和準確的計算,是求線性回歸方程的關鍵.其中線性回歸方程必過樣本中心點(,).
12、
2.在分析兩個變量的相關關系時,可根據(jù)樣本數(shù)據(jù)作出散點圖來確定兩個變量之間是否具有相關關系,若具有線性相關關系,則可通過線性回歸方程估計和預測變量的值.
變式訓練1] (2016·石家莊二模)為了解某地區(qū)某種農(nóng)產(chǎn)品的年產(chǎn)量x(單位:噸)對價格y(單位:千元/噸)和年利潤z的影響,對近五年該農(nóng)產(chǎn)品的年產(chǎn)量和價格統(tǒng)計如下表:
x
1
2
3
4
5
y
7.0
6.5
5.5
3.8
2.2
(1)求y關于x的線性回歸方程=x+;
(2)若每噸該農(nóng)產(chǎn)品的成本為2千元,假設該農(nóng)產(chǎn)品可全部賣出,預測當年產(chǎn)量為多少時,年利潤z取到最大值?(保留兩位小數(shù))
參考公式:=
13、=,
=-.
解] (1)=3,=5,2分
i=15,i=25,iyi=62.7,=55,
解得=-1.23,=8.69,4分
所以=8.69-1.23x.6分
(2)年利潤z=x(8.69-1.23x)-2x=-1.23x2+6.69x,10分
所以當x=2.72,即年產(chǎn)量為2.72噸時,年利潤z取得最大值.12分
熱點題型2 獨立性檢驗
題型分析:盡管全國卷Ⅰ近幾年未在該點命題,但其極易與分層抽樣、概率統(tǒng)計等知識交匯,是潛在的命題點之一,須引起足夠的重視.
(2016·山西四校第二次聯(lián)考)心理學家分析發(fā)現(xiàn)視覺和空間能力與性別有關,某數(shù)學興趣小組為了驗證這個結(jié)論,從興趣
14、小組中按分層抽樣的方法抽取50名同學(男30,女20),給所有同學幾何題和代數(shù)題各一題,讓各位同學自由選擇一道題進行解答.選題情況如下表:(單位:人)
幾何題
代數(shù)題
總計
男同學
22
8
30
女同學
8
12
20
總計
30
20
50
(1)能否據(jù)此判斷有97.5%的把握認為視覺和空間能力與性別有關?
(2)經(jīng)過多次測試后,甲每次解答一道幾何題所用的時間在5~7分鐘,乙每次解答一道幾何題所用的時間在6~8分鐘,現(xiàn)甲、乙各解同一道幾何題,求乙比甲先解答完的概率;
(3)現(xiàn)從選擇做幾何題的8名女生中任意抽取2人對她們的答題情況進行全程研究,記丙、丁
15、2名女生被抽到的人數(shù)為X,求X的分布列及數(shù)學期望E(X).
附表及公式:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
K2=,n=a+b+c+d.
解題指導] 計算k下結(jié)論求概率求X的分布列及E(X).
解] (1)由表中數(shù)據(jù)得k==≈5.556>5.024,2分
所以有97.5%的把握認為視覺和空間能力與性別有關.3分
(2)設甲、乙解答一道幾何題的時間分別為x,y分鐘,則表示的平面區(qū)域如圖所示.
設
16、事件A為“乙比甲先做完此道題”,則x>y滿足的區(qū)域如圖中陰影部分所示.5分
由幾何概型可得P(A)==,
即乙比甲先解答完的概率為.7分
(3)由題可知,在選擇做幾何題的8名女生中任意抽取2人的方法有C=28種,其中丙、丁2人沒有一個人被抽到的有C=15種;恰有一人被抽到的有C·C=12種;2人都被抽到的有C=1種.
所以X的可能取值為0,1,2,P(X=0)=,8分
P(X=1)==,9分
P(X=2)=.10分
X的分布列為:
X
0
1
2
P
11分
E(X)=0×+1×+2×=.12分
求解獨立性檢驗問題時要注意:一是2×2列聯(lián)表中的數(shù)據(jù)
17、與公式中各個字母的對應,不能混淆;二是注意計算得到k之后的結(jié)論.
變式訓練2] (名師押題)2016年1月1日起全國統(tǒng)一實施全面二孩政策.為了解適齡民眾對放開生育二孩政策的態(tài)度,某市選取70后和80后作為調(diào)查對象,隨機調(diào)查了100人,得到數(shù)據(jù)如下表:
生二孩
不生二孩
總計
70后
30
15
45
80后
45
10
55
總計
75
25
100
(1)以這100人的樣本數(shù)據(jù)估計該市的總體數(shù)據(jù),且以頻率估計概率,若從該市70后公民中隨機抽取3人,記其中生二孩的人數(shù)為X,求隨機變量X的分布列和數(shù)學期望;
(2)根據(jù)調(diào)查數(shù)據(jù),是否有90%以上的把握認為“
18、生二孩與年齡有關”,并說明理由.
參考數(shù)據(jù):
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
k0
2.072
2.706
3.841
5.024
6.635
7.879
參考公式:K2=,其中
n=a+b+c+d
解] (1)由已知得70后“生二孩”的概率為,并且X~B,所以P(X=k)=Ck3-k(k=0,1,2,3),4分
X的分布列為
X
0
1
2
3
P
6分
所以E(X)=3×=2.8分
(2)由表中數(shù)據(jù)知k==≈3.030>2.706,10分
所以有90%以上的把握認為“生二孩與年齡有關”.12分