2018屆高三數(shù)學一輪復習: 第9章 第4節(jié) 變量間的相關關系與統(tǒng)計案例
《2018屆高三數(shù)學一輪復習: 第9章 第4節(jié) 變量間的相關關系與統(tǒng)計案例》由會員分享,可在線閱讀,更多相關《2018屆高三數(shù)學一輪復習: 第9章 第4節(jié) 變量間的相關關系與統(tǒng)計案例(13頁珍藏版)》請在裝配圖網上搜索。
1、 第四節(jié) 變量間的相關關系與統(tǒng)計案例 [考綱傳真] 1.會做兩個有關聯(lián)變量的數(shù)據的散點圖,并利用散點圖認識變量間的相關關系.2.了解最小二乘法的思想,能根據給出的線性回歸方程系數(shù)公式建立線性回歸方程(線性回歸系數(shù)公式不要求記憶).3.了解回歸分析的基本思想、方法及其簡單應用.4.了解獨立性檢驗(只要求2×2列聯(lián)表)的思想、方法及其初步應用. 1.回歸分析 回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法;判斷相關性的常用統(tǒng)計圖是散點圖;統(tǒng)計量有相關系數(shù)與相關指數(shù). (1)在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關.
2、 (2)在散點圖中,點散布在從左上角到右下角的區(qū)域,兩個變量的這種相關關系稱為負相關. (3)如果散點圖中點的分布從整體上看大致在一條直線附近,稱兩個變量具有線性相關關系. 2.線性回歸方程 (1)最小二乘法:使得樣本數(shù)據的點到回歸直線的距離的平方和最小的方法叫做最小二乘法. (2)回歸方程:兩個具有線性相關關系的變量的一組數(shù)據:(x1,y1),(x2,y2),…,(xn,yn),其回歸方程為=x+,則==,=-.其中,是回歸方程的斜率,是在y軸上的截距. 3.殘差分析 (1)殘差:對于樣本點(x1,y1),(x2,y2),…,(xn,yn),它們的隨機誤差為ei=y(tǒng)i-bxi-
3、a,i=1,2,…,n,其估計值為i=y(tǒng)i-i=y(tǒng)i-xi-,i=1,2,…,n,i稱為相應于點(xi,yi)的殘差. (2)相關指數(shù):R2=1-. 4.獨立性檢驗 (1)利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗. (2)列聯(lián)表:列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(2×2列聯(lián)表)為 y1 y2 總計 x1 a b a+b x2 c d c+d 總計 a+c b+d a+b+c+d 則隨機變量K2=(其中n=a+b+c+d為樣本容
4、量). 1.(思考辨析)判斷下列結論的正誤.(正確的打“√”,錯誤的打“×”) (1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關關系.( ) (2)某同學研究賣出的熱飲杯數(shù)y與氣溫x(℃)之間的關系,得回歸方程=-2.352x+147.767,則氣溫為2℃時,一定可賣出143杯熱飲.( ) (3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關性檢驗.( ) (4)若事件X,Y關系越密切,則由觀測數(shù)據計算得到的K2的觀測值越?。? ) [答案] (1)√ (2)× (3)× (4)× 2.(教材改編)已知變量x與y正相關,且由觀測數(shù)
5、據算得樣本平均數(shù)=3,=3.5,則由該觀測數(shù)據算得的線性回歸方程可能是( ) A.=0.4x+2.3 B.=2x-2.4 C.=-2x+9.5 D.=-0.3x+4.4 A [因為變量x和y正相關,排除選項C,D.又樣本中心(3,3.5)在回歸直線上,排除B,選項A滿足.] 3.(2015·全國卷Ⅱ)根據下面給出的2004年至2013年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結論中不正確的是( ) 圖9-4-1 A.逐年比較,2008年減少二氧化硫排放量的效果最顯著 B.2007年我國治理二氧化硫排放顯現(xiàn)成效 C.2006年以來我國二氧化硫年排放量呈減少趨
6、勢 D.2006年以來我國二氧化硫年排放量與年份正相關 D [對于A選項,由圖知從2007年到2008年二氧化硫排放量下降得最多,故A正確.對于B選項,由圖知,由2006年到2007年矩形高度明顯下降,因此B正確.對于C選項,由圖知從2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正確.由圖知2006年以來我國二氧化硫年排放量與年份負相關,故選D.] 4.為了評價某個電視欄目的改革效果,在改革前后分別從居民點抽取了100位居民進行調查,經過計算K2≈0.99,根據這一數(shù)據分析,下列說法正確的是 ( ) A.有99%的人認為該電視欄目優(yōu)秀 B.有99%的人認為
7、該電視欄目是否優(yōu)秀與改革有關系 C.有99%的把握認為該電視欄目是否優(yōu)秀與改革有關系 D.沒有理由認為該電視欄目是否優(yōu)秀與改革有關系 D [只有K2≥6.635才能有99%的把握認為“該電視欄目是否優(yōu)秀與改革有關系”,而即使K2≥6.635也只是對“該電視欄目是否優(yōu)秀與改革有關系”這個論斷成立的可能性大小的結論,與是否有99%的人等無關,故只有D正確.] 5.(2017·貴陽檢測)若8名學生的身高和體重數(shù)據如下表: 編號 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 體重/kg 48
8、 57 54 64 61 43 59 第3名學生的體重漏填,但線性回歸方程是=0.849x-85.712,則第3名學生的體重估計為________kg. 50 [設第3名學生的體重為a,則 (48+57+a+54+64+61+43+59)=0.849×(165+165+157+170+175+165+155+170)-85.712. 解得a≈50.] 相關關系的判斷 (1)(2015·湖北高考)已知變量x和y滿足關系y=-0.1x+1,變量y與z正相關.下列結論中正確的是( ) A.x與y正相關,x與z負相關 B.x與y正相關,x與z正相關 C.x與
9、y負相關,x與z負相關 D.x與y負相關,x與z正相關 (2)x和y的散點圖如圖9-4-2所示,則下列說法中所有正確命題的序號為________. 圖9-4-2 ①x,y是負相關關系; ②在該相關關系中,若用y=c1ec2x擬合時的相關指數(shù)為R,用=x+擬合時的相關指數(shù)為R,則R>R; ③x,y之間不能建立線性回歸方程. (1)C (2)①② [(1)因為y=-0.1x+1的斜率小于0,故x與y負相關.因為y與z正相關,可設z=y(tǒng)+,>0,則z=y(tǒng)+=-0.1x++,故x與z負相關. (2)在散點圖中,點散布在從左上角到右下角的區(qū)域,因此x,y是負相關關系,故①正確;由散點
10、圖知用y=c1ec2x擬合比用=x+擬合效果要好,則R>R,故②正確;x,y之間可以建立線性回歸方程,但擬合效果不好,故③錯誤.] [規(guī)律方法] 1.利用散點圖判斷兩個變量是否有相關關系是比較直觀簡便的方法.如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關關系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系.若點散布在從左下角到右上角的區(qū)域,則正相關,若點散布在左上角到右下角的區(qū)域,則負相關. 2.利用相關系數(shù)判定,當|r|越趨近于1,相關性越強. 當殘差平方和越小,相關指數(shù)R2越大,相關性越強. [變式訓練1] 甲、乙、丙、丁四位同學各自對A,B兩變量的線性相
11、關性做試驗,并用回歸分析方法分別求得相關系數(shù)r與殘差平方和m如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 則哪位同學的試驗結果體現(xiàn)A,B兩變量有更強的線性相關性( ) A.甲 B.乙 C.丙 D.丁 D [在驗證兩個變量之間的線性相關關系時,相關系數(shù)的絕對值越接近于1,相關性越強,在四個選項中只有丁的相關系數(shù)最大;殘差平方和越小,相關性越強,只有丁的殘差平方和最小,綜上可知丁的試驗結果體現(xiàn)了A,B兩變量有更強的線性相關性.] 線性回歸方程及應用 (2016·全國卷
12、Ⅲ)如圖9-4-3是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖. 圖9-4-3 注:年份代碼1~7分別對應年份2008~2014. (1)由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數(shù)加以說明; (2)建立y關于t的回歸方程(系數(shù)精確到0.01),預測2016年我國生活垃圾無害化處理量. 參考數(shù)據:yi=9.32,tiyi=40.17,=0.55,≈2.646. 參考公式:相關系數(shù)r=,回歸方程=+t中斜率和截距的最小二乘估計公式分別為=,=-. [解] (1)由折線圖中的數(shù)據和附注中的參考數(shù)據得 =4, (ti-)2=28,=0.5
13、5,2分 (ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89, 所以r≈≈0.99. 因為y與t的相關系數(shù)近似為0.99,說明y與t的線性相關程度相當大,從而可以用線性回歸模型擬合y與t的關系.5分 (2)由=≈1.331及(1)得 ==≈0.103.8分 =-≈1.331-0.103×4≈0.92. 所以y關于t的回歸方程為=0.92+0.10t.10分 將2016年對應的t=9代入回歸方程得=0.92+0.10×9=1.82. 所以預測2016年我國生活垃圾無害化處理量約為1.82億噸.12分 [規(guī)律方法] 1.在分析實際中兩個變量的相關
14、關系時,可根據樣本數(shù)據作出散點圖來確定兩個變量之間是否具有相關關系,也可計算相關系數(shù)r進行判斷.若具有線性相關關系,則可通過線性回歸方程估計和預測變量的值. 2.(1)正確運用計算,的公式和準確的計算,是求線性回歸方程的關鍵.(2)回歸直線=x+必過樣本點的中心(,). [變式訓練2] (2014·全國卷Ⅱ)某地區(qū)2007年至2013年農村居民家庭人均純收入y(單位:千元)的數(shù)據如下表: 年 份 2007 2008 2009 2010 2011 2012 2013 年份代號t 1 2 3 4 5 6 7 人均純收入y 2.9 3.3 3.6 4.4
15、 4.8 5.2 5.9 (1)求y關于t的線性回歸方程; (2)利用(1)中的回歸方程,分析2007年至2013年該地區(qū)農村居民家庭人均純收入的變化情況,并預測該地區(qū)2015年農村居民家庭人均純收入. 附:回歸直線的斜率和截距的最小二乘估計公式分別為: =,=-. [解] (1)由所給數(shù)據計算得=(1+2+3+4+5+6+7)=4, =(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (ti-)2=9+4+1+0+1+4+9=28,3分 (ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.
16、5+2×0.9+3×1.6=14, ===0,5, =-=4.3-0.5×4=2.3, 所求回歸方程為=0.5t+2.3.6分 (2)由(1)知,=0.5>0,故2007年至2013年該地區(qū)農村居民家庭人均純收入逐年增加,平均每年增加0.5千元.9分 將2015年的年份代號t=9代入(1)中的回歸方程,得 =0.5×9+2.3=6.8, 故預測該地區(qū)2015年農村居民家庭人均純收入為6.8千元.12分 獨立性檢驗 (2017·鄭州調研)某高校共有學生15 000人,其中男生10 500人,女生4 500人.為調查該校學生每周平均體育運動時間的情況,采用分層抽樣的方法,收
17、集300位學生每周平均體育運動時間的樣本數(shù)據(單位:小時). (1)應收集多少位女生的樣本數(shù)據? (2)根據這300個樣本數(shù)據,得到學生每周平均體育運動時間的頻率分布直方圖(如圖9-4-4所示),其中樣本數(shù)據的分組區(qū)間為:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學生每周平均體育運動時間超過4小時的概率; 【導學號:01772369】 圖9-4-4 (3)在樣本數(shù)據中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動時間與性別列聯(lián)表,并判斷是否有95%的把握認為“該校學生的每周平均體育運動時間與性別有關”. P(
18、K2≥k0) 0.10 0.05 0.010 0.005 k0 2.706 3.841 6.635 7.879 附:K2=. [解] (1)利用分層抽樣,300×=90,所以應收集90位女生的樣本數(shù)據.4分 (2)由頻率分布直方圖得1-2×(0.025+0.100)=0.75.所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75.8分 (3)由(2)知,300位學生中有300×0.75=225人的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時.10分 又因為樣本數(shù)據中有210份是關于男生的,90份是關于女生的,所以每周平均體育
19、運動時間與性別列聯(lián)表如下: 每周平均體育運動時間與性別列聯(lián)表 男生 女生 總計 每周平均體育運動時間不超過4小時 45 30 75 每周平均體育運動時間超過4小時 165 60 225 總計 210 90 300 將2×2列聯(lián)表中的數(shù)據代入公式計算,得K2觀測值 k==≈4.762>3.841. 所以,有95%的把握認為“該校學生的每周平均體育運動時間與性別有關”.12分 [規(guī)律方法] 1.在2×2列聯(lián)表中,如果兩個變量沒有關系,則應滿足ad-bc≈0.|ad-bc|越小,說明兩個變量之間關系越弱;|ad-bc|越大,說明兩個變量之間關系越強. 2
20、.解決獨立性檢驗的應用問題,一定要按照獨立性檢驗的步驟得出結論.獨立性檢驗的一般步驟: (1)根據樣本數(shù)據制成2×2列聯(lián)表; (2)根據公式K2=計算K2的觀測值k; (3)比較k與臨界值的大小關系,作統(tǒng)計推斷. [變式訓練3] (2017·濟南聯(lián)考)某市地鐵即將于2017年6月開始運營,為此召開了一個價格聽證會,擬定價格后又進行了一次調查,隨機抽查了50人,他們的收入與態(tài)度如下; 月收入(單位:百元) [15,25) [25,35) [35,45) [45,55) [55,65) [65,75] 贊成定價者人數(shù) 1 2 3 5 3 4 認為價格偏高者人數(shù)
21、 4 8 12 5 2 1 (1)若以區(qū)間的中點值為該區(qū)間內的人均月收入,求參與調查的人員中“贊成定價者”與“認為價格偏高者”的月平均收入的差距是多少(結果保留2位小數(shù)); (2)由以上統(tǒng)計數(shù)據填下面2×2列聯(lián)表,分析是否有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”. 月收入不低于55百元的人數(shù) 月收入低于55百元的人數(shù) 總計 認為價格偏高者 贊成定價者 總計 附:K2=. P(K2≥k0) 0.05 0.01 k0 3.841 6.635 [解] (1)“贊成定價者”的月平均收入為
22、x1= ≈50.56. “認為價格偏高者”的月平均收入為 x2= =38.75, ∴“贊成定價者”與“認為價格偏高者”的月平均收入的差距是x1-x2=50.56-38.75=11.81(百元).5分 (2)根據條件可得2×2列聯(lián)表如下: 月收入不低于 55百元的人數(shù) 月收入低于 55百元的人數(shù) 總計 認為價格偏高者 3 29 32 贊成定價者 7 11 18 總計 10 40 50 K2=≈6.27<6.635, ∴沒有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”.12分 [思想與方法] 1.回歸分析是處理變量
23、相關關系的一種數(shù)學方法.主要解決:(1)確定特定量之間是否有相關關系,如果有就找出它們之間貼近的數(shù)學表達式;(2)根據一組觀察值,預測變量的取值及判斷變量取值的變化趨勢;(3)求出線性回歸方程. 2.根據K2的值可以判斷兩個分類變量有關的可信程度. [易錯與防范] 1.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.根據回歸方程進行預報,僅是一個預報值,而不是真實發(fā)生的值. 2.獨立性檢驗中統(tǒng)計量K2的觀測值k的計算公式很復雜,在解題中易混淆一些數(shù)據的意義,代入公式時出錯,而導致整個計算結果出錯.
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物業(yè)管理制度:常見突發(fā)緊急事件應急處置程序和方法
- 某物業(yè)公司冬季除雪工作應急預案范文
- 物業(yè)管理制度:小區(qū)日常巡查工作規(guī)程
- 物業(yè)管理制度:設備設施故障應急預案
- 某物業(yè)公司小區(qū)地下停車場管理制度
- 某物業(yè)公司巡查、檢查工作內容、方法和要求
- 物業(yè)管理制度:安全防范十大應急處理預案
- 物業(yè)公司巡查、檢查工作內容、方法和要求
- 某物業(yè)公司保潔部門領班總結
- 某公司安全生產舉報獎勵制度
- 物業(yè)管理:火情火災應急預案
- 某物業(yè)安保崗位職責
- 物業(yè)管理制度:節(jié)前工作重點總結
- 物業(yè)管理:某小區(qū)消防演習方案
- 某物業(yè)公司客服部工作職責