《高考數(shù)學總復習 第10章 第3節(jié) 變量間的相關關系、統(tǒng)計案例課件 新人教A版》由會員分享,可在線閱讀,更多相關《高考數(shù)學總復習 第10章 第3節(jié) 變量間的相關關系、統(tǒng)計案例課件 新人教A版(52頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第三節(jié)變量間的相關關系、統(tǒng)計案例 1會作兩個有關聯(lián)變量數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關關系2了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程3了解下列常見的統(tǒng)計方法,并能應用這些方法解決一些實際問題(1)了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及其簡單應用(2)了解回歸的基本思想、方法及其簡單應用一、兩個變量的線性相關1正相關在散點圖中,點散布在從 到 的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關左下角右上角2負相關在散點圖中,點散布在從 到 的區(qū)域,兩個變量的這種相關關系稱為負相關3線性相關關系、回歸直線如果散點圖中點的分布從整體上看大致在
2、 ,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線左上角右下角附近一條直線相關關系與函數(shù)關系有何異同點?提示:相同點:兩者均是指兩個變量的關系不同點:函數(shù)關系是一種確定的關系,相關關系是一種非確定的關系二、回歸方程1最小二乘法求回歸直線使得樣本數(shù)據(jù)的點到回歸直線的 的方法叫做最小二乘法平方和最小距離的三、回歸分析1定義:對具有的兩個變量進行統(tǒng)計分析的一種常用方法2隨機誤差:線性回歸模型用ybxae表示,其中a和b為模型的 ,稱為隨機誤差3樣本點的中心在具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)中,回歸方程的截距和斜率的最小二乘估計公式分別為:相關關系未知參數(shù)
3、e4相關系數(shù)r;當r0時,表明兩個變量;當r0時,表明兩個變量r的絕對值越接近于1,表明兩個變量的線性相關性 ,r的絕對值越接近于0時,表明兩個變量之間 ,通常|r|大于時,認為兩個變量有很強的線性相關性正相關負相關越強相關性越弱0.75四、殘差分析1總偏差平方和把每個效應(觀測值減去總的平均值)的平方加起來即: .2殘差數(shù)據(jù)點和它在回歸直線上相應位置的差異 是的效應,稱 為相應于點(xi,yi)的殘差3殘差平方和 .隨機誤差4相關指數(shù)R2.R2的值越大,說明殘差平方和,也就是說模型的擬合效果 在線性回歸模型中,R2表示解釋變量對預報變量變化的貢獻率,R2越接近于1,表示回歸的效果 越小越好越
4、好五、獨立性檢驗1分類變量:變量的不同“值”表示個體所屬的 ,像這樣的變量稱為分類變量2列聯(lián)表:列出兩個分類變量的,稱為列聯(lián)表假設有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為22列聯(lián)表不同類別頻數(shù)表y1y2總計x1ababx2cdcd總計acbdabcd構造一個隨機變量K2,其中n 為樣本容量3獨立性檢驗利用隨機變量、 來確定是否一定有把握認為“兩個分類變量有關系”的方法稱為兩個分類變量的獨立性檢驗abcd獨立性假設1下列兩個變量之間的關系哪個是相關關系()A角度和它的余弦值B正方形的邊長和它的面積C正n邊形的邊數(shù)和頂點角度之和D人的年
5、齡和身高解析:A、B、C中的兩個變量都是函數(shù)關系,它們可以用函數(shù)關系式來表示,D中的兩個變量之間的關系是相關關系答案:DA變量x與y正相關,u與v正相關B變量x與y正相關,u與v負相關C變量x與y負相關,u與v正相關D變量x與y負相關,u與v負相關解析:由正、負相關的定義知,x與y負相關,u與v正相關答案:C3(2011江西高考)為了解兒子身高與其父親身高的關系,隨機抽取5對父子的身高數(shù)據(jù)如下:父親身高x(cm)174176176176178兒子身高y(cm)175175176177177答案:C答案:0.2545為了了解患慢性氣管炎與吸煙的關系,調(diào)查了228人,其中每天的吸煙支數(shù)在10支以上
6、20支以下的調(diào)查中,患者人數(shù)有98人,非患者人數(shù)有89人;每天的吸煙支數(shù)在20支以上的調(diào)查者中,患者人數(shù)有25人,非患者人數(shù)有16人,試問患慢性氣管炎與吸煙量_(填“是”或“否”)相互獨立解析:由已知條件得出下表:10支19支20支以上合計患者人數(shù)9825123非患者人數(shù)8916105合計18741228答案:是 在散點圖中,如果所有的樣本點都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關系,即變量之間具有函數(shù)關系如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關關系如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系 在某地區(qū)的1230歲居民中隨機抽取了10個人的身高和體
7、重的統(tǒng)計資料如下表:根據(jù)上述數(shù)據(jù),畫出散點圖并判斷居民的身高和體重之間是否有相關關系身高(cm)143 156 159 172 165 171 177 161 164 160體重(kg)41496179686974696854【特別提醒】函數(shù)關系是一種理想的關系模型,而相關關系是一種更為一般的情況利用當r0時,兩個變量正相關,當r0時,兩個變量負相關;r的絕對值越接近于1,表明兩個變量的線性相關性越強;r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系通常當|r|大于0.75時,認為兩個變量有很強的線性相關關系,因而求回歸直線方程才有意義如果k7.879,就有99.5%的把握認為“X
8、與Y有關系”;如果k6.635,就有99%的把握認為“X與Y有關系”;如果k5.024,就有97.5%的把握認為“X與Y有關系”;如果k3.841,就有95%的把握認為“X與Y有關系”;如果k2.706,就有90%的把握認為“X與Y有關系”;如果k2.706,就認為沒有充分的證據(jù)顯示“X與Y有關系”在調(diào)查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,利用獨立性檢驗的方法來判斷色盲與性別是否有關?你所得到的結(jié)論在什么范圍內(nèi)有效?題眼:線性回歸問題 (12分)某電腦公司有6名產(chǎn)品推銷員,其工作年限與年推銷金額的數(shù)據(jù)如下表:推銷員編號12345工作年限x/年35679推銷金額y/萬
9、元23345(1)以工作年限為自變量x,推銷金額為因變量y,作出散點圖;(2)求年銷售金額y關于工作年限x的回歸直線方程;(3)若第6名推銷員的工作年限為11年,試估計他的年推銷金額【審題】(1)先用散點圖判斷x、y的線性相關關系;(2)求回歸直線方程;(3)作出估計(3)由(2)可知,當x11時,0.5x0.40.5110.45.9(萬元)可以估計第6名推銷員的年推銷金額為5.9萬元.12分【答題樣板】第一步:判斷兩個變量的線性相關性;第二步:求回歸直線的斜率和截距;第三步:確定回歸直線方程;第四步:根據(jù)回歸直線方程對隨機變量作出預測;第五步:反思回顧,查看關鍵點,易錯點和答題規(guī)范【心得】(1)本題易錯點有兩個,一是忽略對變量間的相關性進行檢驗;二是計算易出錯(2)如果不先作線性相關性檢驗,我們雖然也可以求出x與y的回歸直線方程,但這時的回歸直線方程也許沒有任何實際價值,它也就不能確定地反映變量x與y之間的變化規(guī)律,只有在x與y之間具有相關關系時,求得的回歸直線方程才具有實際意義