《2022年高中數(shù)學(xué)(北師大版)選修1-2教案:第1章 拓展資料:回歸模型的殘差分析》由會員分享,可在線閱讀,更多相關(guān)《2022年高中數(shù)學(xué)(北師大版)選修1-2教案:第1章 拓展資料:回歸模型的殘差分析(5頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
2022年高中數(shù)學(xué)(北師大版)選修1-2教案:第1章 拓展資料:回歸模型的殘差分析
判斷回歸模型的擬合效果是回歸分析的重要內(nèi)容,在回歸分析中,通常用殘差分析來判斷回歸模型的擬合效果。下面具體分析殘差分析的途徑及具體例子。
一、 殘差分析的兩種方法
1、差分析的基本方法是由回歸方程作出殘差圖,通過觀測殘差圖,以分析和發(fā)現(xiàn)觀測數(shù)據(jù)中可能出現(xiàn)的錯誤以及所選用的回歸模型是否恰當(dāng);在殘差圖中,殘差點比較均勻地落在水平區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高,回歸方程的預(yù)報精度越高。
2、可以進一步通過相關(guān)指數(shù)來衡量回歸模型的擬合效果,一般規(guī)律是
2、越大,殘差平方和就越小,從而回歸模型的擬合效果越好。
二、 典例分析:
例1、某運動員訓(xùn)練次數(shù)與運動成績之間的數(shù)據(jù)關(guān)系如下:
次數(shù)/x
30
33
35
37
39
44
46
50
成績/y
30
34
37
39
42
46
48
51
試預(yù)測該運動員訓(xùn)練47次以及55次的成績。
解答:(1)作出該運動員訓(xùn)練次數(shù)x與成績y之間的散點圖,如圖1所示,由散點圖可知,它們之間具有線性相關(guān)關(guān)系。
(2)列表計算:
次數(shù)
成績
30
30
900
900
900
33
34
1089
1156
1122
35
3、37
1225
1369
1295
37
39
1369
1521
1443
39
42
1521
1764
1638
44
46
1936
2116
2024
46
48
2116
2304
2208
50
51
2500
2601
2550
由上表可求得,,,
,所以
,所以回歸直線方程為
(3)計算相關(guān)系數(shù)
將上述數(shù)據(jù)代入得,查表可知
,而,故y與x之間存在顯著的相關(guān)關(guān)系。
(4)殘差分析:
作殘差圖如圖2,由圖可知,殘差點比較均勻地分布在水平帶狀區(qū)域中,說明選用的模型比較合適。
計算殘差的方差得,說明預(yù)報的精
4、度較高。
(5)計算相關(guān)指數(shù)
計算相關(guān)指數(shù)=0.9855.說明該運動員的成績的差異有98.55%是由訓(xùn)練次數(shù)引起的。
(6)做出預(yù)報
由上述分析可知,我們可用回歸方程作為該運動員成績的預(yù)報值。
將x=47和x=55分別代入該方程可得y=49和y=57,
故預(yù)測運動員訓(xùn)練47次和55次的成績分別為49和57.
點評:一般地,建立回歸模型的基本步驟為:
(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量;
(2)畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等);
(3)由經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性
5、回歸方程y=bx+a);
(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法);
(5)得出結(jié)果后分析殘差圖是否有異常(個別數(shù)據(jù)對應(yīng)殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性等等),若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。
例2、某城區(qū)為研究城鎮(zhèn)居民月家庭人均生活費支出和月人均收入的相關(guān)關(guān)系,隨機抽取10戶進行調(diào)查,其結(jié)果如下:
月人均收入x/元
月人均生活費y/元
300
255
390
324
420
335
520
360
570
450
700
520
760
580
800
600
850
630
1080
750
試預(yù)測人均月收
6、入為1100元和人均月收入為1200元的兩個家庭的月人均生活費。
解答:作出散點分布圖如圖,由圖可知,月人均生活費與人均收入之間具有線性相關(guān)關(guān)系。
通過計算可知,,,
,所以
,所以回歸直線方程為
計算相關(guān)系數(shù)得,而查表知,故月人均收入與月人均生活費之間具有顯著相關(guān)關(guān)系。
作殘差圖如圖,由圖可知,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適。
計算相關(guān)指數(shù)得=0.9863,說明城鎮(zhèn)居民的月人均生活費的差異有98.63%是由月人均收入引起的。
由以上分析可知,我們可以利用回歸方程來作為月生活費的預(yù)報值。
將x=1100代入回歸方程得y=784.59元;將x=1200代入回歸方程得y=850.58元。
故預(yù)測月人均收入分別為1100元和1200元的兩家庭的月人均生活費分別為784.59元和850.58元。