《《管理統(tǒng)計學(xué)》第十章.ppt》由會員分享,可在線閱讀,更多相關(guān)《《管理統(tǒng)計學(xué)》第十章.ppt(42頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第十章 回歸分析,一元回歸 多元回歸 逐步回歸,,,,2,一元回歸分析,二、回歸的涵義,一、回歸的起源,三、相關(guān)分析與回歸分析的關(guān)系,四、回歸分析的任務(wù),五、回歸分析的種類,,,,,,,3,一、回歸的起源,英國統(tǒng)計學(xué)家FGaiton。研究父母身高與其子女身高的遺傳問題時,觀察了1078對夫婦。,,計算出的回歸直線方程為:,解釋了人類身高在一定時間內(nèi)相對穩(wěn)定的現(xiàn)象。,4,回歸:揭示出不確定數(shù)量關(guān)系的內(nèi)在數(shù)量變化規(guī)律,并通過一定的表達式描述數(shù)量之間的這種內(nèi)在關(guān)系的方法。,不確定性的函數(shù)關(guān)系,二、回歸的涵義,,數(shù)據(jù)之間的關(guān)系 函數(shù),,,,確定性的函數(shù)關(guān)系,回歸方程,,(1)相關(guān)分析的兩個變量必須都
2、是隨機變量; 回歸分析的因變量是隨機變量。 (2)相關(guān)分析的兩個變量是平等的;回歸分析的因變量是被解釋變量。解釋變量可以是刻度級、順序級、名義級的變量,不論是什么級別的數(shù)據(jù),都必須用數(shù)字(numeric)型的來表示。 (3)相關(guān)分析是揭示兩個變量的密切程度,通過相關(guān)系數(shù);回歸分析是揭示兩個變量的 內(nèi)在數(shù)量變化規(guī)律,通過回歸方程。,三、相關(guān)分析與回歸分析的關(guān)系,,二者側(cè)重的點和應(yīng)用的面不同:,6,四、回歸分析的任務(wù),,(1)通過分析大量的樣本數(shù)據(jù),確定變更量之間的數(shù)學(xué)表達式; (2)對確定的數(shù)學(xué)關(guān)系式的可信度進行統(tǒng)計檢驗找出對某一特定變量影響較為顯著的變量和不顯著的變量; (3)利用確定的數(shù)學(xué)關(guān)
3、系式,根據(jù)自變量預(yù)測或控制因變量的取值,并找出這種預(yù)測或控制的精確度。,7,五、回歸分析的種類,,一元線性回歸分析,多元線性回歸分析,線性回歸分析的種類,,8,回歸方程的顯著性檢驗,一元線性回歸分析,,二、一元線性回歸,一、一元線性回歸模型的設(shè)定,三、回歸系數(shù)的顯著性檢驗,四、回歸分析的置信區(qū)間,五、標(biāo)準(zhǔn)回歸系數(shù),,,,,,,回歸效果的檢驗,回歸系數(shù),,總體均值,方程的檢驗,一元線性回歸的SPSS實現(xiàn),,9,高斯假設(shè),一、一元線性回歸模型的設(shè)定,1.總體回歸模型:,2.樣本回歸模型:,總體回歸直線:,樣本回歸直線:,即,,10,高斯假設(shè),,(1) (2) (3) (4) (5) (6),。,分
4、布。正態(tài)性假設(shè);,為隨機變量;,等方差性假設(shè),即所有隨機誤差都具有相同方差,隨機擾動項協(xié)方差等于零,,相互獨立。無序列相關(guān)假設(shè);,服從,獨立性假設(shè)或零均值假設(shè);,11,回歸方程的顯著性檢驗F檢驗,,:回歸方程不顯著,:回歸方程顯著,:總離差平方和,:剩余平方和/殘差平方和,:回歸離差平方和,12,回歸效果的檢驗判定相關(guān)系數(shù)檢驗,若全部觀測值都落在回歸直線上,則,若x完全無助于解釋y的變動,則,判定相關(guān)系數(shù)越接近1,表明回歸平方和占總離差平方和的比例越大,用x的變動解釋y值變動的部分就越多,回歸的效果就越好。,,F檢驗,13,回歸效果的檢驗F檢驗,,式中:,:樣本容量,:自變量的個數(shù),:判定系數(shù)
5、,14,回歸系數(shù)的顯著性檢驗T檢驗,,,成立,即,當(dāng),時,顯著異于0。,針對回歸系數(shù)的,統(tǒng)計量的顯著性檢驗決定了相,應(yīng)的變量能否作為解釋變量進入回歸方程。,15,總體均值的置信區(qū)間,,,用,代替 可以得到統(tǒng)計量,,16,回歸系數(shù)的置信區(qū)間,,給定一置信水平,區(qū)間,為,水平上的置信區(qū)間。,例,,則,即,17,標(biāo)準(zhǔn)化即剔除自變量單位的影響,是指對變量,標(biāo)準(zhǔn)回歸系數(shù),,進行如下處理:,轉(zhuǎn)化為標(biāo)準(zhǔn)方程,于是原始方程,,,式中:,18,SPSS的實現(xiàn):Analyze菜單Regression項中選擇Linear命令。,,SPSS的實現(xiàn):Analyze菜單Regression項中選擇Linear命令。,**
6、 Method處下拉菜單,** WSL選項,** Statistics按鈕,** Plots按鈕,** Save按鈕,** Options按鈕,Enter:強行進入法,即所選自變量全部進入模型。 Remove:強制剔除法,即建立回歸方程時,根據(jù)設(shè)定的條件從回歸方程中剔除部分自變量。 Backward:向后剔除法,根據(jù)Option對話框中設(shè)定的判據(jù),先建立全模型,然后根據(jù)設(shè)置的判據(jù),每次剔除一個使方差分析中的F值最小的自變量,直到回歸方程中不再含有不符合判據(jù)的自變量為止。 Forward:向前選擇法。 Stepwise:逐步進入法,根據(jù)Option對話框中設(shè)定的判據(jù)及方差分析結(jié)果,選擇符合判據(jù)的
7、自變量與因變量相關(guān)程度最高的進入回歸方程。依據(jù) Forward選入自變量,依據(jù)Backward 將模型中F值最小且符合剔除判據(jù)的變量剔除,重復(fù),Method處下拉菜單,共有5個選項:,,WSL選項是存在異方差時,利用加權(quán)最小二乘法替代普通最小二乘法估計回歸模型參數(shù)。通過WSL可以選定一個變量作為加權(quán)變量。 在實際問題中,如果無法自行確定權(quán)重變量,可以用SPSS的權(quán)重估計來實現(xiàn)。,,Descriptives:輸出自變量和因變量的均值、 標(biāo)準(zhǔn)差、相關(guān)系數(shù)矩陣及單側(cè)檢驗概率。,Estimates:輸出與回歸系數(shù)相關(guān)統(tǒng)計量。有:回歸系數(shù)、回歸系數(shù)的標(biāo)準(zhǔn)誤差、標(biāo)準(zhǔn)回歸系數(shù)、T統(tǒng)計量和相應(yīng)的相伴概率、各
8、自變量的容忍度。,Confidence intervals:輸出每一個非標(biāo)準(zhǔn)化回歸系數(shù)95%的可信區(qū)間。,Covariance matix:輸出方程中各自變量間的相關(guān)系數(shù)矩陣及各變量的協(xié)方差矩陣。,Model fit:輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標(biāo)準(zhǔn)誤差,F(xiàn)檢驗的ANOVA方差分析表。,R squared change:當(dāng)回歸方程中引入或剔除一個自變量后,判定系數(shù)、F值產(chǎn)生的變化。,續(xù),Casewise diagnostics:輸出標(biāo)準(zhǔn)化殘差絕對值3的樣本數(shù)據(jù)點的相關(guān)信息,包括:標(biāo)準(zhǔn)化殘差、觀測值預(yù)測值、最小(最大)預(yù)測值、殘差、最小(最大)殘差以及它們的均值和標(biāo)準(zhǔn)差。 Outl
9、iers outside standard devistion:設(shè)置 奇異值的判據(jù),默認3倍的標(biāo)準(zhǔn)差。 All case:輸出所有樣本數(shù)據(jù)有關(guān)殘差值。,,Part and partial correlation:輸出方程中各自變量與因變量之間的簡單相關(guān)系數(shù)、偏相關(guān)系數(shù)與部分相關(guān)系數(shù)。,Collinearity diagnostics:多重共線性分析,輸出各自變量的容限度、方差膨脹因子、最小容忍度、特征值、條件指標(biāo)及方差比例等。,Durbin-Watson:輸出Durbin-watson檢驗值。,24,,Plots對話框用來檢驗殘差序列的正態(tài)性、隨機性和是否存在異方差現(xiàn)象。,Produce al
10、l partial plots:輸出每一個自變量殘差相對于因變量殘差的散布圖。,** ZPRED選項:標(biāo)準(zhǔn)化預(yù)測值。,** ZRESID選項:標(biāo)準(zhǔn)化殘差。,** DRESID選項:剔除殘差。,** ADJPRED選項:修正后預(yù)測值。,** SRESID選項:學(xué)生化殘差。,** SDRESID選項:學(xué)生化剔除殘差。,26,,Mahalanobis:保存Mahalanobis距離,Cooks:保存Cook距離,Leverage values:保存中心點杠桿值,Individual:保存一個觀測量上限與下限的預(yù)測區(qū)間。,Studentized:學(xué)生化殘差,Deleted:剔除殘差,Studentiz
11、ed deleted:學(xué)生剔除殘差,DfBeta(s):因排除一個特定的觀察值所引起的回歸系數(shù)的變化。若該值2,則被排除的觀測值有可能是影響點。,DfFit:因排除一個特定的觀測值所 引起的觀測值的變化。,,Use probalitlity of F:以回歸系數(shù)顯著性檢驗中各自變量的F統(tǒng)計量的相伴概率作為自變量是否引入模型或者從模型中剔除的標(biāo)準(zhǔn)。實際應(yīng)用中,應(yīng)使Entry值小于Remove值,否則,自變量一進入方程就會被立即剔除。,Use F value:以回歸系數(shù)顯著性檢驗中的各自變量的F統(tǒng)計量作為自變量進入模型或者從模型中剔除的標(biāo)準(zhǔn)。,Include constant in equatio
12、nF:表示回歸方程中將包含常數(shù)項。,29,30,31,32,多元線性回歸分析,一個被解釋變量(因變量),,的線性模型,,多個解釋變量(自變量),多元回歸的高斯假設(shè),,,多元回歸的種類,,全部強行進入回歸:所有自變量全部進入回歸模型,逐步回歸:所有的自變量依次進入回歸模型,,33,或者,多元回歸的高斯假設(shè),,(1) 為隨機向量,(2),(3),(4),包括,(5),為確定矩陣,,(6)秩,(7)行列式,遠離零。,34,逐步回歸,,,,,第一種方法,第二種方法,第三種方法,35,的顯著性概率,應(yīng)當(dāng)滿足:統(tǒng)計量的值,第一種方法,,最大的,統(tǒng)計量,在考慮,對已知的一群變量,回歸時,,從變量,中,逐步選
13、出對已解釋變差的貢獻,(即偏解釋變差)最大的變量,進入回歸方程。而對,已解釋變差的貢獻大小的判別依據(jù),是包含了偏,解釋變差的,。統(tǒng)計量,的值,先進入方程;最后一個進入方程的自變量,小于等于,選定的顯著性水平,。,36,第二種方法,,在剔除時,其統(tǒng)計量的值,大于選定的顯著性水平,先把,對所有的自變量,回歸,然后,逐步把,最小的,剔除出方程,所有剔除出方程,的,的顯著性概率,。,37,概率 所對照的顯著性水平,第三種方法,,的顯著性慨率,所對照的顯著性水平 則要取得,是一邊進、一邊出。,“進”變量的,的顯著性,通常取得大一些,,以便能夠有更多的,的外側(cè)概率(顯著性概率)小于,從而使較多的變量進入方
14、程。而“出”的變量,大于,“進”“出”方程,陷入死循環(huán)。,更大一些,以便能夠有較少的,的顯著性慨率,從而有更少的變量被剔除出方程,防止變量,注意,的自變量。因為每添加或,逐步添加法或逐步剔除法,都應(yīng)當(dāng)強調(diào),的顯著性概率,是否小于等于選定的顯著性水平,來決定是否作為,剔除一個變量都會引起所有回歸系數(shù)及統(tǒng)計量的,的變化。一次處理,會造成誤判。只有逐步,處理,才是恰當(dāng)?shù)摹?“逐步”,不能一次按照各個變量的統(tǒng)計量值,值,,注意,39,回歸分析是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。其用意是研究一個被解釋變量(因變量)與一個或多個解釋變量(自變量)之間的統(tǒng)計關(guān)系。解釋變量可以是刻度級、順序級、名義級的變量。不論是什么級別的數(shù)據(jù),都必須用數(shù)字(Numeric)型的來表示。 一、 一元線性回歸,一元線性回歸,只研究一個自變量與一個因變量之間的統(tǒng)計關(guān)系。,第一節(jié) 一元回歸分析,人均收入與人均食品支出關(guān)系的散點圖,例如,某企業(yè)產(chǎn)品廣告費和銷售收入資料如下,判斷廣告費和銷售收入之間關(guān)系密切程度如何?,Thank you !!!,感 謝 各 位!,這學(xué)期課就到這里!,