《《管理統(tǒng)計(jì)學(xué)》第十章.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《管理統(tǒng)計(jì)學(xué)》第十章.ppt(42頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第十章 回歸分析,一元回歸 多元回歸 逐步回歸,,,,2,一元回歸分析,二、回歸的涵義,一、回歸的起源,三、相關(guān)分析與回歸分析的關(guān)系,四、回歸分析的任務(wù),五、回歸分析的種類,,,,,,,3,一、回歸的起源,英國(guó)統(tǒng)計(jì)學(xué)家FGaiton。研究父母身高與其子女身高的遺傳問題時(shí),觀察了1078對(duì)夫婦。,,計(jì)算出的回歸直線方程為:,解釋了人類身高在一定時(shí)間內(nèi)相對(duì)穩(wěn)定的現(xiàn)象。,4,回歸:揭示出不確定數(shù)量關(guān)系的內(nèi)在數(shù)量變化規(guī)律,并通過一定的表達(dá)式描述數(shù)量之間的這種內(nèi)在關(guān)系的方法。,不確定性的函數(shù)關(guān)系,二、回歸的涵義,,數(shù)據(jù)之間的關(guān)系 函數(shù),,,,確定性的函數(shù)關(guān)系,回歸方程,,(1)相關(guān)分析的兩個(gè)變量必須都
2、是隨機(jī)變量; 回歸分析的因變量是隨機(jī)變量。 (2)相關(guān)分析的兩個(gè)變量是平等的;回歸分析的因變量是被解釋變量。解釋變量可以是刻度級(jí)、順序級(jí)、名義級(jí)的變量,不論是什么級(jí)別的數(shù)據(jù),都必須用數(shù)字(numeric)型的來表示。 (3)相關(guān)分析是揭示兩個(gè)變量的密切程度,通過相關(guān)系數(shù);回歸分析是揭示兩個(gè)變量的 內(nèi)在數(shù)量變化規(guī)律,通過回歸方程。,三、相關(guān)分析與回歸分析的關(guān)系,,二者側(cè)重的點(diǎn)和應(yīng)用的面不同:,6,四、回歸分析的任務(wù),,(1)通過分析大量的樣本數(shù)據(jù),確定變更量之間的數(shù)學(xué)表達(dá)式; (2)對(duì)確定的數(shù)學(xué)關(guān)系式的可信度進(jìn)行統(tǒng)計(jì)檢驗(yàn)找出對(duì)某一特定變量影響較為顯著的變量和不顯著的變量; (3)利用確定的數(shù)學(xué)關(guān)
3、系式,根據(jù)自變量預(yù)測(cè)或控制因變量的取值,并找出這種預(yù)測(cè)或控制的精確度。,7,五、回歸分析的種類,,一元線性回歸分析,多元線性回歸分析,線性回歸分析的種類,,8,回歸方程的顯著性檢驗(yàn),一元線性回歸分析,,二、一元線性回歸,一、一元線性回歸模型的設(shè)定,三、回歸系數(shù)的顯著性檢驗(yàn),四、回歸分析的置信區(qū)間,五、標(biāo)準(zhǔn)回歸系數(shù),,,,,,,回歸效果的檢驗(yàn),回歸系數(shù),,總體均值,方程的檢驗(yàn),一元線性回歸的SPSS實(shí)現(xiàn),,9,高斯假設(shè),一、一元線性回歸模型的設(shè)定,1.總體回歸模型:,2.樣本回歸模型:,總體回歸直線:,樣本回歸直線:,即,,10,高斯假設(shè),,(1) (2) (3) (4) (5) (6),。,分
4、布。正態(tài)性假設(shè);,為隨機(jī)變量;,等方差性假設(shè),即所有隨機(jī)誤差都具有相同方差,隨機(jī)擾動(dòng)項(xiàng)協(xié)方差等于零,,相互獨(dú)立。無序列相關(guān)假設(shè);,服從,獨(dú)立性假設(shè)或零均值假設(shè);,11,回歸方程的顯著性檢驗(yàn)F檢驗(yàn),,:回歸方程不顯著,:回歸方程顯著,:總離差平方和,:剩余平方和/殘差平方和,:回歸離差平方和,12,回歸效果的檢驗(yàn)判定相關(guān)系數(shù)檢驗(yàn),若全部觀測(cè)值都落在回歸直線上,則,若x完全無助于解釋y的變動(dòng),則,判定相關(guān)系數(shù)越接近1,表明回歸平方和占總離差平方和的比例越大,用x的變動(dòng)解釋y值變動(dòng)的部分就越多,回歸的效果就越好。,,F檢驗(yàn),13,回歸效果的檢驗(yàn)F檢驗(yàn),,式中:,:樣本容量,:自變量的個(gè)數(shù),:判定系數(shù)
5、,14,回歸系數(shù)的顯著性檢驗(yàn)T檢驗(yàn),,,成立,即,當(dāng),時(shí),顯著異于0。,針對(duì)回歸系數(shù)的,統(tǒng)計(jì)量的顯著性檢驗(yàn)決定了相,應(yīng)的變量能否作為解釋變量進(jìn)入回歸方程。,15,總體均值的置信區(qū)間,,,用,代替 可以得到統(tǒng)計(jì)量,,16,回歸系數(shù)的置信區(qū)間,,給定一置信水平,區(qū)間,為,水平上的置信區(qū)間。,例,,則,即,17,標(biāo)準(zhǔn)化即剔除自變量單位的影響,是指對(duì)變量,標(biāo)準(zhǔn)回歸系數(shù),,進(jìn)行如下處理:,轉(zhuǎn)化為標(biāo)準(zhǔn)方程,于是原始方程,,,式中:,18,SPSS的實(shí)現(xiàn):Analyze菜單Regression項(xiàng)中選擇Linear命令。,,SPSS的實(shí)現(xiàn):Analyze菜單Regression項(xiàng)中選擇Linear命令。,**
6、 Method處下拉菜單,** WSL選項(xiàng),** Statistics按鈕,** Plots按鈕,** Save按鈕,** Options按鈕,Enter:強(qiáng)行進(jìn)入法,即所選自變量全部進(jìn)入模型。 Remove:強(qiáng)制剔除法,即建立回歸方程時(shí),根據(jù)設(shè)定的條件從回歸方程中剔除部分自變量。 Backward:向后剔除法,根據(jù)Option對(duì)話框中設(shè)定的判據(jù),先建立全模型,然后根據(jù)設(shè)置的判據(jù),每次剔除一個(gè)使方差分析中的F值最小的自變量,直到回歸方程中不再含有不符合判據(jù)的自變量為止。 Forward:向前選擇法。 Stepwise:逐步進(jìn)入法,根據(jù)Option對(duì)話框中設(shè)定的判據(jù)及方差分析結(jié)果,選擇符合判據(jù)的
7、自變量與因變量相關(guān)程度最高的進(jìn)入回歸方程。依據(jù) Forward選入自變量,依據(jù)Backward 將模型中F值最小且符合剔除判據(jù)的變量剔除,重復(fù),Method處下拉菜單,共有5個(gè)選項(xiàng):,,WSL選項(xiàng)是存在異方差時(shí),利用加權(quán)最小二乘法替代普通最小二乘法估計(jì)回歸模型參數(shù)。通過WSL可以選定一個(gè)變量作為加權(quán)變量。 在實(shí)際問題中,如果無法自行確定權(quán)重變量,可以用SPSS的權(quán)重估計(jì)來實(shí)現(xiàn)。,,Descriptives:輸出自變量和因變量的均值、 標(biāo)準(zhǔn)差、相關(guān)系數(shù)矩陣及單側(cè)檢驗(yàn)概率。,Estimates:輸出與回歸系數(shù)相關(guān)統(tǒng)計(jì)量。有:回歸系數(shù)、回歸系數(shù)的標(biāo)準(zhǔn)誤差、標(biāo)準(zhǔn)回歸系數(shù)、T統(tǒng)計(jì)量和相應(yīng)的相伴概率、各
8、自變量的容忍度。,Confidence intervals:輸出每一個(gè)非標(biāo)準(zhǔn)化回歸系數(shù)95%的可信區(qū)間。,Covariance matix:輸出方程中各自變量間的相關(guān)系數(shù)矩陣及各變量的協(xié)方差矩陣。,Model fit:輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標(biāo)準(zhǔn)誤差,F(xiàn)檢驗(yàn)的ANOVA方差分析表。,R squared change:當(dāng)回歸方程中引入或剔除一個(gè)自變量后,判定系數(shù)、F值產(chǎn)生的變化。,續(xù),Casewise diagnostics:輸出標(biāo)準(zhǔn)化殘差絕對(duì)值3的樣本數(shù)據(jù)點(diǎn)的相關(guān)信息,包括:標(biāo)準(zhǔn)化殘差、觀測(cè)值預(yù)測(cè)值、最小(最大)預(yù)測(cè)值、殘差、最小(最大)殘差以及它們的均值和標(biāo)準(zhǔn)差。 Outl
9、iers outside standard devistion:設(shè)置 奇異值的判據(jù),默認(rèn)3倍的標(biāo)準(zhǔn)差。 All case:輸出所有樣本數(shù)據(jù)有關(guān)殘差值。,,Part and partial correlation:輸出方程中各自變量與因變量之間的簡(jiǎn)單相關(guān)系數(shù)、偏相關(guān)系數(shù)與部分相關(guān)系數(shù)。,Collinearity diagnostics:多重共線性分析,輸出各自變量的容限度、方差膨脹因子、最小容忍度、特征值、條件指標(biāo)及方差比例等。,Durbin-Watson:輸出Durbin-watson檢驗(yàn)值。,24,,Plots對(duì)話框用來檢驗(yàn)殘差序列的正態(tài)性、隨機(jī)性和是否存在異方差現(xiàn)象。,Produce al
10、l partial plots:輸出每一個(gè)自變量殘差相對(duì)于因變量殘差的散布圖。,** ZPRED選項(xiàng):標(biāo)準(zhǔn)化預(yù)測(cè)值。,** ZRESID選項(xiàng):標(biāo)準(zhǔn)化殘差。,** DRESID選項(xiàng):剔除殘差。,** ADJPRED選項(xiàng):修正后預(yù)測(cè)值。,** SRESID選項(xiàng):學(xué)生化殘差。,** SDRESID選項(xiàng):學(xué)生化剔除殘差。,26,,Mahalanobis:保存Mahalanobis距離,Cooks:保存Cook距離,Leverage values:保存中心點(diǎn)杠桿值,Individual:保存一個(gè)觀測(cè)量上限與下限的預(yù)測(cè)區(qū)間。,Studentized:學(xué)生化殘差,Deleted:剔除殘差,Studentiz
11、ed deleted:學(xué)生剔除殘差,DfBeta(s):因排除一個(gè)特定的觀察值所引起的回歸系數(shù)的變化。若該值2,則被排除的觀測(cè)值有可能是影響點(diǎn)。,DfFit:因排除一個(gè)特定的觀測(cè)值所 引起的觀測(cè)值的變化。,,Use probalitlity of F:以回歸系數(shù)顯著性檢驗(yàn)中各自變量的F統(tǒng)計(jì)量的相伴概率作為自變量是否引入模型或者從模型中剔除的標(biāo)準(zhǔn)。實(shí)際應(yīng)用中,應(yīng)使Entry值小于Remove值,否則,自變量一進(jìn)入方程就會(huì)被立即剔除。,Use F value:以回歸系數(shù)顯著性檢驗(yàn)中的各自變量的F統(tǒng)計(jì)量作為自變量進(jìn)入模型或者從模型中剔除的標(biāo)準(zhǔn)。,Include constant in equatio
12、nF:表示回歸方程中將包含常數(shù)項(xiàng)。,29,30,31,32,多元線性回歸分析,一個(gè)被解釋變量(因變量),,的線性模型,,多個(gè)解釋變量(自變量),多元回歸的高斯假設(shè),,,多元回歸的種類,,全部強(qiáng)行進(jìn)入回歸:所有自變量全部進(jìn)入回歸模型,逐步回歸:所有的自變量依次進(jìn)入回歸模型,,33,或者,多元回歸的高斯假設(shè),,(1) 為隨機(jī)向量,(2),(3),(4),包括,(5),為確定矩陣,,(6)秩,(7)行列式,遠(yuǎn)離零。,34,逐步回歸,,,,,第一種方法,第二種方法,第三種方法,35,的顯著性概率,應(yīng)當(dāng)滿足:統(tǒng)計(jì)量的值,第一種方法,,最大的,統(tǒng)計(jì)量,在考慮,對(duì)已知的一群變量,回歸時(shí),,從變量,中,逐步選
13、出對(duì)已解釋變差的貢獻(xiàn),(即偏解釋變差)最大的變量,進(jìn)入回歸方程。而對(duì),已解釋變差的貢獻(xiàn)大小的判別依據(jù),是包含了偏,解釋變差的,。統(tǒng)計(jì)量,的值,先進(jìn)入方程;最后一個(gè)進(jìn)入方程的自變量,小于等于,選定的顯著性水平,。,36,第二種方法,,在剔除時(shí),其統(tǒng)計(jì)量的值,大于選定的顯著性水平,先把,對(duì)所有的自變量,回歸,然后,逐步把,最小的,剔除出方程,所有剔除出方程,的,的顯著性概率,。,37,概率 所對(duì)照的顯著性水平,第三種方法,,的顯著性慨率,所對(duì)照的顯著性水平 則要取得,是一邊進(jìn)、一邊出。,“進(jìn)”變量的,的顯著性,通常取得大一些,,以便能夠有更多的,的外側(cè)概率(顯著性概率)小于,從而使較多的變量進(jìn)入方
14、程。而“出”的變量,大于,“進(jìn)”“出”方程,陷入死循環(huán)。,更大一些,以便能夠有較少的,的顯著性慨率,從而有更少的變量被剔除出方程,防止變量,注意,的自變量。因?yàn)槊刻砑踊?逐步添加法或逐步剔除法,都應(yīng)當(dāng)強(qiáng)調(diào),的顯著性概率,是否小于等于選定的顯著性水平,來決定是否作為,剔除一個(gè)變量都會(huì)引起所有回歸系數(shù)及統(tǒng)計(jì)量的,的變化。一次處理,會(huì)造成誤判。只有逐步,處理,才是恰當(dāng)?shù)摹?“逐步”,不能一次按照各個(gè)變量的統(tǒng)計(jì)量值,值,,注意,39,回歸分析是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。其用意是研究一個(gè)被解釋變量(因變量)與一個(gè)或多個(gè)解釋變量(自變量)之間的統(tǒng)計(jì)關(guān)系。解釋變量可以是刻度級(jí)、順序級(jí)、名義級(jí)的變量。不論是什么級(jí)別的數(shù)據(jù),都必須用數(shù)字(Numeric)型的來表示。 一、 一元線性回歸,一元線性回歸,只研究一個(gè)自變量與一個(gè)因變量之間的統(tǒng)計(jì)關(guān)系。,第一節(jié) 一元回歸分析,人均收入與人均食品支出關(guān)系的散點(diǎn)圖,例如,某企業(yè)產(chǎn)品廣告費(fèi)和銷售收入資料如下,判斷廣告費(fèi)和銷售收入之間關(guān)系密切程度如何?,Thank you !!!,感 謝 各 位!,這學(xué)期課就到這里!,