《《管理統(tǒng)計學(xué)》第九章.ppt》由會員分享,可在線閱讀,更多相關(guān)《《管理統(tǒng)計學(xué)》第九章.ppt(33頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第九章 普通相關(guān)分析,總體相關(guān)與樣本相關(guān) 偏相關(guān) 品質(zhì)相關(guān),相關(guān)分析,變量之間的相關(guān)關(guān)系,確定型的關(guān)系—函數(shù)關(guān)系,不確定型的關(guān)系—相關(guān)關(guān)系,,相關(guān)分析是研究變量之間不確定關(guān)系的統(tǒng)計方法。,其中最為常見的是兩個或多個隨機(jī)變量之間的線,性相關(guān)關(guān)系。,相關(guān)關(guān)系的內(nèi)容有:,★ 普通相關(guān)關(guān)系,★ 品質(zhì)相關(guān),★ 一、普通相關(guān)關(guān)系的種類,★ 二、普通相關(guān)系數(shù)的種類及計算,★ 三、普通相關(guān)系數(shù)的幾何解釋,★ 五、普通相關(guān)系數(shù)的直觀散點(diǎn)圖,★ 六、普通相關(guān)系數(shù)異于零的顯著性檢驗,★ 四、普通相關(guān)系數(shù)的取值范圍,★ 七、相關(guān)指數(shù),普通相關(guān)關(guān)系,(一)按相關(guān)程度劃分,完全相關(guān),不完全相關(guān),不相關(guān),,(二)按相關(guān)方向
2、劃分,正相關(guān):同方向變動,負(fù)相關(guān):反方向變動,,(三)按相關(guān)形式劃分,線性相關(guān),非線性相關(guān),,(四)按變量多少劃分,單相關(guān):兩變量間的相關(guān),復(fù)相關(guān),,偏相關(guān),(五)按相關(guān)性質(zhì)劃分,真實(shí)相關(guān),虛假相關(guān),,Kendall’s tua-b 相關(guān)系數(shù),二、普通相關(guān)系數(shù)的種類及計算,總體相關(guān)系數(shù),(一)積矩相關(guān)系數(shù),,樣本相關(guān)系數(shù),(參數(shù)相關(guān)),(二)等級相關(guān)系數(shù),,等級相關(guān)系數(shù)適用于順序級和刻度級的配對樣本。,(非參數(shù)相關(guān)),Spearman相關(guān)系數(shù),(三)偏相關(guān)系數(shù),(四)復(fù)相關(guān)系數(shù),1.總體相關(guān)系數(shù),2.樣本相關(guān)系數(shù),(一)積矩相關(guān)系數(shù),適用于等間隔測度的數(shù)據(jù)或比例數(shù)據(jù)之間的線性關(guān)系的密切程度。,
3、1.Spearman相關(guān)系數(shù),當(dāng)n﹥30時則計算統(tǒng)計量:,(二)等級相關(guān)系數(shù),是一種非參數(shù)測度,根據(jù)數(shù)據(jù)的秩使用Pearson相關(guān)系數(shù)公式計算的,而不是根據(jù)實(shí)際值計算的。它適合有序數(shù)據(jù)或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)。,2.Kendall’s tua-b 相關(guān)系數(shù),當(dāng)n﹥30時則計算統(tǒng)計量:,V是利用變量的秩數(shù)據(jù)計算而得的非一致對數(shù)目。,(二)等級相關(guān)系數(shù),第二中求法:,也是一種非參數(shù)測度,依然根據(jù)兩個有序變量或兩個秩變量間的關(guān)系程度的測度。但分析時考慮了節(jié)點(diǎn),即秩次相同的點(diǎn)。,2.剔除了兩個變量 、 的影響后,兩個變量,式中,,(三)偏相關(guān)系數(shù),1.剔除了一個變量Z的影響后,兩個變量X、Y間
4、,是普通相關(guān)系數(shù)。,,x、 y 之間的偏相關(guān)系數(shù),(四)復(fù)相關(guān)系數(shù),一個變量與多個變量之間的線性相關(guān)程度的指標(biāo)。樣本復(fù)相關(guān)系數(shù)的定義式如下:,圖中,,三、普通相關(guān)系數(shù)的幾何解釋,與,即,,表示向量,一組,角的余弦就是配對樣本,的相關(guān)系數(shù)。,的模。,樣本,可以視為一個向量。,相關(guān)系數(shù)為0的兩個隨機(jī)變量,不相關(guān),但不,一定相互獨(dú)立。,相關(guān)系數(shù)為0的兩個服從正態(tài)分布的隨機(jī)變量, 一定相互獨(dú)立。,相互獨(dú)立的隨機(jī)變量間的相關(guān)系數(shù),必然為0。,,,,四、普通相關(guān)系數(shù)的取值范圍,樣本相關(guān)系數(shù)也是區(qū)間[-1,1]之間的一個量。,五、普通相關(guān)系數(shù)的直觀散點(diǎn)圖,設(shè)有配對樣本觀察值,與,則其直觀散點(diǎn)圖中,,,,標(biāo)是
5、(,)。,每個點(diǎn)的平面坐,散點(diǎn)圖,散點(diǎn)圖(Graphs Scatter),,散點(diǎn)圖,Simple:簡單散點(diǎn)圖,顯示兩個變量關(guān)系的圖;,Overlay:重疊散點(diǎn)圖,顯示多個配對變量關(guān)系的;,Matrix:矩陣散點(diǎn)圖,以矩陣形式顯示多個變量之間的關(guān)系;,3-D:三維散點(diǎn)圖,顯示三個變量關(guān)系的散點(diǎn)圖。,檢驗的種類,偏相關(guān)系數(shù)的檢驗,六、相關(guān)系數(shù)異于零的顯著性檢驗,(一)積矩相關(guān)系數(shù)的檢驗,式中,,是樣本容量,,是簡單相關(guān)系數(shù)(Pearson),檢驗統(tǒng)計量,~,,積矩相關(guān)系數(shù)的檢驗,等級相關(guān)系數(shù)的檢驗,這是一個雙尾檢驗問題,設(shè)定假設(shè):,則拒絕,反之接受。,是剔除了的變量數(shù),,是,式中,,是樣本容量,
6、,~,檢驗統(tǒng)計量:,(三)偏相關(guān)系數(shù)的檢驗,偏相關(guān)系數(shù)。,(二)等級相關(guān)系數(shù)的檢驗。同積矩相關(guān)系數(shù)。,七、相關(guān)指數(shù),變量之間存在的非線性相關(guān)的強(qiáng)弱,難以用簡單相關(guān)系數(shù)作判斷。相關(guān)指數(shù),是對非線性回歸模型擬合時得到的可決系數(shù)。,普通相關(guān)分析的SPSS的實(shí)現(xiàn)過程:Analyze菜單Correlate項中選擇Bivariate或Partial或Distances命令。,Correlation Coefficients:相關(guān)系數(shù)選擇對話框,Pearson:簡單相關(guān)系數(shù),Kandell’s tu-b:相關(guān)系數(shù),依據(jù)配對樣本之差的正負(fù)號的個數(shù),計算的相關(guān)系數(shù)。,Spearman:等級相關(guān)系數(shù),Test o
7、f Significance:相關(guān)系數(shù)的顯著性檢驗。正相關(guān)關(guān)系一般選擇單尾,否則,一般選擇雙尾。,界面解釋,Flag Significant Correlation:是否用星號標(biāo)明輸出結(jié)果的顯著性。,Means and Standard Deviations:輸出所選變量的均值、標(biāo)準(zhǔn)差和樣本個數(shù)。,Cross –Product Deviations and Covariances:輸出平方和及協(xié)方差。,** 問題的提出,** 品質(zhì)相關(guān)的實(shí)質(zhì),** Fisher判別法,** 當(dāng)只有一個自由度(且,)時Yete矯正法,** 品質(zhì)相關(guān)模式概括,** 品質(zhì)相關(guān)的判別方法,品質(zhì)相關(guān)與SPSS處理,(1)
8、不同文化程序的人對某一(些)政策的態(tài)度,是否相關(guān)? (2)不同富裕程度的農(nóng)民對土地政策的態(tài)度,是否相關(guān)? (3)不同地區(qū)的人與不同工作作風(fēng),是否相關(guān)? (4)不同培訓(xùn)方法與培訓(xùn)后的業(yè)績增長,是否相關(guān)? (5)不同經(jīng)歷的人與他們對某一問題的看法,是否相關(guān)? (6)不同層面的客戶的偏好是否與產(chǎn)品不同包裝相關(guān)? (7)不同民族與某種習(xí)慣是否相關(guān)? (8)不同觀念(工作作風(fēng))與企業(yè)在不同領(lǐng)域的發(fā)展是否相關(guān)?等等。 除此外,類似問題存農(nóng)業(yè)、生物、醫(yī)藥科學(xué)中也有廣泛的應(yīng)用。例如,抽煙與癌癥是否相關(guān)。 飲食習(xí)慣與某種病癥是否相關(guān),都是會時常 遇到的問題。,品質(zhì)相關(guān)分析在社會科學(xué)中的用途很廣,如:,表中,
9、表示處于交叉位置的人數(shù)(總體中的個體數(shù))。每個個體至少有2個特征(變量)。,品質(zhì)相關(guān)模式概括,非要用品質(zhì)相關(guān)來處理不可的問題,在個體的兩個特征中,至少有一個是名義級的變量。,)的一組容量為n的樣本,檢驗問題,就轉(zhuǎn)化為檢驗:,區(qū)間,為,將,個區(qū)間,,…;,設(shè),對任何兩個隨機(jī)變量x、y,如果,對任何,隨機(jī)變量X、Y之間是相互獨(dú)立的。,得到一個二維總體(,,,,,(,,,;,,,,,進(jìn)而,將,的取值范圍,分為,的取值范圍分為s個區(qū)間,。,記,屬于區(qū)間,并且,屬于,區(qū)間,的概率,,,。,而,屬于區(qū)間,的概率,。,為,。,于是,隨機(jī)變量,,,之間是相互獨(dú)立的,,,的概率為,。,屬于,、,;,是否成立的問
10、題,:,在假設(shè),中,,與,都是未知參數(shù),但是由于,知參數(shù)的個數(shù)是,。,,,共,,,,,個,少了兩個自由度,,,所以,,,真正要估計的未,。,都成立則;,對顯著性水平,接受備擇假設(shè),互獨(dú)立(不相關(guān)),將,可以用極大似然法得出未知參數(shù)的估計值,,,于是轉(zhuǎn)化為:,自由度是,對于本問題就是,在,的假設(shè)下,,:,。,“,”,,與,的估計值代,~,試,就是各個交叉位置上的理想頻次,”,若,則接受零假設(shè),因素與狀態(tài)相,≥,則拒絕零假設(shè),因素與狀態(tài)顯著相關(guān)。,入上式:,自由度是,。,“,。,,,,,。,,,,,,,,,,,中,如果總體,服從二維正態(tài)分布,參數(shù)均未知,與,相互獨(dú)立,相互獨(dú)立的檢驗問題是:,:,:
11、,設(shè),,為,的極大似然估計值,則,~,于是我們可以用,統(tǒng)計量來完成上述假設(shè)檢驗:,的顯著性概率(外側(cè)概率)與顯著性水平,較,判斷拒絕還是接受,這是一個雙尾檢驗問題。,,,其中,那么,,,,,等價于,,,。,于是,,,計值,用統(tǒng),比,。,的值產(chǎn)生較大偏,分布是連續(xù)的,偏差較大,時,由于,按照公式:,在自由度為1時,,,而這里處理的是離散問題,,,,,所計算的統(tǒng)計量的值,就會與,,,差,,,特別是在,,,,,需要矯正,。,給出了矯正公式,Yete,:,普通相關(guān)分析的SPSS的實(shí)現(xiàn)過程:Analyze菜單Correlate項中選擇Bivariate或Partial或Distances命令。,品質(zhì)相關(guān)分析的SPSS的實(shí)現(xiàn)過程:Analyze菜單Descriptive Statistics項中選擇Crosstabs命令。,