《《管理統(tǒng)計學(xué)》第四章.ppt》由會員分享,可在線閱讀,更多相關(guān)《《管理統(tǒng)計學(xué)》第四章.ppt(38頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、,第4章 抽樣與參數(shù)估計,一、樣本平均數(shù)的抽樣分布,(1)總體分布,(2)樣本分布,樣本,樣本均值的概率分布分布是:,樣本均值的均值是:,,(1)如果原來的總體呈正態(tài)分布,則無論樣本容量為多大,樣本均值的抽樣分布都呈正態(tài)分布。 (2)如果原來的總體不呈正態(tài)分布,且樣本容量不小于30,則樣本均值的抽樣分布近似于正態(tài)分布。,例如,表示“生產(chǎn)線上生產(chǎn)出來的零件的直徑”的隨機變量X,通常服從正態(tài)分布。,比率(頻率)分布,均勻分布,,總體分布的特例,(1)當(dāng)一個總體的變量的取值都相同時,該隨機變量就服從均勻分布。,(2)對于有限總體而言,相同個體重復(fù)的比率,就是個體出現(xiàn)的概率。因此有限總體的不同個體的比
2、率分布(頻率分布),就是有限總體的概率分布。,例如,一個總體包括:紅色球4枚、藍色球5枚、黃色球7枚,共16枚。紅色球出現(xiàn)的比率是 ,藍色球是 ,黃色球是 。這也是表示顏色的隨機變量X的概率分布。,不重復(fù)抽樣,參數(shù)估計,大致判斷出總體分布的類型后,用樣本參數(shù)推斷總體分布的相應(yīng)參數(shù)。,1.點估計,2.區(qū)間估計,,重復(fù)抽樣,不同樣本算得的 ? 的估計值不同,因此 還希望根據(jù)所給的樣本確定一個隨機區(qū)間, 使其包含參數(shù)真值的概率達到指定的要求。,,,均值,方差,方差未知,方差已知,區(qū)間估計的種類,區(qū)間 估計,,均值,均值差,,,重復(fù)抽樣,,不重復(fù)抽樣,,方差已知,方差未知且相等,方差未知且任意,方差未
3、知,方差已知,一個總體,兩個總體,方差,,,方差比,P( X ﹥za)﹦a,P( X ﹥za/2)﹦a,重復(fù)抽樣區(qū)間估計的理論基礎(chǔ),若 X 服從標(biāo)準(zhǔn)正態(tài)分布,那么:,,,,一個總體方差已知時均值的置信區(qū)間,P( ﹥za/2)﹦a,需要的定理,若隨機變量,則有如下定理成立:,~,因為 服從標(biāo)準(zhǔn)正態(tài)分布,所以:,P( ﹥za)﹦a,,,~,~,單側(cè)置信區(qū)間,,雙側(cè)置信區(qū)間:,均值的標(biāo)準(zhǔn)誤差(抽樣平均誤差),即任何一個分布函數(shù)的標(biāo)準(zhǔn)差,,是原來分布函數(shù)標(biāo)準(zhǔn)差的,分之一,或者說,分布的方差,就是,分布方差的,分之一。,均值的標(biāo)準(zhǔn)誤差又稱為抽樣平均誤差或均值標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)誤。,樣本均值(Sam
4、ple Mean),樣本均值 又稱樣本平均數(shù)僅適用于刻度級的數(shù)據(jù)。,①未分組數(shù)列,②分組數(shù)列,:組中值,,:頻次或次數(shù),加權(quán)平均數(shù),簡單平均數(shù),例題,設(shè)某廠生產(chǎn)的燈泡壽命X~N(?,1002),現(xiàn)隨機抽取5只,測量其壽命如下:1455,1502,1370,1610,1430,則該廠燈泡的平均使用壽命的估計值為多少?,某工業(yè)企業(yè)有職工10000人,其中工人8000人,干部2000人,為了了解職工家庭生活狀況,在工人和干部兩個組均以5%的比例抽選職工進行調(diào)查,結(jié)果如下表:,一個總體方差未知時均值的置信區(qū)間,需要的定理,若隨機變量,則有如下定理成立:,~,~,,P( ﹥ta(n-1))﹦a,P(
5、 ﹥ta/2(n-1))﹦a,,,方差和標(biāo)準(zhǔn)差,樣本方差 的計算公式如下:,樣本標(biāo)準(zhǔn)差(Standard Deviation)s的定義是:,①,②,①,②,均值的標(biāo)準(zhǔn)誤差(抽樣平均誤差),即任何一個分布函數(shù)的標(biāo)準(zhǔn)差,,是原來分布函數(shù)標(biāo)準(zhǔn)差的,分之一,或者說,分布的方差,就是,分布方差的,分之一。,均值的標(biāo)準(zhǔn)誤差又稱為抽樣平均誤差或均值標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)誤。,一個總體方差的區(qū)間估計,需要的定理,若隨機變量,則有如下定理成立:,~,~,P( ﹥ (n-1))﹦a,,,?2,兩個總體均值的置信區(qū)間,★已知總體方差, 均值差的推算;,需要的定理,若隨機變量,~,則:,~,★未知總體方差,但 = ,均
6、值差推斷,需要的定理,若隨機變量,★未知總體方差,但 ≠ ,均值差推斷,需要的定理,若隨機變量,兩個總體方差比,的置信區(qū)間 ( ?1 , ?2 未知),需要的定理,若隨機變量,因此, 方差比,的置信區(qū)間為:,? 反映了估計的可靠度, ? 越小, 越可靠.,置信區(qū)間的長度 反映了估計精度,? 越小, 1- ? 越大, 估計的可靠度越高,但,? 確定后, 置信區(qū)間 的選取方法不唯一, 常選最小的一個.,幾點說明,越小, 估計精度越高.,這時, 往往增大, 因而估計精度降低.,當(dāng)置信區(qū)間為,區(qū)間的長度為,—— 達到最短,選取置信區(qū)間時,為何要取 ?,取 ? = 0.05,例2 某廠利用
7、兩條自動化流水線罐裝番茄醬?,F(xiàn)分別從兩條流水線上抽取了容量分別為13與17的兩個相互獨立的樣本:,與,已知:,假設(shè)兩條流水線上罐裝的番茄醬的重量都服從正態(tài)分布, 其均值分別為 ? 1與 ? 2 , 則,(1) 若它們的方差相同,,求均值差,的置信度為0.95 的置信區(qū)間;,(2) 求方差比的0.95的置信區(qū)間。,SPSS在參數(shù)估計中的應(yīng)用,點估計,①Analyze,,Descriptive Statistics,Frequencies,,,進入頻次分析模塊Frequencies,②Analyze,,Descriptive Statistics,Descriptives,,,進入描述統(tǒng)計模塊De
8、scriptives,點估計,區(qū)間估計,Analyze,,Descriptive Statistics,,Explore,Spread vs.Level with Levene Test:輸出散布——層次圖,包括回歸直線斜率及方差齊次性的Levene檢驗。若無分組變量,此選項無效。,Transformed:對原始數(shù)據(jù)進行轉(zhuǎn)換,有:三次方(Cube)、平方(Square)、平方根(1/Square root)取對數(shù)(Logarithm)。,Power estimation:轉(zhuǎn)換冪值估計,表示對每一組數(shù)據(jù)產(chǎn)生一個中位數(shù)范圍的自然對數(shù)與四分位數(shù)范圍的自然對數(shù)的散點圖;,None:不生成散布——層次圖
9、;,Statistics的界面解釋,Descriptives:輸出均值的95%置信區(qū)間、中位數(shù)、 眾數(shù)、均值標(biāo)準(zhǔn)差、方差、標(biāo)準(zhǔn)差、Min、Max、 R、四分位距、峰度系數(shù)和斜度系數(shù)。,M-estimators:做中心趨勢的粗略最大似然確定, 輸出4個不同權(quán)重的最大似然確定數(shù)。當(dāng)數(shù)據(jù)分布 均勻且兩尾巴較長或數(shù)據(jù)中存在極端值時,可以 提供比較合理的估計。,Outliers:輸出5個最大值和最小值。,Percentiles:輸出第5%、10%、25%、50%、 75%、90%和95%百分位數(shù)。,第四節(jié) 樣本容量的確定,一個總體情形的樣本容量確定 兩個總體情形的樣本容量確定,例1 某市居民人均月消費支出的標(biāo)準(zhǔn)差為2000元,假定想估計人均月消費支出9%的置信區(qū)間,希望允許的誤差為100元,應(yīng)抽取多大的樣本容量?,例2 欲在置信水平95%下對某兩個城市旅游人均消費額之差進行估計,根據(jù)以往的資料知道,兩城市人均消費額的標(biāo)準(zhǔn)差分別為400元和350元,如果允許的誤差為50元,應(yīng)抽取的兩個樣本的容量應(yīng)是多少?,