《管理統(tǒng)計(jì)學(xué)》馬慶國著.ppt
《《管理統(tǒng)計(jì)學(xué)》馬慶國著.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《管理統(tǒng)計(jì)學(xué)》馬慶國著.ppt(55頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
第四章總體分布 樣本分布與參數(shù)估計(jì) 4 1總體分布與樣本分布 一 總體 母體 反映總體特征的隨機(jī)變量的取值的全體 總體分布 母體分布 反映總體特征的隨機(jī)變量的概率分布 從無限次隨機(jī)抽取 然后放回 的角度看 表征一個(gè)總體特征的變量 指標(biāo) 都可以視為隨機(jī)變量 有限總體的概率分布 就是有限總體中不同個(gè)體的比率 頻率 分布 二 隨機(jī)樣本與樣本觀測值 樣本數(shù)據(jù) 1 隨機(jī)樣本表征n次抽取個(gè)體的隨機(jī)抽樣的一組隨機(jī)變量X1 X2 Xn 2 樣本觀測值n次隨機(jī)抽樣的結(jié)果 x1 x2 xn 稱為隨機(jī)樣本X1 X2 Xn的樣本觀測值 n稱為隨機(jī)樣本向量 X1 X2 Xn 的維度 即自由度 3 樣本 累積 分布函數(shù)設(shè)樣本觀測值x1 x2 xnki為小于xi 1的樣本值出現(xiàn)的累積頻次 n為樣本容量 則可得樣本累積頻率分布函數(shù)如下 樣本累積頻率分布函數(shù) 又稱樣本 累積 分布函數(shù) 樣本 累積 分布函數(shù)Fn x 是對(duì)總體的累積分布函數(shù)F x 的近似 n越大 Fn x 對(duì)F x 的近似越好 樣本分布與總體分布 格利文科 Glivenko 定理 樣本分布與總體分布的關(guān)系 定理 當(dāng)樣本容量n趨于無窮大時(shí) Fn x 以概率1 關(guān)于x 均勻地收斂于F x 該定理是運(yùn)用樣本推斷總體的理論依據(jù) 定理的數(shù)學(xué)表達(dá)為 隨機(jī)樣本的均值函數(shù)和方差函數(shù)都是一個(gè)隨機(jī)變量 樣本數(shù)據(jù)的樣本均值x是隨機(jī)變量X的觀測值 樣本數(shù)據(jù)的樣本方差s2是隨機(jī)變量S2的觀測值 隨機(jī)樣本的均值函數(shù) 隨機(jī)樣本的方差函數(shù) 三 統(tǒng)計(jì)量與統(tǒng)計(jì)量的分布統(tǒng)計(jì)量定義 統(tǒng)計(jì)量是不含未知參數(shù)的 隨機(jī)樣本X1 X2 Xn的函數(shù) 統(tǒng)計(jì)量的值的定義 統(tǒng)計(jì)量的值是不含未知參數(shù)的 樣本觀測值x1 x2 xn的函數(shù) 四 由標(biāo)準(zhǔn)正態(tài)分布N 0 1 的隨機(jī)樣本所引出的幾個(gè)重要統(tǒng)計(jì)量分布 2 t與F分布1 2 n 分布的構(gòu)成設(shè)隨機(jī)變量X服從N 0 1 分布 X1 X2 Xn為X樣本 則 2 X2i X21 X22 X2n服從自由度為n的 2分布 記為 2 2 n 2 n 分布的均值E 2 n 方差D 2 2n n 1 n 4 n 10 2 n 分布圖 2 n 密度函數(shù) 其中 n為自由度 n 2 為珈瑪函數(shù) 是一個(gè)含參數(shù)n 2的積分 為 2 t分布自由度為n的t分布 記為t n 是由N 0 1 分布和 2 n 分布組成的 其表達(dá)式為 其中 X服從N 0 1 Y服從 2 n 分布 且X與Y相互獨(dú)立 密度函數(shù)為 t分布圖 3 F分布F分布是由兩個(gè) 2分布之比組成的 服從F m n 其中 U服從 2 m V服從 2 n m 100 n 20 m 15 n 20 重要性質(zhì) 密度函數(shù)形式為 五 由一般正態(tài)分布的隨機(jī)樣本所構(gòu)成的若干重要統(tǒng)計(jì)量的分布定理 若X1 X2 Xn是正態(tài)總體N 2 的一個(gè)隨機(jī)樣本 則樣本均值函數(shù)和樣本方差函數(shù) 滿足如下性質(zhì) 1 X服從N 2 n 分布 2 X與S2相互獨(dú)立 3 服從N 0 1 分布 4 服從 2 n 1 分布 5 服從t n 1 分布 1 服從N 0 1 6 服從 2 n 分布 定理 若X1 X2 Xn1和Y1 Y2 Yn2分別是正態(tài)總體N 1 12 和N 2 22 的一個(gè)隨機(jī)樣本 且它們相互獨(dú)立 則滿足如下性質(zhì) 3 服從F n1 1 n2 1 其中 S12是容量為n1的X的樣本方差 S22是容量為n2的Y的樣本方差 2 服從t n1 n2 2 1 2 4 服從F n1 n2 六 任意分布的隨機(jī)樣本均值函數(shù)的均值與方差設(shè) 隨機(jī)變量X服從任何均值為 標(biāo)準(zhǔn)差為 的分布 X是隨機(jī)樣本X1 X2 Xn的均值函數(shù) 記隨機(jī)變量X的分布函數(shù)的均值為 X 標(biāo)準(zhǔn)差為 X 則有如下結(jié)論成立 X 2 X n或 2X 2 n 注 一個(gè)應(yīng)用廣泛的樣本均值函數(shù)的均值和方差 0 1分布的樣本均值函數(shù)均值和方差 反映總體中某類個(gè)體的比例的隨機(jī)變量X 可以簡單地用0 1分布B 1 p 表示 E X p D X p 1 p p是總體中某類個(gè)體的比例 由樣本X1 X2 Xn產(chǎn)生均值函數(shù)X的均值 X p 方差的均值也是總體中某類個(gè)體的比例p 所以 常用x來估計(jì)p 七 大樣本均值函數(shù)的分布 中心極限定理設(shè) 隨機(jī)變量X服從任何均值為 標(biāo)準(zhǔn)差為 的分布 X是隨機(jī)樣本X1 X2 Xn的均值函數(shù) 中心極限定理 當(dāng)n充分大時(shí) X近似地服從均值為 標(biāo)準(zhǔn)差為 n的正態(tài)分布 在實(shí)際問題中n多大 但一般n 30 對(duì)比總體參數(shù)和樣本統(tǒng)計(jì)量 4 2點(diǎn)估計(jì)在實(shí)際問題中 人們常常判斷總體分布的參數(shù) 這就需要用樣本來推斷總體分布的這些參數(shù) 這就是參數(shù)估計(jì) 參數(shù)估計(jì)分為 點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方法 1 點(diǎn)估計(jì)概念設(shè) 是總體分布中一個(gè)需要估計(jì)的參數(shù) 現(xiàn)從總體中抽取一個(gè)隨機(jī)樣本X1 X2 Xn 記估計(jì) 的統(tǒng)計(jì)量為 則稱為 的估計(jì)量 若得到一組樣本觀測值x1 x2 xn 就可得出 的估計(jì)值 記 注 在選取樣本統(tǒng)計(jì)量作為點(diǎn)估計(jì)時(shí) 必須考慮到 無偏差性 這一點(diǎn)很重要 如果樣本統(tǒng)計(jì)量的期望值 或均值 與打算估計(jì)的總體參數(shù)值相同 則估計(jì)值不存在偏差 總體分布參數(shù) 的點(diǎn)估計(jì) 就是求出 的估計(jì)值 對(duì)比總體參數(shù)和樣本統(tǒng)計(jì)量 點(diǎn)估計(jì) 2 矩法估計(jì)就是用樣本矩來估計(jì)總體矩 矩的一般形式 E Xk 表示k階原點(diǎn)矩 以原點(diǎn)為中心 E X k表示k階中心矩 以 為中心 3 極大似然估計(jì)法設(shè) 總體X的 累積 概率分布函數(shù)為F x 概率密度函數(shù)f x 其中 為未知參數(shù) 也可以表示未知參數(shù)向量 若X為離散型隨機(jī)變量 則由離散型與連續(xù)型的對(duì)應(yīng)關(guān)系 f x 對(duì)應(yīng)于離散情況下的概率P X x X為連續(xù)型隨機(jī)變量時(shí) X的隨機(jī)樣本X1 X2 Xn的聯(lián)合概率密度函數(shù)為 稱為 的極大似然估計(jì)函數(shù) 當(dāng)X為離散隨機(jī)變量時(shí) L表示概率 L關(guān)于 的極大值如果存在 極大值就是 的極大似然估計(jì)值 其含義是 一組觀測值x1 x2 xn在一次實(shí)驗(yàn)中出現(xiàn)了 其聯(lián)合概率就應(yīng)當(dāng)是最大的 所以選擇使聯(lián)合密度L最大的那個(gè) 例 設(shè)x1 x2 xn是正態(tài)總體N 2 的一個(gè)樣本觀測值 求 與 2的極大似然估計(jì)值 解 極大似然函數(shù)為 取對(duì)數(shù) 分別對(duì) 與 2求偏導(dǎo) 并令偏導(dǎo)為0 可求出 與 2的極大似然估計(jì)值如下 如果將上述xi換成Xi 上式成為極大似然估計(jì)量 4 3判別點(diǎn)估計(jì)的優(yōu)劣標(biāo)準(zhǔn) 1 無偏估計(jì)量 如果 則稱為 的無偏估計(jì)量 2 最小方差性若總體參數(shù)為 的估計(jì)量的方差Var 小于等于其他所有對(duì) 的估計(jì)量的方差 即則稱 的估計(jì)量具有最小方差性 3 有效估計(jì)量如果一個(gè)估計(jì)量滿足 1 無偏性 2 最小方差性 那么 該估計(jì)量為有效估計(jì)量 4 漸近無偏估計(jì)量如果 n為樣本容量 則稱為漸近無偏估計(jì)量 5 一致估計(jì)量如果滿足 則稱為 的一致估計(jì)量 一致估計(jì)量的另一等價(jià)定義 1 漸進(jìn)無偏的 2 9 漸進(jìn)有效性如果一個(gè)估計(jì)量滿足 1 是一致估計(jì)量 2 比其它的估計(jì)量更小的漸進(jìn)方差 注 在實(shí)踐中廣泛應(yīng)用的準(zhǔn)則 1 小樣本準(zhǔn)則a 無偏性 b 有效性 2 大樣本準(zhǔn)則一致估計(jì)量 漸進(jìn)方差定義 4 4區(qū)間估計(jì) 1 置信區(qū)間若總體分布含有一個(gè)未知參數(shù) 找出了2個(gè)依賴于樣本X1 X2 Xn的估計(jì)量 使 其中 0 1 一般取0 05或0 01 則稱隨機(jī)區(qū)間為 的100 1 的置信區(qū)間 百分?jǐn)?shù)100 1 稱為置信度 2 總體均值的置信區(qū)間 總體方差已知 設(shè) 總體X服從已知N 2 2已知 抽取n個(gè)觀 測值x1 x2 xn 求總體均值 的100 1 如 95 的置信區(qū)間 首先構(gòu)造 因?yàn)閄服從N 2 n 分布 所以Z服從N 0 1 分布 由 得置信區(qū)間 Z 2 Z1 2 1 2 2 例 設(shè) 總體X服從已知N 0 09 抽取4個(gè)觀測值x1 x2 x3 x4 求總體均值 的95 的置信區(qū)間 解 由已知 1 0 95 0 3 n 4根據(jù) 得到 查表得z0 025 1 96 于是置信區(qū)間為 X 0 294 X 0 294 置信度為95 也就是說 總體均值 以95 的概率在該區(qū)間內(nèi) 3 總體均值的置信區(qū)間 總體方差未知 設(shè) 總體X服從已知N 2 2未知 抽取n個(gè)觀測值x1 x2 xn 求總體均值 的100 1 95 的置信區(qū)間 首先構(gòu)造 可得置信區(qū)間 由 將n個(gè)觀測值x1 x2 xn代入上式得到置信區(qū)間 4 總體方差的置信區(qū)間 未知總體均值 設(shè) 總體X服從已知N 2 未知 抽取n個(gè)觀測值x1 x2 xn 求總體方差 2的100 1 95 的置信區(qū)間 首先構(gòu)造 得到置信區(qū)間 由 將n個(gè)觀測值x1 x2 xn代入上式得到置信區(qū)間 5 總體比例的置信區(qū)間Letpdenotetheobservedproportionof successes inarandomsampleofnobservationsfromapopulationwithaproportion ofsuccesses Then ifnislargeenoughthat n 1 9 thena100 1 confidenceintervalforthepopulationproportionisgivenby orequivalently wherethemarginoferror thesamplingerror orbound B isgivenbyandZ 2 isthenumberforwhichastandardnormalvariableZsatisfies 對(duì)比總體參數(shù)和樣本統(tǒng)計(jì)量 區(qū)間估計(jì) 總體參數(shù)值很可能落在區(qū)間估計(jì)所包括的數(shù)值范圍內(nèi) 使我們知道被估計(jì)值可能產(chǎn)生多大的誤差邊際 給出估計(jì)的信賴程度 或置信度 對(duì)比總體參數(shù)和樣本統(tǒng)計(jì)量 定義 與區(qū)間估計(jì)相聯(lián)系的信賴程度 常常用 1 100 來表示 置信水平 置信區(qū)間 指某一指定置信水平下的區(qū)間估計(jì) 該區(qū)間包括了總體參數(shù)的真值 置信水平高 置信區(qū)間就寬 對(duì)比總體參數(shù)和樣本統(tǒng)計(jì)量 對(duì)比總體參數(shù)和樣本統(tǒng)計(jì)量 x 2 對(duì)比總體參數(shù)和樣本統(tǒng)計(jì)量 解釋95 的置信區(qū)間表達(dá)了什么含義 95 的置信水平意味著 如果從總體中隨機(jī)抽取容量為n的所有可能樣本 并相應(yīng)計(jì)算這些樣本的置信區(qū)間 則在計(jì)算之后有95 的區(qū)間將包括總體參數(shù)的真值 總體均值的置信區(qū)間 已知 1 無論樣本容量為多少 原有總體服從正態(tài)分布 或者 2 原有總體不服從正態(tài)分布 但樣本容量n 30 服從均值 標(biāo)準(zhǔn)差為的正態(tài)分布 而且 總體均值的置信區(qū)間 已知 1 100 水平下的置信區(qū)間 即 因此 總體均值的置信區(qū)間 已知 舉例 根據(jù)以前獲得的經(jīng)驗(yàn) 我們知道某臺(tái)機(jī)器在生產(chǎn)訓(xùn)練用的鋼管時(shí) 其直徑的標(biāo)準(zhǔn)差為0 135厘米 如果從中抽取30根管子作為一個(gè)簡單隨機(jī)樣本 則這些管子的平均直徑為3 6厘米 請(qǐng)問在95 的置信水平下 這些管子的平均直徑的置信區(qū)間是多少 根據(jù)中心極限定理 近似服從正態(tài)分布 總體均值的置信區(qū)間 已知 在95 水平下的置信區(qū)間是 而且 3 6 1 96 0 02465 3 55 3 65 在95 的置信水平下 由這臺(tái)機(jī)器生產(chǎn)的訓(xùn)練用管子 其平均直徑應(yīng)當(dāng)在3 55厘米至3 65厘米范圍之內(nèi) 如果總體的 未知 則的抽樣分布服從自由度為n 1的t分布 即 如果樣本容量足夠大 我們可以用正態(tài)分布而不是t分布 總體均值的置信區(qū)間 未知 總體均值的置信區(qū)間 未知 如果是大樣本 n 30 則在 1 100 水平下 的置信區(qū)間是 如果是小樣本 n 30 并且原有總體近似服從正態(tài)分布 則在 1 100 水平下 的置信區(qū)間是 總體均值的置信區(qū)間 未知 一家郵購公司在圣誕節(jié)前的一周內(nèi)會(huì)接聽大量的訂購電話 過去經(jīng)驗(yàn)表明 由于工作人員每天可能要接聽幾千個(gè)電話 因此為了及時(shí)處理打入的電話數(shù)量 有必要增加銷售人員人數(shù) 為此 這家公司記錄了75 的員工在每8小時(shí)之內(nèi)接聽電話的數(shù)量 結(jié)果發(fā)現(xiàn)他們平均要接聽89 6個(gè)電話 而且標(biāo)準(zhǔn)差為17 32 請(qǐng)問在90 的置信水平下 被接聽電話的平均數(shù)量的置信區(qū)間是多少 舉例 總體均值的置信區(qū)間 未知 s 17 32 n 75 大樣本 的抽樣分布近似服從以下參數(shù)的正態(tài)分布 在90 水平下 的置信區(qū)間 而且 89 6 1 645 2 86 31 92 89 總體均值的置信區(qū)間 未知 舉例 一家會(huì)計(jì)公司想要設(shè)立一項(xiàng)時(shí)間標(biāo)準(zhǔn) 以便其工作人員能及時(shí)完成某類審計(jì)工作 它抽取了18名初級(jí)審計(jì)員作為一個(gè)樣本并記錄了他們的審計(jì)時(shí)間 結(jié)果發(fā)現(xiàn)這些人員的平均審計(jì)時(shí)間為3 2個(gè)小時(shí) 標(biāo)準(zhǔn)差為1 6個(gè)小時(shí) 請(qǐng)問在95 的置信水平下 當(dāng)完成某類審計(jì)工作時(shí)其平均審計(jì)時(shí)間的置信區(qū)間是多少 總體均值的置信區(qū)間 未知 s 1 6 n 18 小樣本 的抽樣分布服從自由度為17的t分布 在95 水平下 的置信區(qū)間 而且 3 2 2 11 0 377 2 404 3 996 總體均值的置信區(qū)間 樣本容量 在 1 100 水平下 的置信區(qū)間是 置信區(qū)間的中點(diǎn) 誤差邊際 誤差邊際 是指 在 1 100 水平下的最大容忍抽樣誤差 總體均值的置信區(qū)間 樣本容量 舉例 繼續(xù)前面審計(jì)時(shí)間的例子 我們從過去經(jīng)驗(yàn)知道 初級(jí)審計(jì)員在完成某類審計(jì)工作時(shí) 其審計(jì)時(shí)間的標(biāo)準(zhǔn)差為1 5個(gè)小時(shí) 如果在95 的置信水平下 我們可以將總體的實(shí)際平均審計(jì)時(shí)間控制在0 5個(gè)小時(shí)之內(nèi) 那么需要獲得多大的樣本容量 總體比例的置信區(qū)間 近似服從 p 標(biāo)準(zhǔn)差 的正態(tài)分布 而且 在 1 100 置信水平下 總體比例的置信區(qū)間 舉例 一項(xiàng)公共民意調(diào)查從新加坡不同的居民區(qū)隨機(jī)抽取了1406名成年人 并要求他們回答這樣一個(gè)問題 你是否同意現(xiàn)有的制度很難使婦女同時(shí)兼顧工作和家庭 310名被調(diào)查人員的回答是 非常同意 請(qǐng)確定在95 置信水平下 回答 非常同意 的人其總體比例的置信區(qū)間是多少 總體比例的置信區(qū)間 n 1406 的抽樣分布可以近似用正態(tài)分布來表示 而且 在95 水平下 的置信區(qū)間 而且 0 22 1 96 0 011 0 1983 0 2417 總體比例的置信區(qū)間 在 1 100 水平下 置信區(qū)間 區(qū)間的中點(diǎn) 誤差邊際 誤差邊際 是指 在 1 100 水平下的最大容忍抽樣誤差 總體比例的置信區(qū)間 舉例 繼續(xù)前面公共民意調(diào)查的例子 為了在95 的置信水平下 將 非常同意 的估計(jì)比例控制在總體真實(shí)比例的3個(gè)百分點(diǎn)之內(nèi) 我們最少需要獲得多大的樣本容量 總體比例的置信區(qū)間 由于應(yīng)當(dāng)保守估計(jì)總體比例p 因此我們假設(shè)p 0 5 注意 樣本容量應(yīng)當(dāng)取整數(shù)- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 管理統(tǒng)計(jì)學(xué) 管理 統(tǒng)計(jì)學(xué) 馬慶國著
鏈接地址:http://m.zhongcaozhi.com.cn/p-7434577.html