《描述統(tǒng)計(jì)學(xué)》PPT課件.ppt
1,課前熱身:,檢查第一章課后實(shí)踐題的完成情況 1.關(guān)于北京衛(wèi)視某檔節(jié)目收視率調(diào)查的調(diào)查總體(調(diào)查對象)和個(gè)體(單位)的確定問題。 (提問23名學(xué)員回答) 2.統(tǒng)計(jì)表的編制(一名學(xué)員到黑板做),2,第二章 數(shù)據(jù)描述方法1:表格和圖形方法,學(xué)習(xí)目標(biāo) 掌握質(zhì)量數(shù)據(jù)和數(shù)量數(shù)據(jù)的概括方法。 學(xué)會用統(tǒng)計(jì)常用圖表表現(xiàn)各類數(shù)據(jù)。 了解探索性數(shù)據(jù)和交叉列表的基本知識。,3,案例討論(課后進(jìn)行): 1.這個(gè)案例都告訴了我們哪些信息? 2.通過閱讀這個(gè)案例你受到哪些啟發(fā)?,4,習(xí) 題,1. P23-2 4. P32-18 2. P25-9 5.P36-22 3. P31-15 6.P41-32,5,第一節(jié) 質(zhì)量數(shù)據(jù)的概括,一、頻數(shù)分布 頻數(shù)分布(Frequency distribution)是用數(shù)據(jù)概括表的形式來列示各組中每組數(shù)值出現(xiàn)的次數(shù)(頻數(shù))。 編制頻數(shù)分布表的目的:提供更進(jìn)一步了解原始數(shù)據(jù)的信息。,6,例2-1 從表2-1觀察哪種軟飲料購買的數(shù)量最多?(P21) 表2-2 購買軟飲料的頻數(shù)分布表 軟飲料 頻數(shù)(次) 古典可樂 19 健怡可樂 8 彭伯碳酸飲料 5 百事可樂 13 雪碧 5 合 計(jì) 50,7,二、相對頻數(shù)分布和百分比頻數(shù)分布,相對頻數(shù)分布(Relative frequency distribution)是一數(shù)據(jù)集的表格匯總法,顯示在若干個(gè)組別中每一組的項(xiàng)目總數(shù)的相對頻數(shù),即分?jǐn)?shù)或比例。 計(jì)算公式: (2.1),8,百分比頻數(shù)分布(Percent frequency distribution)是一數(shù)據(jù)集的表格匯總法,顯示在若干無重疊組別中每一組的項(xiàng)目總數(shù)的百分率。 每組百分比頻數(shù)是該組相對頻數(shù)乘以100%,教科書強(qiáng)調(diào)是相對頻數(shù)乘以100,我強(qiáng)調(diào)乘以100%,9,表2-3 購買軟飲料的相對頻數(shù)和百分比頻數(shù)分布表 軟飲料 相對頻數(shù) 百分比(%) 古典可樂 0.38 38 健怡可樂 0.16 36 彭伯碳酸飲料 0.10 10 百事可樂 0.26 26 雪碧 0.10 10 合 計(jì) 1.00 100,?相對頻數(shù)的計(jì)量單位是什么,(x/1),相對頻數(shù)是否有計(jì)量單位?,10,從表2-3我們可以獲得以下有用信息: 在種軟飲料中,購買次數(shù)最多的是古典可樂,占5種軟飲料購買總次數(shù)的38%。購買次數(shù)最少的是彭伯碳酸飲料和雪碧,各占總購買次數(shù)的10%。 依購買次數(shù)多少排序依次為:古典可樂、百事可樂、健怡可樂、彭伯碳酸飲料和雪碧。 購買次數(shù)最多的前3種軟飲料占全部購買次數(shù)的比重已達(dá)80%(38%+26%+16%)。,11,三、條形圖和餅圖,條形圖(Bar graph / Bar chart) 是用條形的固定寬度表示變量,不同長度表示頻數(shù)、相對頻數(shù)或百分比頻數(shù)分布的一種圖示方法。,12,圖2.1 購買軟飲料次數(shù)的條形圖,13,餅圖(Pie chart)是用圓形及圓內(nèi)扇形面積來表示數(shù)值大小的圖形,它主要用于表示總體中各組成部分所占的比例。,14,圖2.2 軟飲料購買次數(shù)圖,15,第二節(jié) 數(shù)量數(shù)據(jù)的概括,一、頻數(shù)分布 分組(Group)根據(jù)特定目的,對一組數(shù)據(jù)所進(jìn)行的歸類。 利德會計(jì)師事務(wù)所提供的數(shù)據(jù)提供了該所在完成20個(gè)客戶樣本的年終審計(jì)所需要時(shí)間的具體數(shù)據(jù)。,16,表2-4 年終審計(jì)時(shí)間(天) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13,分組的具體步驟: (1)確定組數(shù) 采用斯特格斯(Sturges)提出的經(jīng)驗(yàn)公式來確定。,17,18,(2)確定組距,19,(3)確定組限 歐美教材處理方法:組與組之間的組限互不重疊,即每組之間的數(shù)據(jù)是斷開的。 10-14,15-19,20-24,25-29,30-34 國內(nèi)教材處理方法: 1 離散變量: 第一種方法:間斷型組限。如: 10-14,1529,20-24,20,第二種方法:重疊型組限。如: 10-15,15-20,2025,2530 對于重疊型組限,為避免重復(fù)將同一數(shù)據(jù)分配到不同組,規(guī)定“上限不包括在內(nèi)”。 2連續(xù)變量: 強(qiáng)調(diào)必須做重疊型組限。 (4)將各個(gè)數(shù)據(jù)分配到相應(yīng)組中去,形成一個(gè)數(shù)量數(shù)據(jù)頻數(shù)分布表。,21,表2-5 審計(jì)時(shí)間數(shù)據(jù)頻數(shù)分布 審計(jì)時(shí)間(天)頻數(shù)(個(gè)) 10 15 4 15 20 8 20 25 5 25 30 2 30 35 1 合 計(jì) 20,教科書P27表26采用間斷型分組,不如重疊型分組好。,22,表2-5的頻數(shù)分布為我們提供了以下簡單信息: 審計(jì)時(shí)間發(fā)生最頻繁的是1520天這一組。在20個(gè)審計(jì)時(shí)間中屬于這一組的有8個(gè)。 只有一次審計(jì)時(shí)間需要30或更長的時(shí)間。,23,二、相對頻數(shù)分布和百分比頻數(shù)分布 表2-6 審計(jì)時(shí)間數(shù)據(jù)的相對頻數(shù)分布和百分比頻數(shù)分布 審計(jì)時(shí)間(天)相對頻數(shù) 百分比(%) 10 15 0.20 20 15 20 0.40 40 20 25 0.25 25 25 30 0.10 10 30 35 0.05 5 合 計(jì) 1.00 100,24,三、直方圖 直方圖(Histogram)是一種通過在橫軸上放置組距,在縱軸上放置頻數(shù)來描述數(shù)量數(shù)據(jù)的頻數(shù)分布、相對頻數(shù)分布和百分比頻數(shù)分布的圖形。,25,圖2.4 審計(jì)時(shí)間數(shù)據(jù)直方圖 (單位:天),注意: 本課件的直方圖與教科書(P28)直方圖的區(qū)別。,26,四、累積頻數(shù)分布 累積頻數(shù)分布(Cumulative frequency distribution)對數(shù)量數(shù)據(jù)集的表格法匯總,顯示數(shù)值小于或等于每組上限的項(xiàng)目數(shù)?;蛘唢@示數(shù)值大于或等于每組上限的項(xiàng)目數(shù)。,27,(一)由最小數(shù)值向最大數(shù)值累積方法(顯示數(shù)值小于每組上限的項(xiàng)目數(shù)) 表2-7 審計(jì)時(shí)間數(shù)據(jù)的累積頻數(shù)分布 審計(jì)時(shí)間(天)頻數(shù)(個(gè)) 累積頻數(shù)(個(gè)) 10 15 4 4 15 20 8 12 20 25 5 17 25 30 2 19 30 35 1 20 合 計(jì) 20 -,28,(二)由最大數(shù)值向最大數(shù)值累積方法(顯示數(shù)值大于或等于每組下限的項(xiàng)目數(shù)): 表2-8 審計(jì)時(shí)間數(shù)據(jù)的累積頻數(shù)分布 審計(jì)時(shí)間(天)頻數(shù)(個(gè)) 累積頻數(shù)(個(gè)) 10 15 4 20 15 20 8 16 20 25 5 8 25 30 2 3 30 35 1 1 合 計(jì) 20 -,29,表29 審計(jì)時(shí)間累計(jì)頻數(shù)表,30,第三節(jié) 探索性數(shù)據(jù)分析,探索性數(shù)據(jù)分析(Exploratory data analysis)是用莖葉顯示(Stem-and-leaf display)圖形來反映概括性數(shù)據(jù)的一種統(tǒng)計(jì)技術(shù)。,31,一、莖葉顯示圖的繪制方法: 第一步:把每個(gè)觀察值分成莖和葉兩個(gè)部分。 莖包括了除了個(gè)位數(shù)之外的所有數(shù)字,葉就是個(gè)位數(shù)字。 第二步:把莖由小到大,從上往下寫成一列,并且在這一列右邊畫一條直線。 第三步:把每片葉子寫在它所屬的莖的右邊,并由小到大排成一行。,32,例2-3 表2-10是某證券公司對應(yīng)聘某一職位50人參見面試時(shí),回答所提出的150個(gè)問題正確回答的測試結(jié)果。 表2-10 能力測試回答正確的問題數(shù)目 112 72 69 97 107 73 92 76 86 73 126 128 118 127 124 82 104 132 134 83 92 108 96 100 92 115 76 91 102 81 95 141 81 80 106 84 119 113 98 75 68 98 115 106 95 100 85 94 106 119,33,6 8 9 2 7 2 3 3 5 6 6 6 8 0 1 1 2 3 4 5 6 8 9 1 2 2 2 4 5 5 6 7 8 8 11 10 0 0 2 4 6 6 6 7 8 9 11 2 3 5 5 8 9 9 7 12 4 6 7 8 4 13 2 4 2 1 1 圖2.5 能力測試回答正確問題數(shù)目莖葉顯示圖,34,二、莖葉顯示圖的含義 第一行:表明在回答問題正確數(shù)目在60個(gè)以上,69個(gè)及以下的人數(shù)有兩個(gè)。其中一個(gè)答對了68道題,另一個(gè)答對了69道題。 第二行:表明在回答問題正確數(shù)目在70個(gè)以上,79個(gè)及以下的人數(shù)有6個(gè)。他們答對題的數(shù)目分別為:72,73,73,75,76,76。 ,35,第四節(jié) 交叉分組列表和散點(diǎn)圖,一、交叉分組列表 交叉分組列表(Cross tabulation)對兩個(gè)數(shù)據(jù)的表格匯總。一個(gè)變量的組用行來描述,另一個(gè)變量的組用行、列來描述。,36,表2-11 300家洛衫磯飯店質(zhì)量等級和菜肴價(jià)格交叉分組列表 質(zhì)量 等級 菜肴價(jià)格(美元) 合計(jì) 1019 2029 3039 4049 好 42 40 2 0 84 很好 34 64 46 6 150 極好 2 14 28 22 66 合計(jì) 78 118 76 26 300,37,二、散點(diǎn)圖 散點(diǎn)圖(Scatter diagram)表示兩個(gè)變量之間關(guān)系的圖形方法。一個(gè)變量列在橫軸上,另一個(gè)變量列在縱軸上。 例2-4 美國舊金山某音響商店廣告次數(shù)和銷售額的數(shù)據(jù)如下:,38,表2-12 立體聲音響設(shè)備商店樣本資料 周 次 廣告次數(shù)(x) 銷售額(百美元) y 1 2 50 2 5 57 3 1 41 4 3 54 5 4 54 6 1 38 7 5 63 8 3 48 9 4 59 10 2 46,39,圖2.6 立體聲音響設(shè)備商店樣本資料散點(diǎn)圖,40,Question ? Questions and Comments are welcome THANKS Have a great Day !,
收藏
- 資源描述:
-
1,課前熱身:,檢查第一章課后實(shí)踐題的完成情況 1.關(guān)于北京衛(wèi)視某檔節(jié)目收視率調(diào)查的調(diào)查總體(調(diào)查對象)和個(gè)體(單位)的確定問題。 (提問23名學(xué)員回答) 2.統(tǒng)計(jì)表的編制(一名學(xué)員到黑板做),2,第二章 數(shù)據(jù)描述方法1:表格和圖形方法,學(xué)習(xí)目標(biāo) 掌握質(zhì)量數(shù)據(jù)和數(shù)量數(shù)據(jù)的概括方法。 學(xué)會用統(tǒng)計(jì)常用圖表表現(xiàn)各類數(shù)據(jù)。 了解探索性數(shù)據(jù)和交叉列表的基本知識。,3,案例討論(課后進(jìn)行): 1.這個(gè)案例都告訴了我們哪些信息? 2.通過閱讀這個(gè)案例你受到哪些啟發(fā)?,4,習(xí) 題,1. P23-2 4. P32-18 2. P25-9 5.P36-22 3. P31-15 6.P41-32,5,第一節(jié) 質(zhì)量數(shù)據(jù)的概括,一、頻數(shù)分布 頻數(shù)分布(Frequency distribution)是用數(shù)據(jù)概括表的形式來列示各組中每組數(shù)值出現(xiàn)的次數(shù)(頻數(shù))。 編制頻數(shù)分布表的目的:提供更進(jìn)一步了解原始數(shù)據(jù)的信息。,6,例2-1 從表2-1觀察哪種軟飲料購買的數(shù)量最多?(P21) 表2-2 購買軟飲料的頻數(shù)分布表 軟飲料 頻數(shù)(次) 古典可樂 19 健怡可樂 8 彭伯碳酸飲料 5 百事可樂 13 雪碧 5 合 計(jì) 50,7,二、相對頻數(shù)分布和百分比頻數(shù)分布,相對頻數(shù)分布(Relative frequency distribution)是一數(shù)據(jù)集的表格匯總法,顯示在若干個(gè)組別中每一組的項(xiàng)目總數(shù)的相對頻數(shù),即分?jǐn)?shù)或比例。 計(jì)算公式: (2.1),8,百分比頻數(shù)分布(Percent frequency distribution)是一數(shù)據(jù)集的表格匯總法,顯示在若干無重疊組別中每一組的項(xiàng)目總數(shù)的百分率。 每組百分比頻數(shù)是該組相對頻數(shù)乘以100%,教科書強(qiáng)調(diào)是相對頻數(shù)乘以100,我強(qiáng)調(diào)乘以100%,9,表2-3 購買軟飲料的相對頻數(shù)和百分比頻數(shù)分布表 軟飲料 相對頻數(shù) 百分比(%) 古典可樂 0.38 38 健怡可樂 0.16 36 彭伯碳酸飲料 0.10 10 百事可樂 0.26 26 雪碧 0.10 10 合 計(jì) 1.00 100,?相對頻數(shù)的計(jì)量單位是什么,(x/1),相對頻數(shù)是否有計(jì)量單位?,10,從表2-3我們可以獲得以下有用信息: 在種軟飲料中,購買次數(shù)最多的是古典可樂,占5種軟飲料購買總次數(shù)的38%。購買次數(shù)最少的是彭伯碳酸飲料和雪碧,各占總購買次數(shù)的10%。 依購買次數(shù)多少排序依次為:古典可樂、百事可樂、健怡可樂、彭伯碳酸飲料和雪碧。 購買次數(shù)最多的前3種軟飲料占全部購買次數(shù)的比重已達(dá)80%(38%+26%+16%)。,11,三、條形圖和餅圖,條形圖(Bar graph / Bar chart) 是用條形的固定寬度表示變量,不同長度表示頻數(shù)、相對頻數(shù)或百分比頻數(shù)分布的一種圖示方法。,12,圖2.1 購買軟飲料次數(shù)的條形圖,13,餅圖(Pie chart)是用圓形及圓內(nèi)扇形面積來表示數(shù)值大小的圖形,它主要用于表示總體中各組成部分所占的比例。,14,圖2.2 軟飲料購買次數(shù)圖,15,第二節(jié) 數(shù)量數(shù)據(jù)的概括,一、頻數(shù)分布 分組(Group)根據(jù)特定目的,對一組數(shù)據(jù)所進(jìn)行的歸類。 利德會計(jì)師事務(wù)所提供的數(shù)據(jù)提供了該所在完成20個(gè)客戶樣本的年終審計(jì)所需要時(shí)間的具體數(shù)據(jù)。,16,表2-4 年終審計(jì)時(shí)間(天) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13,分組的具體步驟: (1)確定組數(shù) 采用斯特格斯(Sturges)提出的經(jīng)驗(yàn)公式來確定。,17,18,(2)確定組距,19,(3)確定組限 歐美教材處理方法:組與組之間的組限互不重疊,即每組之間的數(shù)據(jù)是斷開的。 10-14,15-19,20-24,25-29,30-34 國內(nèi)教材處理方法: 1 離散變量: 第一種方法:間斷型組限。如: 10-14,1529,20-24,20,第二種方法:重疊型組限。如: 10-15,15-20,2025,2530 對于重疊型組限,為避免重復(fù)將同一數(shù)據(jù)分配到不同組,規(guī)定“上限不包括在內(nèi)”。 2連續(xù)變量: 強(qiáng)調(diào)必須做重疊型組限。 (4)將各個(gè)數(shù)據(jù)分配到相應(yīng)組中去,形成一個(gè)數(shù)量數(shù)據(jù)頻數(shù)分布表。,21,表2-5 審計(jì)時(shí)間數(shù)據(jù)頻數(shù)分布 審計(jì)時(shí)間(天)頻數(shù)(個(gè)) 10 15 4 15 20 8 20 25 5 25 30 2 30 35 1 合 計(jì) 20,教科書P27表26采用間斷型分組,不如重疊型分組好。,22,表2-5的頻數(shù)分布為我們提供了以下簡單信息: 審計(jì)時(shí)間發(fā)生最頻繁的是1520天這一組。在20個(gè)審計(jì)時(shí)間中屬于這一組的有8個(gè)。 只有一次審計(jì)時(shí)間需要30或更長的時(shí)間。,23,二、相對頻數(shù)分布和百分比頻數(shù)分布 表2-6 審計(jì)時(shí)間數(shù)據(jù)的相對頻數(shù)分布和百分比頻數(shù)分布 審計(jì)時(shí)間(天)相對頻數(shù) 百分比(%) 10 15 0.20 20 15 20 0.40 40 20 25 0.25 25 25 30 0.10 10 30 35 0.05 5 合 計(jì) 1.00 100,24,三、直方圖 直方圖(Histogram)是一種通過在橫軸上放置組距,在縱軸上放置頻數(shù)來描述數(shù)量數(shù)據(jù)的頻數(shù)分布、相對頻數(shù)分布和百分比頻數(shù)分布的圖形。,25,圖2.4 審計(jì)時(shí)間數(shù)據(jù)直方圖 (單位:天),注意: 本課件的直方圖與教科書(P28)直方圖的區(qū)別。,26,四、累積頻數(shù)分布 累積頻數(shù)分布(Cumulative frequency distribution)對數(shù)量數(shù)據(jù)集的表格法匯總,顯示數(shù)值小于或等于每組上限的項(xiàng)目數(shù)。或者顯示數(shù)值大于或等于每組上限的項(xiàng)目數(shù)。,27,(一)由最小數(shù)值向最大數(shù)值累積方法(顯示數(shù)值小于每組上限的項(xiàng)目數(shù)) 表2-7 審計(jì)時(shí)間數(shù)據(jù)的累積頻數(shù)分布 審計(jì)時(shí)間(天)頻數(shù)(個(gè)) 累積頻數(shù)(個(gè)) 10 15 4 4 15 20 8 12 20 25 5 17 25 30 2 19 30 35 1 20 合 計(jì) 20 -,28,(二)由最大數(shù)值向最大數(shù)值累積方法(顯示數(shù)值大于或等于每組下限的項(xiàng)目數(shù)): 表2-8 審計(jì)時(shí)間數(shù)據(jù)的累積頻數(shù)分布 審計(jì)時(shí)間(天)頻數(shù)(個(gè)) 累積頻數(shù)(個(gè)) 10 15 4 20 15 20 8 16 20 25 5 8 25 30 2 3 30 35 1 1 合 計(jì) 20 -,29,表29 審計(jì)時(shí)間累計(jì)頻數(shù)表,30,第三節(jié) 探索性數(shù)據(jù)分析,探索性數(shù)據(jù)分析(Exploratory data analysis)是用莖葉顯示(Stem-and-leaf display)圖形來反映概括性數(shù)據(jù)的一種統(tǒng)計(jì)技術(shù)。,31,一、莖葉顯示圖的繪制方法: 第一步:把每個(gè)觀察值分成莖和葉兩個(gè)部分。 莖包括了除了個(gè)位數(shù)之外的所有數(shù)字,葉就是個(gè)位數(shù)字。 第二步:把莖由小到大,從上往下寫成一列,并且在這一列右邊畫一條直線。 第三步:把每片葉子寫在它所屬的莖的右邊,并由小到大排成一行。,32,例2-3 表2-10是某證券公司對應(yīng)聘某一職位50人參見面試時(shí),回答所提出的150個(gè)問題正確回答的測試結(jié)果。 表2-10 能力測試回答正確的問題數(shù)目 112 72 69 97 107 73 92 76 86 73 126 128 118 127 124 82 104 132 134 83 92 108 96 100 92 115 76 91 102 81 95 141 81 80 106 84 119 113 98 75 68 98 115 106 95 100 85 94 106 119,33,6 8 9 2 7 2 3 3 5 6 6 6 8 0 1 1 2 3 4 5 6 8 9 1 2 2 2 4 5 5 6 7 8 8 11 10 0 0 2 4 6 6 6 7 8 9 11 2 3 5 5 8 9 9 7 12 4 6 7 8 4 13 2 4 2 1 1 圖2.5 能力測試回答正確問題數(shù)目莖葉顯示圖,34,二、莖葉顯示圖的含義 第一行:表明在回答問題正確數(shù)目在60個(gè)以上,69個(gè)及以下的人數(shù)有兩個(gè)。其中一個(gè)答對了68道題,另一個(gè)答對了69道題。 第二行:表明在回答問題正確數(shù)目在70個(gè)以上,79個(gè)及以下的人數(shù)有6個(gè)。他們答對題的數(shù)目分別為:72,73,73,75,76,76。 ,35,第四節(jié) 交叉分組列表和散點(diǎn)圖,一、交叉分組列表 交叉分組列表(Cross tabulation)對兩個(gè)數(shù)據(jù)的表格匯總。一個(gè)變量的組用行來描述,另一個(gè)變量的組用行、列來描述。,36,表2-11 300家洛衫磯飯店質(zhì)量等級和菜肴價(jià)格交叉分組列表 質(zhì)量 等級 菜肴價(jià)格(美元) 合計(jì) 1019 2029 3039 4049 好 42 40 2 0 84 很好 34 64 46 6 150 極好 2 14 28 22 66 合計(jì) 78 118 76 26 300,37,二、散點(diǎn)圖 散點(diǎn)圖(Scatter diagram)表示兩個(gè)變量之間關(guān)系的圖形方法。一個(gè)變量列在橫軸上,另一個(gè)變量列在縱軸上。 例2-4 美國舊金山某音響商店廣告次數(shù)和銷售額的數(shù)據(jù)如下:,38,表2-12 立體聲音響設(shè)備商店樣本資料 周 次 廣告次數(shù)(x) 銷售額(百美元) y 1 2 50 2 5 57 3 1 41 4 3 54 5 4 54 6 1 38 7 5 63 8 3 48 9 4 59 10 2 46,39,圖2.6 立體聲音響設(shè)備商店樣本資料散點(diǎn)圖,40,Question ? Questions and Comments are welcome THANKS Have a great Day !,
展開閱讀全文