《高考數(shù)學(xué)大一輪總復(fù)習(xí) 第十章 統(tǒng)計、統(tǒng)計案例及算法初步 10.3 變量間的相關(guān)關(guān)系、統(tǒng)計案例課件 理 北師大版》由會員分享,可在線閱讀,更多相關(guān)《高考數(shù)學(xué)大一輪總復(fù)習(xí) 第十章 統(tǒng)計、統(tǒng)計案例及算法初步 10.3 變量間的相關(guān)關(guān)系、統(tǒng)計案例課件 理 北師大版(46頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第十章統(tǒng)計、統(tǒng)計案例及算法初步 第三節(jié)變量間的相關(guān)關(guān)系、統(tǒng)計案例第三節(jié)變量間的相關(guān)關(guān)系、統(tǒng)計案例 最新考綱1.會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,會利用散點圖認(rèn)識變量間的相關(guān)關(guān)系;2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程;3.了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及其簡單應(yīng)用;4.了解回歸分析的基本思路、方法及其簡單應(yīng)用。J基礎(chǔ)知識基礎(chǔ)知識 自主學(xué)習(xí)自主學(xué)習(xí) 1相關(guān)性 (1)散點圖:在考慮兩個量的關(guān)系時,為了對_之間的關(guān)系有一個大致的了解,人們通常將_的點描出來,這些點就組成了變量之間的一個圖,通常稱這種圖為變量之間的散點圖。 (2)曲線擬合:從散點
2、圖上可以看出,如果變量之間_,這些點會有一個_的大致趨勢,這種趨勢通常可以用一條_來近似,這種近似的過程稱為曲線擬合。 (3)線性相關(guān):若兩個變量x和y的散點圖中,所有點看上去都在_附近波動,則稱變量間是線性相關(guān)的。此時,我們可以用_來近似。變量變量所對應(yīng)存在著某種關(guān)系集中光滑的曲線一條直線一條直線 (4)非線性相關(guān):若散點圖上所有點看上去都在_附近波動,則稱此相關(guān)為非線性相關(guān)。此時,可以用_來擬合。 (5)不相關(guān):如果所有的點在散點圖中_,則稱變量間是不相關(guān)的。某條曲線(不是一條直線)一條曲線沒有顯示任何關(guān)系 2回歸直線方程與相關(guān)系數(shù) (1)最小二乘法: 如果有n個點(x1,y1),(x2,
3、y2),(xn,yn),可以用下面的表達(dá)式來刻畫這些點與直線yabx的接近程度;_,使得上式達(dá)到_的直線yabx就是我們所要求的直線,這種方法稱為最小二乘法。 直線方程yabx稱為線性回歸方程,a,b是線性回歸方程的_。y1(abx1)2y2(abx2)2yn(abxn)2最小值系數(shù) 當(dāng)r0時,稱兩個變量_。 當(dāng)r2.7063.8416.635 判一判 (1)相關(guān)關(guān)系的兩個變量是非確定關(guān)系。() 解析正確。相關(guān)關(guān)系不是確定關(guān)系。 (2)散點圖中的點越集中,兩個變量的線性相關(guān)性越強(qiáng)。() 解析錯誤。散點圖上的點大致分布在通過散點圖中心的那條直線附近,整體上呈線性分布時,兩個變量相關(guān)關(guān)系越強(qiáng)。 (
4、3)對于分類變量X與Y,統(tǒng)計量2的值越小,“X與Y有關(guān)聯(lián)”的把握程度越大。() 解析錯誤。2越大,“X與Y有關(guān)聯(lián)”的把握程度越大。 (4)直線ybxa至少經(jīng)過點(x1,y1),(x2,y2),(xn,yn)中的一個點。() 解析錯誤。線性回歸方程ybxa經(jīng)過樣本點的中心(,),可能不經(jīng)過(x1,y1),(x2,y2),(xn,yn)中的任何一點,這些點只是分布在這條直線附近。 練一練 1下面哪些變量是相關(guān)關(guān)系() A出租車車費與行駛的里程 B房屋面積與房屋價格 C身高與體重 D鐵塊的大小與質(zhì)量解析A,B,D都是函數(shù)關(guān)系,其中A一般是分段函數(shù),只有C是相關(guān)關(guān)系。答案C 2在一組樣本數(shù)據(jù)(x1,y
5、1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i1,2,n)都在直線yx1上,則這組樣本數(shù)據(jù)的最大樣本相關(guān)系數(shù)為() A1 B0 C. D1解析所有點均在直線上,則樣本相關(guān)系數(shù)最大即為1,故選D。答案D 3若回歸直線方程為y21.5x,則變量x增加一個單位,y() A平均增加1.5個單位 B平均增加2個單位 C平均減少1.5個單位 D平均減少2個單位解析因為回歸直線方程為y21.5x,所以b1.5,則變量x增加一個單位,y平均減少1.5個單位。答案C 4某校為了研究學(xué)生的性別和對待某一活動的態(tài)度(支持和不支持兩種態(tài)度)的關(guān)系,運用
6、22列聯(lián)表進(jìn)行獨立性檢驗,經(jīng)計算27.069,則所得到的統(tǒng)計學(xué)結(jié)論是:有多少的把握認(rèn)為“學(xué)生性別與支持該活動有關(guān)系”。() 附: A.0.1% B1% C99% D99.9%解析因為7.069與附表中的6.635最接近,所以得到的統(tǒng)計學(xué)結(jié)論是:有10.0100.9999%的把握認(rèn)為“學(xué)生性別與支持該活動有關(guān)系”。答案CP(2k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828 5已知x,y的取值如下表,從散點圖可以看出y與x線性相關(guān),且回歸方程為y0.95xa,則a() A.3.25 B2.6 C2.2 D0 x0134y2.24.34.
7、86.7R熱點命題熱點命題 深度剖析深度剖析 例1】(1)(2015湖北卷)已知變量x和y滿足關(guān)系y0.1x1,變量y與z正相關(guān)。下列結(jié)論中正確的是() Ax與y負(fù)相關(guān),x與z負(fù)相關(guān) Bx與y正相關(guān),x與z正相關(guān) Cx與y正相關(guān),x與z負(fù)相關(guān) Dx與y負(fù)相關(guān),x與z正相關(guān)【解析】由y0.1x1知y與x負(fù)相關(guān),又因為y與z正相關(guān),故z與x負(fù)相關(guān)?!敬鸢浮緼考點一相關(guān)關(guān)系的判斷 (2)對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是() Ar2r40r3r1 Br4r20r1r3 Cr4r20r3r1 Dr2r40r1r3 【解析】易知題中圖(1)與圖(3)是正相關(guān),圖(2
8、)與圖(4)是負(fù)相關(guān),且圖(1)與圖(2)中的樣本點集中分布在一條直線附近,則r2r40r30,b0,b0 Ca0,b0 Da0 x345678y4.02.50.50.52.03.0 解析可大致畫出散點圖如圖所示,可判斷a0,b0,故選A。 答案A (2)變量X與Y相對應(yīng)的一組數(shù)據(jù)為(0,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對應(yīng)的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)。r1表示變量Y與X之間的線性相關(guān)系數(shù),r2表示變量V與U之間的線性相關(guān)系數(shù),則() Ar2r10 B0r2r1 Cr200;對
9、于變量V與U而言,V隨U的增大而減小,故V與U負(fù)相關(guān),即r20,所以選C。答案C 【例2】(2015新課標(biāo)全國卷)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響。對近8年的年宣傳費x1和年銷售量yi(i1,2,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值。考點二回歸方程的求法及回歸分析 (2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程; (3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為z0.2yx。根據(jù)(2)的結(jié)果回答下列問題: 年宣傳費x49時,年銷售量及年利潤的預(yù)報值是多少? 年宣傳費x為何值
10、時,年利潤的預(yù)報值最大? 附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),(un,vn),其回歸直線v 變式訓(xùn)練2(2016石家莊模擬)下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)是幾組對照數(shù)據(jù)。 (1)請畫出上表數(shù)據(jù)的散點圖; 解由題意,作散點圖如圖。x3456y2.5344.5 解當(dāng)x100時,y1000.70.3570.35(噸標(biāo)準(zhǔn)煤),預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低9070.3519.65(噸標(biāo)準(zhǔn)煤)。 【例3】某高校共有學(xué)生15 000人,其中男生10 500人,女生4 500人,為調(diào)查該校學(xué)生每周平均體育運動時間的情
11、況,采用分層抽樣的方法,收集300位學(xué)生每周平均體育運動時間的樣本數(shù)據(jù)(單位:小時)。 (1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?考點三 獨立性檢驗 (2)根據(jù)這300個樣本數(shù)據(jù),得到學(xué)生每周平均體育運動時間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:0,2,(2,4,(4,6,(6,8,(8,10,(10,12,估計該校學(xué)生每周平均體育運動時間超過4小時的概率; 【解】由頻率分布直方圖得12(0.0250.100)0.75, 所以該校學(xué)生每周平均體育運動時間超過4小時的概率的估計值為0.75。 (3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動時間與
12、性別列聯(lián)表,并判斷是否有95%的把握認(rèn)為“該校學(xué)生的每周平均體育運動時間與性別有關(guān)”。 【解】由(2)知,300位學(xué)生中有3000.75225(人)的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時又因為樣本數(shù)據(jù)中有210份是關(guān)于男生的,90份是關(guān)于女生的,所以每周平均體育運動時間與性別列聯(lián)表如下:P(2k)0.100.050.0100.005k2.7063.8416.6357.879 每周平均體育運動時間與性別列聯(lián)表性別每周平均體育運動時間男生女生總計每周平均體育運動時間不超過4小時453075每周平均體育運動時間超過4小時16560225總計21090300 變式訓(xùn)
13、練3某大學(xué)餐飲中心為了解新生的飲食習(xí)慣,在全校一年級學(xué)生中進(jìn)行了抽樣調(diào)查,調(diào)查結(jié)果如下表所示: (1)根據(jù)表中數(shù)據(jù),問是否有95%的把握認(rèn)為“南方學(xué)生和北方學(xué)生在選用甜品的飲食習(xí)慣方面有差異”;喜歡甜品不喜歡甜品總計南方學(xué)生602080北方學(xué)生101020總計7030100 (2)已知在被調(diào)查的北方學(xué)生中有5名數(shù)學(xué)系的學(xué)生,其中2名喜歡甜品,現(xiàn)在從這5名學(xué)生中隨機(jī)抽取3人,求至少有1人喜歡甜品的概率。 解 從5名數(shù)學(xué)系學(xué)生中任取3人的一切可能結(jié)果所組成的基本事件空間(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3)
14、,(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)。 其中ai表示喜歡甜品的學(xué)生,i1,2;bj表示不喜歡甜品的學(xué)生,j1,2,3。由10個基本事件組成,且這些基本事件的出現(xiàn)是等可能的。 用A表示“3人中至多有1人喜歡甜品”這一事件,則A(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)。S思想方法思想方法 感悟提升感悟提升 1種關(guān)系函數(shù)關(guān)系與相關(guān)關(guān)系 函數(shù)關(guān)系是一種確定的關(guān)系,相關(guān)關(guān)系是一種非確定的關(guān)系。事實上,函數(shù)關(guān)系是兩個非隨機(jī)變量的關(guān)系,而相關(guān)關(guān)系是非隨機(jī)變量與隨機(jī)變量的關(guān)系。 2個注意點線性回歸方程的求法 (1)如果兩個變量不具有線性相關(guān)關(guān)系,即使求出回歸直線方程也毫無意義,而且用其進(jìn)行估計和預(yù)測也是不可信的。 (2)回歸直線方程只適用于我們所研究的樣本的總體。樣本的取值范圍一般不超過回歸直線方程的適用范圍,否則就沒有實用價值。