www.日本精品,久久中文视频,中文字幕第一页在线播放,香蕉视频免费网站,老湿机一区午夜精品免费福利,91久久综合精品国产丝袜长腿,欧美日韩视频精品一区二区

高等統(tǒng)計學考題人大精簡版

發(fā)布時間:2020-09-09 來源: 實習報告 點擊:

 高等統(tǒng)計學考題人大精簡版 題 一、多項選擇題(每題 4 分,一共 20 分,每題要求:選擇正確答案,對選擇或未選答案進行簡要而清晰的原因解釋。將答案填寫在答題紙上,填寫在試題上無效。得分規(guī)則:選對得 并對答案解釋合理,得 4 分;沒有對未選答案解釋最多得 2 分;漏選得 1 分,選錯可參考得 解釋酌情給分;不選得 0 分)

 1 .有關樣本的分布,以下陳述正確的是:ABC A. 如果樣本 X 1 ,…,X n 獨立同分布來自 Gamma 分布, ???niiXnX11在大樣本下有近似的正態(tài)分布; 【對。滿足中央極限定理條件】

 B.如果樣本 X 1 ,…,X n 獨立同分布來自 N(2, ? ?), ???niiXnX11在大樣本情況下有精確分布 N( n / ,2? ?); 【對。獨立同分布正態(tài)隨機變量的均值仍是正態(tài)分布,方差值符合中央極限定理】

 C.如果樣本 X 1 ,…,X n 獨立同分布來自 N(2, ? ?),即使樣本量不大, ???niiXnX11也服從正態(tài)分布; 【對。獨立同分布正態(tài)隨機變量的均值仍是正態(tài)分布】

 D.如果樣本 X 1 ,…,X n 來自任意分布,在大樣本情況下,由 X 1 ,…,X n 組成的數(shù)據有近似的正態(tài)分布; 【錯。如果 X 1 ,…,X n 強相關,則不成立;即使 i.i.d 情況下也不是任意的數(shù)據組成方式都是正態(tài)分布】

  2 .有關檢驗的 p 值,下面說法正確的是:C

 A. 一般為[0,0.1]之間的一個很小的概率; 【錯。p 值是計算得出的概率,取值 0-1 之間】

 B. 接受備擇假設的最小顯著性水平; 【錯。接受備擇假設說法不準確】

 C. 如果 p 值小于顯著性水平,則拒絕零假設;

 【對。符合假設檢驗規(guī)則】

 D. 樣本統(tǒng)計量的分布函數(shù)。

 【錯。p 值根據檢驗統(tǒng)計量分布函數(shù)計算得出】

 卷 (卷 3 )5.有關檢驗的 p 值,下面說法正確的是:CD A. 一般為[0,0.1]之間一個較小的概率; 【錯。檢驗結果不拒絕原假設的情況下,p 值較大】

 B. 接受備擇假設的最小顯著性水平; 【錯。接受備擇假設說法不準確】

 C. 如果 p 值小于顯著性水平,則拒絕零假設;

 【對。符合假設檢驗規(guī)則】

 D. 樣本統(tǒng)計量的尾概率。

 【對?烧J為 p 值是原假設為真時小于等于實際觀測結果的概率】

 3 .請問以下哪些方法可以用來判斷數(shù)據可能背離正態(tài)分布:

 A. Q-Q 圖上,如果數(shù)據和基線之間幾乎吻合; 【錯。正態(tài) qq 圖數(shù)據和基線之間幾乎吻合說明數(shù)據接近正態(tài)分布】

 B. Kolmogrov-Smirnov 正態(tài)檢驗中的統(tǒng)計量所對應的 p 值小于 0.05; 【對。ks 正態(tài)檢驗原假設是兩個數(shù)據分布一致或者數(shù)據符合正態(tài)分布,p 值小于 0.05拒絕原假設】

 C.對數(shù)據直方圖做光滑后沒有發(fā)現(xiàn)數(shù)據有很大的發(fā)散趨勢; 【錯。發(fā)散趨勢不能決定分布形態(tài)】

 D.2? 擬合優(yōu)度檢驗,統(tǒng)計量的值偏小。

 【錯。2? 擬合優(yōu)度檢驗可以檢驗分布是否正態(tài),原假設為觀測服從給定概率值的多項分布,統(tǒng)計量的值偏小不拒絕原假設】

 4 .若抽樣誤差為 5,總體標準差為 40,如果樣本量足夠大,正態(tài)分布的 0.975 分位數(shù)近似為 2,要估計總體均值的 95%的置信區(qū)間所需要的樣本量大概為:

 A

 156;B 256;C 356 ; d) 456. 因 ???−????√??~??(0,1),那么 2 =540/√?? ,求解 n=256

 5 .關于假設檢驗,給定一組獨立同分布的隨機樣本,給定顯著性水平,如下理解正確的是:D

 A.單邊檢驗拒絕,雙邊檢驗一定拒絕;【錯,】

 B.雙邊檢驗接受,一定有一個單邊檢驗是拒絕的;【錯】

 C.單邊檢驗拒絕,雙邊檢驗一定拒絕!惧e】

 D.雙邊檢驗拒絕,一定有一個單邊檢驗是拒絕的;【對】

 畫圖解釋

  6 .某汽車生產廠家為增加某型號汽車的銷售量,采用促銷手段,促銷一個月后,分別收集了 8 個銷售點處促銷前一個月和促銷后一個月該車型的銷售輛,如果不考慮其他影響銷售量因素,僅通過觀察和分析這些樣本數(shù)據,是否認為這次促銷有助于提高汽車的銷售量。請將合適的可用于分析該類問題的檢驗過程選出來:C 銷售點代號:1 2 3 4 5 6

  7

 8 促銷前(輛): 90 83 105 97 110 78

 55

 123

 促銷后(輛): 97 80 110 93 123 84

 57

 110

 A. 兩樣本 Z 檢驗 B. 兩樣本 t 檢驗 C. 單一樣本 t 檢驗 D. 單一樣本 Z 檢驗 本問題是配對樣本之間的比較,小樣本,方差未知,采用單一樣本的 t 檢驗,其他都不符合。

 7 .在參數(shù)估計中,要求通過樣本的統(tǒng)計量來估計總體參數(shù),評價統(tǒng)計量的標準之一是該統(tǒng)計量隨著樣本量的增大,它與它估計的總體參數(shù)越來越近,這種評價標準稱為:

 A.無偏性

 B.有效性

 C. 一致性

  D.充分性 無偏性指估計量的期望與總體參數(shù)相等 充分性指估計量包含了參數(shù)的全部信息 有效性指無偏估計量的方差達到 C-R 下界

 8 .研究人員對有糖尿病的老鼠和正常老鼠血液中某種礦物質的含量進行研究,經驗表明有糖尿病的老鼠和正常老鼠血液中某種礦物質的含量測量方差相等,測得如下試驗數(shù)據:

 糖尿病老鼠:9 只,樣本均值 64.26,樣本方差 1.40

 正常老鼠:

 7 只,樣本均值 75.66,樣本方差 1.32 在置信水平為 0.10 之下,有糖尿病的老鼠和正常老鼠血液中 Fe 的含量之差的置信區(qū)間為(t(0.95,14)=1.76):

 A. [5.68,15.56] B. [8.02,19.47] C.[10.36,12.43] D.[6.53,16.32] 有 t =(??? − ???) − (?? ?? − ?? ?? )?? ?? √ 1??+1?? 其中 S ?? 2 =(?? − 1)?? ?? + (?? − 1)?? ???? + ?? − 2 代入計算[(75.66 − 64.26) ± 1.76 × √( 19+17 )((9−1)×1.4+(7−1)×1.329+7−2)]可得。

  9 .置信水平為 α,下列說法正確的是(BD

  ), A 在置信水平一定的條件下,提高置信估計精度需要縮小樣本量; B 在置信水平一定的條件下,提高置信估計精度需要增加樣本量; C 在樣本量一定的條件下,提高置信估計精度,需要降低置信水平; D 在樣本量一定的條件下,提高置信估計精度,需要增大置信水平。

 以置信區(qū)間X? ± Z(1 − α/2)??√??為例,增大 n 或者增大α可縮小區(qū)間長度。

 10 .某調查公司接受委托滿意度調查,滿意度分數(shù)在 0~20 之間,隨機抽取 36 名消費者,平均滿意分 12,標準差 3,在大樣本的假設下,根據調查結果對總體平均滿意情況的 95%的置信區(qū)間,結果是:B A. 9~15 分 B. 11~13 分 分 C. 12~14 分 D. 6~18 分 因為:

 12 − ??3√36~??(0,1) 可得 11<μ<13

 11 .一位社會學者隨機抽取 3000 個家庭,想研究文化程度的高低與離婚率的高低是否有關,適合采用的檢驗方法應是( D

  )

 A. 正態(tài)分布檢驗

  B. t 分布檢驗

  C. 2? 擬合優(yōu)度檢驗

  D. 2? 獨立性度檢驗 正態(tài)分布檢驗:檢驗均值是否相等,不符合題目條件 t 分布檢驗:檢驗均值是否相等,不符合題目條件

 卡方擬合優(yōu)度檢驗:檢驗兩種分布是否相同,不符合題目條件 卡方獨立性度檢驗:檢驗列聯(lián)表的行與列是否獨立,與題目吻合 12 .在假設檢驗中,備擇假設所表達的含義總是指()

 A.參數(shù)是正確的 B.變量之間沒有關系 C.參數(shù)沒有發(fā)生變化 D.參數(shù)發(fā)生了變化

  13 .在估計某一總體的均值時,隨機抽取了 n 個單元作樣本,用樣本均值作為估計量,在構造置信區(qū)間時,發(fā)現(xiàn)置信區(qū)間太寬,有可能的原因是:BD A. 選擇的估計量有偏 B. 樣本量太小 C. 置信水平太大,應從 0.10 降低到 0.05 D. 精度要求太高 以置信區(qū)間X? ± Z(1 − α/2)??√??為例,增大 n 或者增大α可縮小區(qū)間長度。

 14 .指出下列的說法哪一個是正確的(BD

  )

 A 在置信水平一定的條件下,要提高可靠性,就應該縮小樣本量; B 在置信水平一定的條件下,要提高可靠性,就應該增大樣本量; C 在樣本量一定的條件下,要提高可靠性,就降低置信水平; D 在樣本量一定的條件下,要提高可靠性,就提高置信水平。

 以置信區(qū)間 X ?±Z(1-α/2)σ/√n 為例,增大 n 或者增大α可縮小區(qū)間長度。

 15 .在假設檢驗中,備擇假設所表達的含義總是指(?)

 A.參數(shù)是正確的

 B.變量之間沒有關系 C.參數(shù)沒有發(fā)生變化 D.參數(shù)發(fā)生了變化

 16 .某汽車生產廠家為增加某型號汽車的銷售量,采用促銷手段,促銷一個月后,分別收集了 8 個銷售點處促銷前一個月和促銷后一個月該車型的銷售輛,如果不考慮其他影響銷售量因素,僅通過觀察和分析這些樣本數(shù)據,是否認為這次促銷有助于提高汽車的銷售量。請將合適的可用于分析該類問題的檢驗過程選出來:C 銷售點代號:1 2 3 4 5 6

  7

 8 促銷前(輛): 90 83 105 97 110 78

 55

 123

 促銷后(輛): 97 80 110 93 123 84

 57

 110

 A. 如果樣本X 1 ,…,X

 n 獨立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨立同分布來自 N(22 ,? ? ), X Y ?在大樣本下有近似的正態(tài)分布,可以檢驗0 1 2: H ? ? ? ; B. 如果樣本X 1 ,…,X

 n 獨立同分布來自N(21 ,? ? ),Y 1 ,…,Y n 獨立同分布來自N(22 ,? ? ),i iX Y ?在大樣本下有正態(tài)分布,可以檢驗0 1 2: H ? ? ? ;

 C. 如果樣本 X 1 ,…,X

 n 獨立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨立同分布來自 N(22 ,? ? ), X Y ?有 t 分布,可以檢驗0 1 2: H ? ? ? ; D. 如果樣本X 1 ,…,X

 n 獨立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨立同分布來自 N(22 ,? ? ), X Y ?有2? 分布,可以檢驗0 1 2: H ? ? ? ; 本題為配對樣本均值比較問題,只有 C 符合檢驗該問題。

 二、簡答題:(10 分×3=30 分)

 1.假設檢驗的零假設和備擇假設的設立對于檢驗的結論影響不大,請問這樣的理解有問題嗎?請給出你的解釋。

 答:有問題。首先,設立某種零假設即設定了檢驗統(tǒng)計量,代表著確定了零分布,即 p 值計算依據;另外,零假設和備擇假設是不對稱的,通常將簡單的假設、需要被保護的假設作為零假設。

 2. 解釋下面符號的區(qū)別:

 2s , 2? 和2X? (提示:請按有放回和無放回抽樣分別敘述)

 有放回 無放回 2s :樣本方差 1?? − 1∑(?? ?? − ???) 2????=1 1?? − 1∑(?? ?? − ???) 2????=1 2? :總體方差 1??∑(?? ?? − ??) 2????=1 1??∑(?? ?? − ??) 2????=1 2X? :樣本均值的方差 ?? 2?? ?? 2??(1 −?? − 1?? − 1 )

 3.統(tǒng)計推斷與描述統(tǒng)計之間有哪些重要的區(qū)別? 描述統(tǒng)計是指對采集的數(shù)據進行登記、審核、整理、歸類,在此基礎上進一步計算出各種能反映總體數(shù)量特征的綜合指標,并用圖表的形式表示經過歸納分析而得到的各種有用的統(tǒng)計信息。

 推斷統(tǒng)計是研究如何利用樣本數(shù)據來推斷總體特征的統(tǒng)計學方法,其內容包括參數(shù)估計和假設檢驗兩大類。參數(shù)估計是利用樣本信息推斷總體特征,假設檢驗是利用樣本信息判斷對總體的假設是否成立。

  4.解釋 p 值檢驗的基本原理。

 P 值即概率,在原假設為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計學根據顯著性檢驗方法所得到的 P 值,一般以 P < 0.05 為顯著, P<0.01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小于 0.05 或 0.01。實際上,P 值不能賦予數(shù)據任何重要性,只能說明某事件發(fā)生的機率

 5.【負責人:3.1】請說明 Gamma 分布與卡方分布之間有哪些區(qū)別與聯(lián)系? 參數(shù)為 1/2 和 1/2 的 Gamma 分布等于自由度為 1 的卡方分布,相同λ參數(shù)的獨立 Gamma 分布之和服從 Gamma 分布,因此自由度為 n 的卡方分布是α=n/2,和λ=1/2 的 Gamma 分布。即:

 Ga( n2,12 ) = χ2 (??)

 6.

 求 Gamma 分布的矩估計; Gamma 分布的前兩階矩是 {μ 1 =????μ 2 =??(?? + 1)?? 2 解得 λ =μ 1μ 2 − μ 1 2

 α =μ 1 2μ 2 − μ 1 2

 由于σ ? 2 = μ 2 ? − μ 1 ? 2 ,矩估計方法是 {

 ???=???σ ? 2??? =???2σ ? 2

  7.假設檢驗中的兩類錯誤之間有什么關系?能否同時減少兩類錯誤? 原假設是正確的卻拒絕了原假設,所犯的錯誤成為第一類錯誤,犯第一類錯誤的概率即為α。原假設是錯誤的卻沒有拒絕原架設,所犯的錯誤稱為第二類錯誤,犯第二類錯誤的概率即為β。

 在固定樣本量 n 的情況下,要減小α必導致增大β。

 在固定樣本量 n 的情況下,要減小β必導致增大α。

 要使α、β都減小,需增大樣本量。

 8.簡述損失函數(shù)和風險函數(shù)的定義 在統(tǒng)計學,損失函數(shù)是指一種將一個事件(在一個樣本空間中的一個元素)映射到一個表達與其事件相關的經濟成本或機會成本的實數(shù)上的一種函數(shù)。更通俗地說,在統(tǒng)計學中損失函數(shù)是一種衡量損失和錯誤(這種損失與"錯誤地"估計有關,如費用或者設備的損失)程度的函數(shù)。

 風險函數(shù)是損失函數(shù)的期望值,表示為:R(θ,d) = E[L(d,θ)]。

  9.

 解釋 t 分布和正態(tài)分布之間的差異; t 分布由一個標準正態(tài)分布與一個卡方分布構成:

 T =??√ ????⁄ 其中 X~N(0,1),Y~?? 2 ( ?? )

 ,T 服從自由度為 n 的 t 分布 t 分布相對正態(tài)分布低峰厚位。

 當 n>30 時 t 分布近似于標準正態(tài)分布。

 10.解釋假設檢驗和置信區(qū)間估計的區(qū)別。

 參數(shù)估計是用統(tǒng)計量估計未知的參數(shù);如果參數(shù)已知(或假設已知),需要利用統(tǒng)計量檢驗已知的參數(shù)是否靠譜,此時為假設檢驗。

 區(qū)間估計立足于大概率,通常以較大的把握程度(置信水平)1-α去保證總體參數(shù)的置信區(qū)間。而假設檢驗立足于小概率,通常是給定很小的顯著性水平α去檢驗對總體參數(shù)的先驗假設是否成立。

  13.

 中位數(shù)檢驗與均值 t 檢驗之間的區(qū)別與聯(lián)系; --中位數(shù)檢驗是非參數(shù)統(tǒng)計方法,t 檢驗是參數(shù)統(tǒng)計方法; --中位數(shù)檢驗適用于總體分布未知的情景,t 檢驗需要總體正態(tài)分布的假設前提 --兩者都使用了代表樣本中心位置的指標。

  14.

 簡述置信區(qū)間估計和假設檢驗之間的關系。

 --計算置信區(qū)間的樞軸量與假設檢驗的統(tǒng)計量是同一個量 --置信區(qū)間的置信水平(1-α)與假設檢驗的顯著性水平α是兩個相互對立事件的概率 --使用置信區(qū)間可以完成假設檢驗

 三、計算題(25 分)

 1 . Hardy-Weinberg 平衡問題中,父代有兩種基因 M 和 N,M 在種群中的分布為 b(1,p)現(xiàn)在測量到了子代基因分布為:

 M MN N 總量 頻數(shù) 342 500 187 1029 a) 請根據這些數(shù)據求父代的 p 的極大似然估計;(10 分)

 b) 請給出 p 的置信區(qū)間的求解公式,并解釋; (15 分)

 解:

 a) 根據 Hardy-Weinberg 平衡定律,MM、MN、NN 出現(xiàn)的頻率分別是?? 2 、 2??(1 − ??) 、(1 − ??) 2 ,令 n 為總量,x1、x2、x3 代表三個單元的觀測數(shù)量,本案例是多項分布的參數(shù)推斷問題,似然函數(shù)是:

 f(p) =??!?? 1 !?? 2 !?? 3 !(?? 2 ) ?? 1 (2??(1 − ??)) ?? 2 ((1 − ??) 2 ) ?? 3

 對數(shù)似然是:

 ??(??) = log??! − ∑ log?? ?? !3??=1+ ?? 1 log?? 2 + ?? 2 log2??(1 − ??) + ?? 3 log(1 − ??) 2

 = log??! − ∑ log?? ?? !3??=1+ (2?? 1 + ?? 2 )log?? + (?? 2 + 2?? 3 )log(1 − ??) + ?? 2 log2 對 p 求導,令導數(shù)為 0,有

 2?? 1 +?? 2??−?? 2 +2?? 31−??= 0 求解得到

 p =2?? 1 +?? 22(?? 1 +?? 2 +?? 3 )

 那么極大似然估計 ??? =2 × 342 + 5002 × 1029= 0.575 b) 根據中央極限定理 ??? − ??√ ??(1 − ??)??~??(0,1) 當 p 未知,n 非常大時,使用???估計 p,得到置信區(qū)間:

 [??? − ??( ??2 )√ ???(1 − ???)??,??? + ??( ??2 )√ ???(1 − ???)??]

 2 .用 possion( ? )分布參數(shù) ? 的極大似然估計的漸進分布求置信區(qū)間。

 解:如果 X 服從參數(shù)為λ的 possion 分布,那么 P(X = x) =λ ?? ?? −λ?? ?? 聯(lián)合頻率函數(shù)是邊際頻率函數(shù)的乘積,那么對數(shù)似然是 l(λ) = ∑(?? ?? logλ − λ − log?? ??!)????=1 = ∑?? ??????=1logλ − ??λ − ∑log?? ?? !????=1 令一階導數(shù)為 0,得 ?? ′ (λ) =∑ ?? ????=1λ− ?? = 0 那么,極大似然估計是 ???= ???

 求解置信區(qū)間,需要計算I(λ),令??(??|λ)表示參數(shù)為λ的 PMF,需要計算 I(λ) = −E[?? 2??λ 2log??(??|λ)] 已知 log??(??|??) = ??log?? − ?? − log??! 可得 ?? 2??λ 2log??(??|??) = −???? 2

 那么 I(λ) =1??

 因此,λ的近似100(1 − α)%置信區(qū)間為 ???± ??(??/2) √?????

 3 . X 1 , X 2 , … ,X n

 是從兩點分布 Bernoulli(1,p)中抽取出來的獨立同分布樣本:

。1).求 (1-p) 2 的極大似然估計(10 分)。

。2)(1)中的估計量是無偏估計嗎?如果是有偏的,請給出(1-p) 2 的一個無偏估計(15分)

 解:(1)似然函數(shù)為:

 p(?? 1 ,?? 2 …?? ?? ) = ?? ∑?? ??????=1(1 − ??) ??−∑?? ??????=1 對數(shù)似然函數(shù)為:

 logp(?? 1 ,?? 2 …?? ?? ) = ∑?? ??????=1log?? + (?? − ∑?? ??????=1)log(1 − ??) 求導并令導數(shù)為 0,得到 ∑ ?? ??????=1??−?? − ∑ ?? ??????=11 − ??= 0 化簡,得 ??? =∑ ?? ??????=1??= ??? 那么(1-p)2 的極大似然估計為:(1 − ???) 2

。2)已知有 ????? 2 = Var??? + (?????) 2

 E(1 − ???) 2 = E(1 − 2??? + ??? 2 ) = 1 − 2E??? + ????? 2

 = 1 − 2p +??(1 − ??)??+ ?? 2

 因此,(1)中估計量不是無偏估計。

 因為有:(1-p) 2 =1-p-p(1-p)。

 已知 S 2 是 p(1-p)的無偏估計,???是 p 的無偏估計,那么(1-p) 2 的無偏估計為 1 − ??? − ?? 2

  4. nX X ,...,1是從正態(tài)分布 ) , (2? ? N )中抽取的獨立隨機變量,請回答

  1)計算????????22?SE ,S 2 是樣本方差;(10 分)

 2)請在所有的形式為 aX 1 +bX 2 的估計量中,找到 ? 2 的最小方差無偏估計;(10 分)

 解:(1)由于 (?? − 1)?? 2?? 2~?? 2 (?? − 1) 所以 E(?? − 1)?? 2?? 2= ?? − 1 解得 E?? 2?? 2= 1 (2)由題 E(aX 1 + bX 2 ) = 2μ 則 aμ + bμ = 2μ a + b = 2 要使Var(aX 1 + bX 2 )方差最小,帶入b = 2 − a,有

 Var(aX 1 + (2 − a)X 2 ) = ?? 2 ???????? 1 + (2 − ??) 2 ???????? 2 = (2?? 2 − 4?? + 4)?? 2

 求(2?? 2 − 4?? + 4)的極小值,令導數(shù)為 0,得到 4a-4=0,則 a=1 那么,當 a=1 是有最小方差無偏估計 X 1 +X 2

  四、 論述題:(25 分)

 1. 研究者想了解某種電子設備產品在一年的各個季節(jié)里被購買的情況是否存在不同。如果用銷售量來解釋這一問題,對這一問題可能提出的最簡單的零假設可能是什么?在這一假設之下,研究者調查了有關這種產品過去 3 年的銷售量 2070 萬臺。

 表 1 某種電子設備產品在過去 3 年中的銷售量 季節(jié) O (萬)

 E O i -E i

 (O i -E i ) 2

 ii iEE O2) ( ? 春季

  495 517.5 -22.5 506.25 0.98 夏季

  503 517.5 -14.5 210.25 0.41 秋季

  491 517.5 -26.5 702.25 1.36 冬季 581 517.5 63.5 4032.25 7.79 總計

 2070 2070 0 5451 10.54 1.解釋表頭字母的含義; O

 表示第 i 個季節(jié)實際銷售觀測數(shù) E

 表示如果假定各季節(jié)銷售無差異時的銷售期望數(shù) O i -E i

  觀測與期望的差值 (O i -E i ) 2

  偏差平方 (O i -E i ) 2 / E i

  偏差平方與期望數(shù)的比值 2.請將上面的表格填寫完整。

 3.如果 81 . 7 ) 95 . 0 , 3 (2? ? ,請給出你的推斷過程和據此可能的結論。

 由于 10.54 大于 7.81,卡方擬合優(yōu)度檢驗統(tǒng)計量落在拒絕域中,則拒絕原假設,電子設備產品在一年的各個季節(jié)里被購買的情況存在不同。

  2. 研究者想了解某地區(qū)的醫(yī)院出院人數(shù)(DISC)和床位量(BEDN),調查了 21 家醫(yī)院數(shù)據,分為甲級(I)和乙級(II)兩類如下:

 等級 I I I I I II II II II II II II II II II II II II II II II DISC

 91 240 255 233 315 200 266 120 228 362 414 518 389 535 273 440 431 534 426 505 322

 BEDN

 62 64 67 69 70 73 81 91 96 100 100 103 110 127 111 116 120 122 130 137 142 1.如果我們感興趣的問題是醫(yī)院出院人數(shù)小于 400 的比例估計,請給出通過抽取樣本研究這一問題的統(tǒng)計推斷問題和估計量; 2.如果假定 p 來自先驗分布 beta(a,,b),請先根據甲級醫(yī)院估計出 a 和 b , 再給出對乙級醫(yī)院 p 的后驗估計計算公式和計算結果; 3.如果將床位量按(0,70],(71,110]以及(110,150] 分為大,中,小,請給出用來判斷床位數(shù)和出院人數(shù)關系的統(tǒng)計模型和解答。

 解:

。1)用 X 表示出院人數(shù)是否小于 400 的隨機變量,則 X~b(1,p) 其中:p=Pr(X<400) 則: ??? =∑ ?? ??????=1?? (2)因為:后驗∝先驗•似然,則 p 的后驗 ∝ (p ??−1 (1 − ??) ??−1 )(?? ∑?? ?? (1 − ??) ??−∑?? ?? ) ∝ p ??+∑?? ?? −1 (1 − ??) ??+??−∑?? ?? −1

 那么 p~beta(a + ∑?? ??????=1,b + n − ∑?? ??????=1) 其中,n 為樣本量。根據 beta 分布的期望得到后驗估計 ??? =a + ∑ ?? ??????=1a + b + n (3)構造列聯(lián)表:

 床位量/出院人數(shù) 小于 400 大于 400 總計 小 1134 0 1134 中 1565 932 2497 大 595 2871 3466 總計 3294 3803 7097 使用卡方獨立性檢驗,H0:床位數(shù)與出院人數(shù)獨立,H1:床位數(shù)與出院人數(shù)相關 1)R 語言 R 語言中使用 chisq.test()函數(shù)數(shù)對列聯(lián)表的行變量和列變量進行卡方獨立性檢驗,執(zhí)行:

 >chisq.test(data.frame(c(1134, 1565, 595), c(0, 932, 2871))) 輸出 X-squared = 2766.8,df=2,p-value < 2.2e-16

 所以拒絕原假設,床位數(shù)與出院人數(shù)不獨立。

 2)直接計算:

 卡方統(tǒng)計量:χ 2 = ∑ ∑(??− ?? .?? ?? .?? ??⁄ ) 2?? .?? ?? .????⁄2??=13??=1 代入計算得 2766.8,自由度為 2,給出的 p 值小于 0.01,所以拒絕原假設。

  4. 研究者想了解某種產品在四家商場中購買是否存在不同。如果用銷售量來解釋這一問題,對這一問題可能提出的最簡單的零假設可能是什么?在這一假設之下,研究者調查了有關這種產品過去 2 年的銷售量 196 萬臺。

 表 1 某種產品在過去 2 年中的銷售量 商場 O (萬)

 E O i -E i

 (O i -E i ) 2

 ii iEE O2) ( ? A

  98

  B

  67

  C

  13

  D 18

  總計

 196

  1.解釋表頭字母的含義; 2.請將上面的表格填寫完整。

 3.如果 81 . 7 ) 95 . 0 , 3 (2? ? ,請給出你的推斷過程和據此可能的結論。

 同第一題

 5. 某種感冒沖劑規(guī)定每包重量為 12 克,超重或過輕都是嚴重問題。質檢員抽取 25 包沖劑稱重檢驗,得到平均每包的重量為 11.85 克,標準差 6 . 0 ? s 克。假定產品重量服從正態(tài)分布( 05 . 0 ? ? )。( 96 . 12??z , 71 . 12??t )

 (1)

 感冒沖劑的每包重量是否符合標準要求?(寫出詳細的檢驗過程)

 (2)

 檢驗結論能否證明感冒沖劑的每包重量符合標準要求?為什么? (3)

 上述檢驗結論可能犯哪一類錯誤?說明這一錯誤的實際含義。

 (4)

 根據上述檢驗計算出的 223 . 0 ? P ,解釋這個 P 值的具體含義。

 (1)解:

 H0:μ=12 H1:μ≠12 t =??? − ????√??⁄=11.85 − 120.6√25⁄= −1.25 ∵ |??| = 1.25 < ?? ?? 2⁄= 1.71

 故不拒絕原假設,認為符合標準

 (2) 不能,假設檢驗只是得出符合標準的概率較大,沒有大概率表明原假設錯誤,不能拒絕原假設但并不能認為原假設一定正確。

 (3) 上述檢驗結論犯了第 II 類錯誤,原假設錯誤,由于樣本落入接受域中而錯誤的接受原假設,這個樣本提供的證據還不足以證明產品不符合每包 12g 的要求因此接受了符合要求的原假設。

 (4) 原假設成立的概率是 p,由于 p=0.223>0.05,所以認為差別由抽樣誤差引起,不能拒絕原假設。

相關熱詞搜索:統(tǒng)計學 考題 精簡版

版權所有 蒲公英文摘 www.newchangjing.com