高等統(tǒng)計(jì)學(xué)考題人大精簡版
發(fā)布時(shí)間:2020-09-09 來源: 實(shí)習(xí)報(bào)告 點(diǎn)擊:
高等統(tǒng)計(jì)學(xué)考題人大精簡版 題 一、多項(xiàng)選擇題(每題 4 分,一共 20 分,每題要求:選擇正確答案,對(duì)選擇或未選答案進(jìn)行簡要而清晰的原因解釋。將答案填寫在答題紙上,填寫在試題上無效。得分規(guī)則:選對(duì)得 并對(duì)答案解釋合理,得 4 分;沒有對(duì)未選答案解釋最多得 2 分;漏選得 1 分,選錯(cuò)可參考得 解釋酌情給分;不選得 0 分)
1 .有關(guān)樣本的分布,以下陳述正確的是:ABC A. 如果樣本 X 1 ,…,X n 獨(dú)立同分布來自 Gamma 分布, ???niiXnX11在大樣本下有近似的正態(tài)分布; 【對(duì)。滿足中央極限定理?xiàng)l件】
B.如果樣本 X 1 ,…,X n 獨(dú)立同分布來自 N(2, ? ?), ???niiXnX11在大樣本情況下有精確分布 N( n / ,2? ?); 【對(duì)。獨(dú)立同分布正態(tài)隨機(jī)變量的均值仍是正態(tài)分布,方差值符合中央極限定理】
C.如果樣本 X 1 ,…,X n 獨(dú)立同分布來自 N(2, ? ?),即使樣本量不大, ???niiXnX11也服從正態(tài)分布; 【對(duì)。獨(dú)立同分布正態(tài)隨機(jī)變量的均值仍是正態(tài)分布】
D.如果樣本 X 1 ,…,X n 來自任意分布,在大樣本情況下,由 X 1 ,…,X n 組成的數(shù)據(jù)有近似的正態(tài)分布; 【錯(cuò)。如果 X 1 ,…,X n 強(qiáng)相關(guān),則不成立;即使 i.i.d 情況下也不是任意的數(shù)據(jù)組成方式都是正態(tài)分布】
2 .有關(guān)檢驗(yàn)的 p 值,下面說法正確的是:C
A. 一般為[0,0.1]之間的一個(gè)很小的概率; 【錯(cuò)。p 值是計(jì)算得出的概率,取值 0-1 之間】
B. 接受備擇假設(shè)的最小顯著性水平; 【錯(cuò)。接受備擇假設(shè)說法不準(zhǔn)確】
C. 如果 p 值小于顯著性水平,則拒絕零假設(shè);
【對(duì)。符合假設(shè)檢驗(yàn)規(guī)則】
D. 樣本統(tǒng)計(jì)量的分布函數(shù)。
【錯(cuò)。p 值根據(jù)檢驗(yàn)統(tǒng)計(jì)量分布函數(shù)計(jì)算得出】
卷 (卷 3 )5.有關(guān)檢驗(yàn)的 p 值,下面說法正確的是:CD A. 一般為[0,0.1]之間一個(gè)較小的概率; 【錯(cuò)。檢驗(yàn)結(jié)果不拒絕原假設(shè)的情況下,p 值較大】
B. 接受備擇假設(shè)的最小顯著性水平; 【錯(cuò)。接受備擇假設(shè)說法不準(zhǔn)確】
C. 如果 p 值小于顯著性水平,則拒絕零假設(shè);
【對(duì)。符合假設(shè)檢驗(yàn)規(guī)則】
D. 樣本統(tǒng)計(jì)量的尾概率。
【對(duì)?烧J(rèn)為 p 值是原假設(shè)為真時(shí)小于等于實(shí)際觀測結(jié)果的概率】
3 .請(qǐng)問以下哪些方法可以用來判斷數(shù)據(jù)可能背離正態(tài)分布:
A. Q-Q 圖上,如果數(shù)據(jù)和基線之間幾乎吻合; 【錯(cuò)。正態(tài) qq 圖數(shù)據(jù)和基線之間幾乎吻合說明數(shù)據(jù)接近正態(tài)分布】
B. Kolmogrov-Smirnov 正態(tài)檢驗(yàn)中的統(tǒng)計(jì)量所對(duì)應(yīng)的 p 值小于 0.05; 【對(duì)。ks 正態(tài)檢驗(yàn)原假設(shè)是兩個(gè)數(shù)據(jù)分布一致或者數(shù)據(jù)符合正態(tài)分布,p 值小于 0.05拒絕原假設(shè)】
C.對(duì)數(shù)據(jù)直方圖做光滑后沒有發(fā)現(xiàn)數(shù)據(jù)有很大的發(fā)散趨勢; 【錯(cuò)。發(fā)散趨勢不能決定分布形態(tài)】
D.2? 擬合優(yōu)度檢驗(yàn),統(tǒng)計(jì)量的值偏小。
【錯(cuò)。2? 擬合優(yōu)度檢驗(yàn)可以檢驗(yàn)分布是否正態(tài),原假設(shè)為觀測服從給定概率值的多項(xiàng)分布,統(tǒng)計(jì)量的值偏小不拒絕原假設(shè)】
4 .若抽樣誤差為 5,總體標(biāo)準(zhǔn)差為 40,如果樣本量足夠大,正態(tài)分布的 0.975 分位數(shù)近似為 2,要估計(jì)總體均值的 95%的置信區(qū)間所需要的樣本量大概為:
A
156;B 256;C 356 ; d) 456. 因 ???−????√??~??(0,1),那么 2 =540/√?? ,求解 n=256
5 .關(guān)于假設(shè)檢驗(yàn),給定一組獨(dú)立同分布的隨機(jī)樣本,給定顯著性水平,如下理解正確的是:D
A.單邊檢驗(yàn)拒絕,雙邊檢驗(yàn)一定拒絕;【錯(cuò),】
B.雙邊檢驗(yàn)接受,一定有一個(gè)單邊檢驗(yàn)是拒絕的;【錯(cuò)】
C.單邊檢驗(yàn)拒絕,雙邊檢驗(yàn)一定拒絕!惧e(cuò)】
D.雙邊檢驗(yàn)拒絕,一定有一個(gè)單邊檢驗(yàn)是拒絕的;【對(duì)】
畫圖解釋
6 .某汽車生產(chǎn)廠家為增加某型號(hào)汽車的銷售量,采用促銷手段,促銷一個(gè)月后,分別收集了 8 個(gè)銷售點(diǎn)處促銷前一個(gè)月和促銷后一個(gè)月該車型的銷售輛,如果不考慮其他影響銷售量因素,僅通過觀察和分析這些樣本數(shù)據(jù),是否認(rèn)為這次促銷有助于提高汽車的銷售量。請(qǐng)將合適的可用于分析該類問題的檢驗(yàn)過程選出來:C 銷售點(diǎn)代號(hào):1 2 3 4 5 6
7
8 促銷前(輛): 90 83 105 97 110 78
55
123
促銷后(輛): 97 80 110 93 123 84
57
110
A. 兩樣本 Z 檢驗(yàn) B. 兩樣本 t 檢驗(yàn) C. 單一樣本 t 檢驗(yàn) D. 單一樣本 Z 檢驗(yàn) 本問題是配對(duì)樣本之間的比較,小樣本,方差未知,采用單一樣本的 t 檢驗(yàn),其他都不符合。
7 .在參數(shù)估計(jì)中,要求通過樣本的統(tǒng)計(jì)量來估計(jì)總體參數(shù),評(píng)價(jià)統(tǒng)計(jì)量的標(biāo)準(zhǔn)之一是該統(tǒng)計(jì)量隨著樣本量的增大,它與它估計(jì)的總體參數(shù)越來越近,這種評(píng)價(jià)標(biāo)準(zhǔn)稱為:
A.無偏性
B.有效性
C. 一致性
D.充分性 無偏性指估計(jì)量的期望與總體參數(shù)相等 充分性指估計(jì)量包含了參數(shù)的全部信息 有效性指無偏估計(jì)量的方差達(dá)到 C-R 下界
8 .研究人員對(duì)有糖尿病的老鼠和正常老鼠血液中某種礦物質(zhì)的含量進(jìn)行研究,經(jīng)驗(yàn)表明有糖尿病的老鼠和正常老鼠血液中某種礦物質(zhì)的含量測量方差相等,測得如下試驗(yàn)數(shù)據(jù):
糖尿病老鼠:9 只,樣本均值 64.26,樣本方差 1.40
正常老鼠:
7 只,樣本均值 75.66,樣本方差 1.32 在置信水平為 0.10 之下,有糖尿病的老鼠和正常老鼠血液中 Fe 的含量之差的置信區(qū)間為(t(0.95,14)=1.76):
A. [5.68,15.56] B. [8.02,19.47] C.[10.36,12.43] D.[6.53,16.32] 有 t =(??? − ???) − (?? ?? − ?? ?? )?? ?? √ 1??+1?? 其中 S ?? 2 =(?? − 1)?? ?? + (?? − 1)?? ???? + ?? − 2 代入計(jì)算[(75.66 − 64.26) ± 1.76 × √( 19+17 )((9−1)×1.4+(7−1)×1.329+7−2)]可得。
9 .置信水平為 α,下列說法正確的是(BD
), A 在置信水平一定的條件下,提高置信估計(jì)精度需要縮小樣本量; B 在置信水平一定的條件下,提高置信估計(jì)精度需要增加樣本量; C 在樣本量一定的條件下,提高置信估計(jì)精度,需要降低置信水平; D 在樣本量一定的條件下,提高置信估計(jì)精度,需要增大置信水平。
以置信區(qū)間X? ± Z(1 − α/2)??√??為例,增大 n 或者增大α可縮小區(qū)間長度。
10 .某調(diào)查公司接受委托滿意度調(diào)查,滿意度分?jǐn)?shù)在 0~20 之間,隨機(jī)抽取 36 名消費(fèi)者,平均滿意分 12,標(biāo)準(zhǔn)差 3,在大樣本的假設(shè)下,根據(jù)調(diào)查結(jié)果對(duì)總體平均滿意情況的 95%的置信區(qū)間,結(jié)果是:B A. 9~15 分 B. 11~13 分 分 C. 12~14 分 D. 6~18 分 因?yàn)椋?/p>
12 − ??3√36~??(0,1) 可得 11<μ<13
11 .一位社會(huì)學(xué)者隨機(jī)抽取 3000 個(gè)家庭,想研究文化程度的高低與離婚率的高低是否有關(guān),適合采用的檢驗(yàn)方法應(yīng)是( D
)
A. 正態(tài)分布檢驗(yàn)
B. t 分布檢驗(yàn)
C. 2? 擬合優(yōu)度檢驗(yàn)
D. 2? 獨(dú)立性度檢驗(yàn) 正態(tài)分布檢驗(yàn):檢驗(yàn)均值是否相等,不符合題目條件 t 分布檢驗(yàn):檢驗(yàn)均值是否相等,不符合題目條件
卡方擬合優(yōu)度檢驗(yàn):檢驗(yàn)兩種分布是否相同,不符合題目條件 卡方獨(dú)立性度檢驗(yàn):檢驗(yàn)列聯(lián)表的行與列是否獨(dú)立,與題目吻合 12 .在假設(shè)檢驗(yàn)中,備擇假設(shè)所表達(dá)的含義總是指()
A.參數(shù)是正確的 B.變量之間沒有關(guān)系 C.參數(shù)沒有發(fā)生變化 D.參數(shù)發(fā)生了變化
13 .在估計(jì)某一總體的均值時(shí),隨機(jī)抽取了 n 個(gè)單元作樣本,用樣本均值作為估計(jì)量,在構(gòu)造置信區(qū)間時(shí),發(fā)現(xiàn)置信區(qū)間太寬,有可能的原因是:BD A. 選擇的估計(jì)量有偏 B. 樣本量太小 C. 置信水平太大,應(yīng)從 0.10 降低到 0.05 D. 精度要求太高 以置信區(qū)間X? ± Z(1 − α/2)??√??為例,增大 n 或者增大α可縮小區(qū)間長度。
14 .指出下列的說法哪一個(gè)是正確的(BD
)
A 在置信水平一定的條件下,要提高可靠性,就應(yīng)該縮小樣本量; B 在置信水平一定的條件下,要提高可靠性,就應(yīng)該增大樣本量; C 在樣本量一定的條件下,要提高可靠性,就降低置信水平; D 在樣本量一定的條件下,要提高可靠性,就提高置信水平。
以置信區(qū)間 X ?±Z(1-α/2)σ/√n 為例,增大 n 或者增大α可縮小區(qū)間長度。
15 .在假設(shè)檢驗(yàn)中,備擇假設(shè)所表達(dá)的含義總是指(?)
A.參數(shù)是正確的
B.變量之間沒有關(guān)系 C.參數(shù)沒有發(fā)生變化 D.參數(shù)發(fā)生了變化
16 .某汽車生產(chǎn)廠家為增加某型號(hào)汽車的銷售量,采用促銷手段,促銷一個(gè)月后,分別收集了 8 個(gè)銷售點(diǎn)處促銷前一個(gè)月和促銷后一個(gè)月該車型的銷售輛,如果不考慮其他影響銷售量因素,僅通過觀察和分析這些樣本數(shù)據(jù),是否認(rèn)為這次促銷有助于提高汽車的銷售量。請(qǐng)將合適的可用于分析該類問題的檢驗(yàn)過程選出來:C 銷售點(diǎn)代號(hào):1 2 3 4 5 6
7
8 促銷前(輛): 90 83 105 97 110 78
55
123
促銷后(輛): 97 80 110 93 123 84
57
110
A. 如果樣本X 1 ,…,X
n 獨(dú)立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨(dú)立同分布來自 N(22 ,? ? ), X Y ?在大樣本下有近似的正態(tài)分布,可以檢驗(yàn)0 1 2: H ? ? ? ; B. 如果樣本X 1 ,…,X
n 獨(dú)立同分布來自N(21 ,? ? ),Y 1 ,…,Y n 獨(dú)立同分布來自N(22 ,? ? ),i iX Y ?在大樣本下有正態(tài)分布,可以檢驗(yàn)0 1 2: H ? ? ? ;
C. 如果樣本 X 1 ,…,X
n 獨(dú)立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨(dú)立同分布來自 N(22 ,? ? ), X Y ?有 t 分布,可以檢驗(yàn)0 1 2: H ? ? ? ; D. 如果樣本X 1 ,…,X
n 獨(dú)立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨(dú)立同分布來自 N(22 ,? ? ), X Y ?有2? 分布,可以檢驗(yàn)0 1 2: H ? ? ? ; 本題為配對(duì)樣本均值比較問題,只有 C 符合檢驗(yàn)該問題。
二、簡答題:(10 分×3=30 分)
1.假設(shè)檢驗(yàn)的零假設(shè)和備擇假設(shè)的設(shè)立對(duì)于檢驗(yàn)的結(jié)論影響不大,請(qǐng)問這樣的理解有問題嗎?請(qǐng)給出你的解釋。
答:有問題。首先,設(shè)立某種零假設(shè)即設(shè)定了檢驗(yàn)統(tǒng)計(jì)量,代表著確定了零分布,即 p 值計(jì)算依據(jù);另外,零假設(shè)和備擇假設(shè)是不對(duì)稱的,通常將簡單的假設(shè)、需要被保護(hù)的假設(shè)作為零假設(shè)。
2. 解釋下面符號(hào)的區(qū)別:
2s , 2? 和2X? (提示:請(qǐng)按有放回和無放回抽樣分別敘述)
有放回 無放回 2s :樣本方差 1?? − 1∑(?? ?? − ???) 2????=1 1?? − 1∑(?? ?? − ???) 2????=1 2? :總體方差 1??∑(?? ?? − ??) 2????=1 1??∑(?? ?? − ??) 2????=1 2X? :樣本均值的方差 ?? 2?? ?? 2??(1 −?? − 1?? − 1 )
3.統(tǒng)計(jì)推斷與描述統(tǒng)計(jì)之間有哪些重要的區(qū)別? 描述統(tǒng)計(jì)是指對(duì)采集的數(shù)據(jù)進(jìn)行登記、審核、整理、歸類,在此基礎(chǔ)上進(jìn)一步計(jì)算出各種能反映總體數(shù)量特征的綜合指標(biāo),并用圖表的形式表示經(jīng)過歸納分析而得到的各種有用的統(tǒng)計(jì)信息。
推斷統(tǒng)計(jì)是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)學(xué)方法,其內(nèi)容包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩大類。參數(shù)估計(jì)是利用樣本信息推斷總體特征,假設(shè)檢驗(yàn)是利用樣本信息判斷對(duì)總體的假設(shè)是否成立。
4.解釋 p 值檢驗(yàn)的基本原理。
P 值即概率,在原假設(shè)為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計(jì)學(xué)根據(jù)顯著性檢驗(yàn)方法所得到的 P 值,一般以 P < 0.05 為顯著, P<0.01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小于 0.05 或 0.01。實(shí)際上,P 值不能賦予數(shù)據(jù)任何重要性,只能說明某事件發(fā)生的機(jī)率
5.【負(fù)責(zé)人:3.1】請(qǐng)說明 Gamma 分布與卡方分布之間有哪些區(qū)別與聯(lián)系? 參數(shù)為 1/2 和 1/2 的 Gamma 分布等于自由度為 1 的卡方分布,相同λ參數(shù)的獨(dú)立 Gamma 分布之和服從 Gamma 分布,因此自由度為 n 的卡方分布是α=n/2,和λ=1/2 的 Gamma 分布。即:
Ga( n2,12 ) = χ2 (??)
6.
求 Gamma 分布的矩估計(jì); Gamma 分布的前兩階矩是 {μ 1 =????μ 2 =??(?? + 1)?? 2 解得 λ =μ 1μ 2 − μ 1 2
α =μ 1 2μ 2 − μ 1 2
由于σ ? 2 = μ 2 ? − μ 1 ? 2 ,矩估計(jì)方法是 {
???=???σ ? 2??? =???2σ ? 2
7.假設(shè)檢驗(yàn)中的兩類錯(cuò)誤之間有什么關(guān)系?能否同時(shí)減少兩類錯(cuò)誤? 原假設(shè)是正確的卻拒絕了原假設(shè),所犯的錯(cuò)誤成為第一類錯(cuò)誤,犯第一類錯(cuò)誤的概率即為α。原假設(shè)是錯(cuò)誤的卻沒有拒絕原架設(shè),所犯的錯(cuò)誤稱為第二類錯(cuò)誤,犯第二類錯(cuò)誤的概率即為β。
在固定樣本量 n 的情況下,要減小α必導(dǎo)致增大β。
在固定樣本量 n 的情況下,要減小β必導(dǎo)致增大α。
要使α、β都減小,需增大樣本量。
8.簡述損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的定義 在統(tǒng)計(jì)學(xué),損失函數(shù)是指一種將一個(gè)事件(在一個(gè)樣本空間中的一個(gè)元素)映射到一個(gè)表達(dá)與其事件相關(guān)的經(jīng)濟(jì)成本或機(jī)會(huì)成本的實(shí)數(shù)上的一種函數(shù)。更通俗地說,在統(tǒng)計(jì)學(xué)中損失函數(shù)是一種衡量損失和錯(cuò)誤(這種損失與"錯(cuò)誤地"估計(jì)有關(guān),如費(fèi)用或者設(shè)備的損失)程度的函數(shù)。
風(fēng)險(xiǎn)函數(shù)是損失函數(shù)的期望值,表示為:R(θ,d) = E[L(d,θ)]。
9.
解釋 t 分布和正態(tài)分布之間的差異; t 分布由一個(gè)標(biāo)準(zhǔn)正態(tài)分布與一個(gè)卡方分布構(gòu)成:
T =??√ ????⁄ 其中 X~N(0,1),Y~?? 2 ( ?? )
,T 服從自由度為 n 的 t 分布 t 分布相對(duì)正態(tài)分布低峰厚位。
當(dāng) n>30 時(shí) t 分布近似于標(biāo)準(zhǔn)正態(tài)分布。
10.解釋假設(shè)檢驗(yàn)和置信區(qū)間估計(jì)的區(qū)別。
參數(shù)估計(jì)是用統(tǒng)計(jì)量估計(jì)未知的參數(shù);如果參數(shù)已知(或假設(shè)已知),需要利用統(tǒng)計(jì)量檢驗(yàn)已知的參數(shù)是否靠譜,此時(shí)為假設(shè)檢驗(yàn)。
區(qū)間估計(jì)立足于大概率,通常以較大的把握程度(置信水平)1-α去保證總體參數(shù)的置信區(qū)間。而假設(shè)檢驗(yàn)立足于小概率,通常是給定很小的顯著性水平α去檢驗(yàn)對(duì)總體參數(shù)的先驗(yàn)假設(shè)是否成立。
13.
中位數(shù)檢驗(yàn)與均值 t 檢驗(yàn)之間的區(qū)別與聯(lián)系; --中位數(shù)檢驗(yàn)是非參數(shù)統(tǒng)計(jì)方法,t 檢驗(yàn)是參數(shù)統(tǒng)計(jì)方法; --中位數(shù)檢驗(yàn)適用于總體分布未知的情景,t 檢驗(yàn)需要總體正態(tài)分布的假設(shè)前提 --兩者都使用了代表樣本中心位置的指標(biāo)。
14.
簡述置信區(qū)間估計(jì)和假設(shè)檢驗(yàn)之間的關(guān)系。
--計(jì)算置信區(qū)間的樞軸量與假設(shè)檢驗(yàn)的統(tǒng)計(jì)量是同一個(gè)量 --置信區(qū)間的置信水平(1-α)與假設(shè)檢驗(yàn)的顯著性水平α是兩個(gè)相互對(duì)立事件的概率 --使用置信區(qū)間可以完成假設(shè)檢驗(yàn)
三、計(jì)算題(25 分)
1 . Hardy-Weinberg 平衡問題中,父代有兩種基因 M 和 N,M 在種群中的分布為 b(1,p)現(xiàn)在測量到了子代基因分布為:
M MN N 總量 頻數(shù) 342 500 187 1029 a) 請(qǐng)根據(jù)這些數(shù)據(jù)求父代的 p 的極大似然估計(jì);(10 分)
b) 請(qǐng)給出 p 的置信區(qū)間的求解公式,并解釋; (15 分)
解:
a) 根據(jù) Hardy-Weinberg 平衡定律,MM、MN、NN 出現(xiàn)的頻率分別是?? 2 、 2??(1 − ??) 、(1 − ??) 2 ,令 n 為總量,x1、x2、x3 代表三個(gè)單元的觀測數(shù)量,本案例是多項(xiàng)分布的參數(shù)推斷問題,似然函數(shù)是:
f(p) =??!?? 1 !?? 2 !?? 3 !(?? 2 ) ?? 1 (2??(1 − ??)) ?? 2 ((1 − ??) 2 ) ?? 3
對(duì)數(shù)似然是:
??(??) = log??! − ∑ log?? ?? !3??=1+ ?? 1 log?? 2 + ?? 2 log2??(1 − ??) + ?? 3 log(1 − ??) 2
= log??! − ∑ log?? ?? !3??=1+ (2?? 1 + ?? 2 )log?? + (?? 2 + 2?? 3 )log(1 − ??) + ?? 2 log2 對(duì) p 求導(dǎo),令導(dǎo)數(shù)為 0,有
2?? 1 +?? 2??−?? 2 +2?? 31−??= 0 求解得到
p =2?? 1 +?? 22(?? 1 +?? 2 +?? 3 )
那么極大似然估計(jì) ??? =2 × 342 + 5002 × 1029= 0.575 b) 根據(jù)中央極限定理 ??? − ??√ ??(1 − ??)??~??(0,1) 當(dāng) p 未知,n 非常大時(shí),使用???估計(jì) p,得到置信區(qū)間:
[??? − ??( ??2 )√ ???(1 − ???)??,??? + ??( ??2 )√ ???(1 − ???)??]
2 .用 possion( ? )分布參數(shù) ? 的極大似然估計(jì)的漸進(jìn)分布求置信區(qū)間。
解:如果 X 服從參數(shù)為λ的 possion 分布,那么 P(X = x) =λ ?? ?? −λ?? ?? 聯(lián)合頻率函數(shù)是邊際頻率函數(shù)的乘積,那么對(duì)數(shù)似然是 l(λ) = ∑(?? ?? logλ − λ − log?? ??!)????=1 = ∑?? ??????=1logλ − ??λ − ∑log?? ?? !????=1 令一階導(dǎo)數(shù)為 0,得 ?? ′ (λ) =∑ ?? ????=1λ− ?? = 0 那么,極大似然估計(jì)是 ???= ???
求解置信區(qū)間,需要計(jì)算I(λ),令??(??|λ)表示參數(shù)為λ的 PMF,需要計(jì)算 I(λ) = −E[?? 2??λ 2log??(??|λ)] 已知 log??(??|??) = ??log?? − ?? − log??! 可得 ?? 2??λ 2log??(??|??) = −???? 2
那么 I(λ) =1??
因此,λ的近似100(1 − α)%置信區(qū)間為 ???± ??(??/2) √?????
3 . X 1 , X 2 , … ,X n
是從兩點(diǎn)分布 Bernoulli(1,p)中抽取出來的獨(dú)立同分布樣本:
(1).求 (1-p) 2 的極大似然估計(jì)(10 分)。
(2)(1)中的估計(jì)量是無偏估計(jì)嗎?如果是有偏的,請(qǐng)給出(1-p) 2 的一個(gè)無偏估計(jì)(15分)
解:(1)似然函數(shù)為:
p(?? 1 ,?? 2 …?? ?? ) = ?? ∑?? ??????=1(1 − ??) ??−∑?? ??????=1 對(duì)數(shù)似然函數(shù)為:
logp(?? 1 ,?? 2 …?? ?? ) = ∑?? ??????=1log?? + (?? − ∑?? ??????=1)log(1 − ??) 求導(dǎo)并令導(dǎo)數(shù)為 0,得到 ∑ ?? ??????=1??−?? − ∑ ?? ??????=11 − ??= 0 化簡,得 ??? =∑ ?? ??????=1??= ??? 那么(1-p)2 的極大似然估計(jì)為:(1 − ???) 2
(2)已知有 ????? 2 = Var??? + (?????) 2
E(1 − ???) 2 = E(1 − 2??? + ??? 2 ) = 1 − 2E??? + ????? 2
= 1 − 2p +??(1 − ??)??+ ?? 2
因此,(1)中估計(jì)量不是無偏估計(jì)。
因?yàn)橛校?1-p) 2 =1-p-p(1-p)。
已知 S 2 是 p(1-p)的無偏估計(jì),???是 p 的無偏估計(jì),那么(1-p) 2 的無偏估計(jì)為 1 − ??? − ?? 2
4. nX X ,...,1是從正態(tài)分布 ) , (2? ? N )中抽取的獨(dú)立隨機(jī)變量,請(qǐng)回答
1)計(jì)算????????22?SE ,S 2 是樣本方差;(10 分)
2)請(qǐng)?jiān)谒械男问綖?aX 1 +bX 2 的估計(jì)量中,找到 ? 2 的最小方差無偏估計(jì);(10 分)
解:(1)由于 (?? − 1)?? 2?? 2~?? 2 (?? − 1) 所以 E(?? − 1)?? 2?? 2= ?? − 1 解得 E?? 2?? 2= 1 (2)由題 E(aX 1 + bX 2 ) = 2μ 則 aμ + bμ = 2μ a + b = 2 要使Var(aX 1 + bX 2 )方差最小,帶入b = 2 − a,有
Var(aX 1 + (2 − a)X 2 ) = ?? 2 ???????? 1 + (2 − ??) 2 ???????? 2 = (2?? 2 − 4?? + 4)?? 2
求(2?? 2 − 4?? + 4)的極小值,令導(dǎo)數(shù)為 0,得到 4a-4=0,則 a=1 那么,當(dāng) a=1 是有最小方差無偏估計(jì) X 1 +X 2
四、 論述題:(25 分)
1. 研究者想了解某種電子設(shè)備產(chǎn)品在一年的各個(gè)季節(jié)里被購買的情況是否存在不同。如果用銷售量來解釋這一問題,對(duì)這一問題可能提出的最簡單的零假設(shè)可能是什么?在這一假設(shè)之下,研究者調(diào)查了有關(guān)這種產(chǎn)品過去 3 年的銷售量 2070 萬臺(tái)。
表 1 某種電子設(shè)備產(chǎn)品在過去 3 年中的銷售量 季節(jié) O (萬)
E O i -E i
(O i -E i ) 2
ii iEE O2) ( ? 春季
495 517.5 -22.5 506.25 0.98 夏季
503 517.5 -14.5 210.25 0.41 秋季
491 517.5 -26.5 702.25 1.36 冬季 581 517.5 63.5 4032.25 7.79 總計(jì)
2070 2070 0 5451 10.54 1.解釋表頭字母的含義; O
表示第 i 個(gè)季節(jié)實(shí)際銷售觀測數(shù) E
表示如果假定各季節(jié)銷售無差異時(shí)的銷售期望數(shù) O i -E i
觀測與期望的差值 (O i -E i ) 2
偏差平方 (O i -E i ) 2 / E i
偏差平方與期望數(shù)的比值 2.請(qǐng)將上面的表格填寫完整。
3.如果 81 . 7 ) 95 . 0 , 3 (2? ? ,請(qǐng)給出你的推斷過程和據(jù)此可能的結(jié)論。
由于 10.54 大于 7.81,卡方擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量落在拒絕域中,則拒絕原假設(shè),電子設(shè)備產(chǎn)品在一年的各個(gè)季節(jié)里被購買的情況存在不同。
2. 研究者想了解某地區(qū)的醫(yī)院出院人數(shù)(DISC)和床位量(BEDN),調(diào)查了 21 家醫(yī)院數(shù)據(jù),分為甲級(jí)(I)和乙級(jí)(II)兩類如下:
等級(jí) I I I I I II II II II II II II II II II II II II II II II DISC
91 240 255 233 315 200 266 120 228 362 414 518 389 535 273 440 431 534 426 505 322
BEDN
62 64 67 69 70 73 81 91 96 100 100 103 110 127 111 116 120 122 130 137 142 1.如果我們感興趣的問題是醫(yī)院出院人數(shù)小于 400 的比例估計(jì),請(qǐng)給出通過抽取樣本研究這一問題的統(tǒng)計(jì)推斷問題和估計(jì)量; 2.如果假定 p 來自先驗(yàn)分布 beta(a,,b),請(qǐng)先根據(jù)甲級(jí)醫(yī)院估計(jì)出 a 和 b , 再給出對(duì)乙級(jí)醫(yī)院 p 的后驗(yàn)估計(jì)計(jì)算公式和計(jì)算結(jié)果; 3.如果將床位量按(0,70],(71,110]以及(110,150] 分為大,中,小,請(qǐng)給出用來判斷床位數(shù)和出院人數(shù)關(guān)系的統(tǒng)計(jì)模型和解答。
解:
。1)用 X 表示出院人數(shù)是否小于 400 的隨機(jī)變量,則 X~b(1,p) 其中:p=Pr(X<400) 則: ??? =∑ ?? ??????=1?? (2)因?yàn)椋汉篁?yàn)∝先驗(yàn)•似然,則 p 的后驗(yàn) ∝ (p ??−1 (1 − ??) ??−1 )(?? ∑?? ?? (1 − ??) ??−∑?? ?? ) ∝ p ??+∑?? ?? −1 (1 − ??) ??+??−∑?? ?? −1
那么 p~beta(a + ∑?? ??????=1,b + n − ∑?? ??????=1) 其中,n 為樣本量。根據(jù) beta 分布的期望得到后驗(yàn)估計(jì) ??? =a + ∑ ?? ??????=1a + b + n (3)構(gòu)造列聯(lián)表:
床位量/出院人數(shù) 小于 400 大于 400 總計(jì) 小 1134 0 1134 中 1565 932 2497 大 595 2871 3466 總計(jì) 3294 3803 7097 使用卡方獨(dú)立性檢驗(yàn),H0:床位數(shù)與出院人數(shù)獨(dú)立,H1:床位數(shù)與出院人數(shù)相關(guān) 1)R 語言 R 語言中使用 chisq.test()函數(shù)數(shù)對(duì)列聯(lián)表的行變量和列變量進(jìn)行卡方獨(dú)立性檢驗(yàn),執(zhí)行:
>chisq.test(data.frame(c(1134, 1565, 595), c(0, 932, 2871))) 輸出 X-squared = 2766.8,df=2,p-value < 2.2e-16
所以拒絕原假設(shè),床位數(shù)與出院人數(shù)不獨(dú)立。
2)直接計(jì)算:
卡方統(tǒng)計(jì)量:χ 2 = ∑ ∑(??− ?? .?? ?? .?? ??⁄ ) 2?? .?? ?? .????⁄2??=13??=1 代入計(jì)算得 2766.8,自由度為 2,給出的 p 值小于 0.01,所以拒絕原假設(shè)。
4. 研究者想了解某種產(chǎn)品在四家商場中購買是否存在不同。如果用銷售量來解釋這一問題,對(duì)這一問題可能提出的最簡單的零假設(shè)可能是什么?在這一假設(shè)之下,研究者調(diào)查了有關(guān)這種產(chǎn)品過去 2 年的銷售量 196 萬臺(tái)。
表 1 某種產(chǎn)品在過去 2 年中的銷售量 商場 O (萬)
E O i -E i
(O i -E i ) 2
ii iEE O2) ( ? A
98
B
67
C
13
D 18
總計(jì)
196
1.解釋表頭字母的含義; 2.請(qǐng)將上面的表格填寫完整。
3.如果 81 . 7 ) 95 . 0 , 3 (2? ? ,請(qǐng)給出你的推斷過程和據(jù)此可能的結(jié)論。
同第一題
5. 某種感冒沖劑規(guī)定每包重量為 12 克,超重或過輕都是嚴(yán)重問題。質(zhì)檢員抽取 25 包沖劑稱重檢驗(yàn),得到平均每包的重量為 11.85 克,標(biāo)準(zhǔn)差 6 . 0 ? s 克。假定產(chǎn)品重量服從正態(tài)分布( 05 . 0 ? ? )。( 96 . 12??z , 71 . 12??t )
(1)
感冒沖劑的每包重量是否符合標(biāo)準(zhǔn)要求?(寫出詳細(xì)的檢驗(yàn)過程)
。2)
檢驗(yàn)結(jié)論能否證明感冒沖劑的每包重量符合標(biāo)準(zhǔn)要求?為什么? (3)
上述檢驗(yàn)結(jié)論可能犯哪一類錯(cuò)誤?說明這一錯(cuò)誤的實(shí)際含義。
。4)
根據(jù)上述檢驗(yàn)計(jì)算出的 223 . 0 ? P ,解釋這個(gè) P 值的具體含義。
(1)解:
H0:μ=12 H1:μ≠12 t =??? − ????√??⁄=11.85 − 120.6√25⁄= −1.25 ∵ |??| = 1.25 < ?? ?? 2⁄= 1.71
故不拒絕原假設(shè),認(rèn)為符合標(biāo)準(zhǔn)
(2) 不能,假設(shè)檢驗(yàn)只是得出符合標(biāo)準(zhǔn)的概率較大,沒有大概率表明原假設(shè)錯(cuò)誤,不能拒絕原假設(shè)但并不能認(rèn)為原假設(shè)一定正確。
(3) 上述檢驗(yàn)結(jié)論犯了第 II 類錯(cuò)誤,原假設(shè)錯(cuò)誤,由于樣本落入接受域中而錯(cuò)誤的接受原假設(shè),這個(gè)樣本提供的證據(jù)還不足以證明產(chǎn)品不符合每包 12g 的要求因此接受了符合要求的原假設(shè)。
(4) 原假設(shè)成立的概率是 p,由于 p=0.223>0.05,所以認(rèn)為差別由抽樣誤差引起,不能拒絕原假設(shè)。
相關(guān)熱詞搜索:統(tǒng)計(jì)學(xué) 考題 精簡版
熱點(diǎn)文章閱讀