求D(S^2)并不容易,但當(dāng)總體服從正態(tài)分布N(μ,σ^2)時(shí),有特定規(guī)律可循。(n-1)S^2/σ^2服從自由度為n-1的卡方分布,進(jìn)而可推導(dǎo)出D[(n-1)S^2/σ^2]的值為2(n-1),從而間接求得D(S^2)。
在現(xiàn)實(shí)生活中,我們往往無法預(yù)先得知總體的真實(shí)差異。處理大型人群時(shí),由于無法逐一計(jì)數(shù)每個(gè)個(gè)體,所以只能依賴樣本計(jì)算。而樣本方差可應(yīng)用于估算從該分布中抽樣所得連續(xù)分布的方差。
深入探討一下,如果大數(shù)定律的條件同樣適用于平方觀測(cè)值,那么s2就是σ2的一致估計(jì)量。這表明我們的估計(jì)方差正在趨向于零。在Kenney and Keeping(1951年的第164頁)、Rose和Smith(2002年的第264頁)以及Weisstein(未注明日期的文獻(xiàn))等書中都提供了這一漸近等效公式的證明。
在正態(tài)總體的樣本中,樣本均值和樣本方差是彼此獨(dú)立的。方差能夠描述隨機(jī)變量值與數(shù)學(xué)期望的離散程度。離散程度的標(biāo)準(zhǔn)差和方差越大,表明隨機(jī)變量的值更加分散。相反,如果X的取值相對(duì)集中,那么其方差D(X)就會(huì)較小;反之,如果X的取值較為分散,那么其方差D(X)就會(huì)較大。D(X)是衡量數(shù)據(jù)取值分散程度的重要指標(biāo)。
方差的計(jì)算公式為s2,即各個(gè)數(shù)據(jù)與算術(shù)平均數(shù)的離差平方和的平均數(shù)。其中M代表數(shù)據(jù)的平均數(shù),n為數(shù)據(jù)的個(gè)數(shù)。無論是離散型還是連續(xù)型數(shù)據(jù),都可以使用這個(gè)公式來計(jì)算方差。s2也被稱為標(biāo)準(zhǔn)差或均方差,它是用來描述數(shù)據(jù)波動(dòng)的程度的。
在統(tǒng)計(jì)學(xué)中,方差是用來衡量一組數(shù)據(jù)或總體中各個(gè)數(shù)值與算術(shù)平均數(shù)之間的離散程度的度量方式。它描述了隨機(jī)變量對(duì)數(shù)學(xué)期望的偏離程度。當(dāng)數(shù)據(jù)的分布較為分散時(shí),各個(gè)數(shù)據(jù)與平均數(shù)的差的平方和較大,從而導(dǎo)致方差增大;反之,當(dāng)數(shù)據(jù)分布較為集中時(shí),各個(gè)數(shù)據(jù)與平均數(shù)的差的平方和較小,進(jìn)而使得方差減小。方差的大小可以反映出數(shù)據(jù)的波動(dòng)程度。
至于樣本方差的計(jì)算公式為s2 = (1/n) [ (x1-x_)^2 + (x2-x_)^2 + ... + (xn-x_)^2 ] 。這里的s2被稱為樣本標(biāo)準(zhǔn)差,是方差的算術(shù)平方根。當(dāng)兩個(gè)樣本數(shù)據(jù)的單位不只要計(jì)算出變異系數(shù),就可以比較它們的變異程度。
樣本方差的計(jì)算過程是先求出每個(gè)數(shù)據(jù)與樣本均值的離差的平方,然后對(duì)這些平方進(jìn)行平均。樣本均值是樣本的算術(shù)平均數(shù),而均值則是所有數(shù)據(jù)的總和除以數(shù)據(jù)的個(gè)數(shù)。
在實(shí)際應(yīng)用中,我們常常需要計(jì)算未知人口的真實(shí)差異。面對(duì)龐大的數(shù)據(jù)群體時(shí),我們無法逐一計(jì)數(shù)每個(gè)個(gè)體,因此只能通過計(jì)算樣本數(shù)據(jù)來得出結(jié)論。樣本方差的計(jì)算就顯得尤為重要。它不僅可以用于估計(jì)總體方差的數(shù)值大小,還可以幫助我們了解數(shù)據(jù)的離散程度和波動(dòng)情況。
在高中統(tǒng)計(jì)學(xué)中常用的方差公式主要有兩種:總體方差公式和樣本方差公式。當(dāng)需要計(jì)算多組數(shù)據(jù)的總方差時(shí),我們可以使用合并方差公式來實(shí)現(xiàn)這一目的。這個(gè)公式將多組數(shù)據(jù)的樣本個(gè)數(shù)和樣本方差進(jìn)行加權(quán)平均,從而得到一個(gè)總體的方差值。