pretty code

2009年8月20日 星期四

抽樣如何抽,樣本知多少?

以下內容出自網路!

信賴敘述(confidence statement)包含兩部分:誤差界限(margin of error)及信賴水準(level of confidence)
● 誤差界限告訴我們,樣本統計量離母體參數多遠。
● 信賴水準告訴我們,所有可能樣本中有多少百分比滿足這樣的誤差界限。
● 從一個隨機樣本所得到的統計量的變異性,並不受母體大小的影響,只要母體至少比樣本大 100 倍即可。
樣本統計量的變異性是由樣本的大小決定,而不是由母體的大小決定
● 信賴敘述的結論永遠是針對母體而不是針對樣本。
報告誤差界限時用 95% 的信賴水準是很普遍的
● 想在相同的信賴水準下要求較小的誤差界限嗎?取個大一點的樣本就成了。

統計裡面的一個基本動作:用樣本的事實,當做母體真實訊息的估計
● 參數(parameter)是描述母體的數字。參數是一個固定的數字,但是我們實際上無法知道參數的值。
● 統計量(statistic)是描述樣本的數字。一旦取了樣本,統計量的值就知道了。但是換個不同的樣本,統計量的值就可能改變。
● 我們常用統計量來估計未知的參數。
● 偏差(bias)是當我們取很多樣本時,統計量一直朝向同一個方向偏離母體參數值。
● 變異性(variability)描述的是,當我們取很多樣本時,統計量的值會散開到什麼程度。變異性大,就代表不同樣本的結果可能差別很大。
一個好的抽樣方法,應該要有小偏差以及小變異性
● 減低偏差:利用隨機抽樣即可。
● 減低變異性:用大一點的樣本即可。

沒有留言: