點擊查看:2011年中級經濟師考試工商管理預習精講班教輔匯總
第四節 數據分析
一、基礎統計分析
(一)描述統計分析
1.集中趨勢的測度
集中趨勢是指一組數據向其中心值靠攏的傾向,測度集中趨勢就是確定數據一般水平的代表值或中心值。集中趨勢的測量有三個常用的指標:
(1)眾數,是一組數據中出現次數最多的變量值。
對數據確定眾數時,只需把數據整理后列出頻數(出現次數)分布表,頻數最多的那一組為眾數。從分布圖形來看,眾數應對應于圖形最高點。有些情況下數據分布可能表現為雙眾數,甚至多眾數,也有另一種情況,即沒有眾數(均勻分布)。眾數的基本思想,是用來反映一組數據若存在聚中趨勢,則在數據的中心,變量值出現的頻數較高,眾數就是這一位置的代表值。
眾數的一個突出特點是它不受極端數值的影響。
(2)中位數,是一組數據排序后處于中間位置的變量值,是一組數據的中點,即高于和低于它的數據各占一半。
(3)均值,是集中趨勢的主要測度值,用于反映一組數值型數據的一般水平。主要包括算術平均數、調和平均數和幾何平均數。
例子:十名學生的成績
100 |
80 |
95 |
87 |
99 |
79 |
80 |
95 |
92 |
95 |
眾數:95(出現3次) 中位數:
79 |
80 |
80 |
87 |
92 |
95 |
95 |
95 |
99 |
100 |
(92+95)÷2=93.5(如果數據是奇數個,則中位數就是中間那個數據)
平均數:
(79+80+80+87+92+95+95+95+99+100)/10=90.2
2.離散程度的測度
數據的離散程度是數據分布的另一重要特征,它是指各變量值遠離其中心值的程度,所以也叫離中趨勢。
離中趨勢是經過綜合與抽象后對數據一般水平的概括性描述,它對數據的代表性取決于數據的離散程度,離散程度小代表性就好,反之代表性就差。
(1)極差,也稱全距,是一組數據中最大值與最小值之差。
極差是描述數據離散程度的最簡單的方法,表明數據的分布范圍。它計算簡單,易于理解。但是極差由兩端數值所決定,不能反映中間數據的分布離散狀況。
(2)平均差,也叫平均離差,是各變量值(Xi)與其均值( )離差絕對值的平均數:
平均差反映了所有數據與均值的平均距離。平均差越小,說明數據離散程度越小。
(3)方差和標準差。方差是一組數據中各變量值與均值離差平方的平均數。方差的平方根叫標準差。方差與標準差是描述數據分布特征的重要的統計量,它們是反映數值型數據離散程度最主要、最常用的方法。
根據總體數據和樣本數據計算方差及標準差時,計算公式略有不同。
式中Xi是數值序列中的單個數值, 是這組數值的平均值,N是總體數值的個數,n是樣本數值的個數。
計算樣本方差與標準差時之所以與總體不同,是因為計算樣本方差或標準差時,是要把它作為總體方差或標準差的估計量,統計上對估計量要求滿足一些條件(一致性、無偏性、有效性),為滿足無偏性條件,樣本方差計算時,分母要用n-1,而不是n。
【例題10·單選題】(2009年)某產品在5個地區的銷售量分別為1500、2000、1000、3000、5000。則該銷售量的極差為( )。
A.1000 B.1500 C.2000 D.4000
[答疑編號716030501]
『正確答案』D
『答案解析』極差也稱全距,是一組數據中最大值與最小值之差。本題中最大值為5000,最小值為1000,所以極差=5000-1000=4000。