二、多元統計分析
(一)多元回歸分析
多元線性回歸是簡單線性回歸的推廣,指的是多個因變量對多個自變量的回歸。其中最常用的是只限于一個因變量但有多個自變量的情況,也叫多重回歸。
設隨機變量Y與一般變量x1,x2…,xp,的線性回歸模型為:
y=β0+β1x1+β2x2+βpxp+ξ
其中,β0,β1,β2,…,βp是p+1個未知參數,β0稱為回歸常數,β1,β2,…,βp稱為回歸系數。y稱為被解釋變量,而x1,x2…,xp是P個可以精確測量并可控制的一般變量,稱為解釋變量,ξ稱為隨機干擾項。
當P=1時,即為一元線性回歸模型。對一個實際問題,如果我們獲得n組觀測數據 (xi1,xi2,…xip;yi),i=1,2,…n,則線性回歸模型可表示為:
例如,一個企業的銷售量視為y,它可能受到多個變量的影響:價格、廣告費支出等等,然后我們有2000到2009年所有這些變量的相關數據,就可以列出方程式,解出相關參數β。利用上述式子就可以對以后年度進行預測。
為了方便地進行模型的參數估計,對回歸方程要做如下一些基本假定:(1)自變量與因變量之間存在線性關系;(2)隨機誤差項具有0均值和等方差;(3)E(ξ)=0;(4)無自相關;(5)殘差與自變量之間相互獨立;(6)無共線性。
在計算過程中應注意的問題是:(1)樣本量不得少于30條記錄;(2)自變量與因變量都應該是連續性數字型變量;(3)分類/等級變量可以采取啞變量(通常取值為0或1)。
計算出結果之后,要進行檢驗。常用的檢驗方法有R(復相關系數)檢驗、F檢驗、t檢驗、DW檢驗等。
(二) 列聯表分析
列聯表分析屬于多元描述統計分析方法。在市場研究中有著廣泛的應用。
列聯表是觀測數據按兩個或更多屬性(定性變量)分類時所列出的頻數表。
一般來說,如果總體中的個體可按兩個屬性A與B分類,A有r個等級X1,X2,…… ,Xr,B有c個等級Y1,Y2,…… ,YC,從總體中抽取大小為n的樣本,設其中有nij個個體的屬性屬于等級Xi和Yj,nij稱為頻數,將r×c個nij排列為一個r行c列的二維列聯表,簡稱r×c表。若所考慮的屬性多于兩個,也可按類似的方式做出列聯表,稱為多維列聯表。
由于屬性或定性變量的取值是離散的,因此多維列聯表分析屬于離散多元分析的范疇。列聯表只是檢驗變量之間是否相關,而非檢驗變量之間的因果關系。一般使用X2分布來進行獨立性檢驗。
例如,我們針對消費者購買某種彩電時考慮的屬性進行調查。題目這樣設計:
當您購買彩電時,請在品牌、價格、款式和質量中挑出對您最重要的一個因素并在相應的表格中填寫“1”,然后找出第二個重要的因素并在相應的格子中填寫“2”,依次分別在第三和第四個格子里填寫“3”和“4”
|
品牌 |
價格 |
款式 |
質量 |
彩電 |
|
|
|
|
單純從上面的表格是看不出不同年齡段的人對彩電品牌重要性的認識是否有明顯不同,這時就要用X2分布來進行獨立性檢驗。
(三) 方差分析
方差分析,又稱“變異數分析”或“F檢驗”,用于兩個或兩個以上樣本均數差別的顯著性檢驗。在市場調研中,方差分析適用于實驗數據、調查數據和觀察數據的分析。
在方差分析中,若涉及的因素只有一個,稱為單因素方差分析,若涉及的因素為兩個或兩個以上,稱為多因素方差分析。
例如,某連鎖店要測量其自主品牌商品的價格彈性,隨機從其連鎖店中抽取24家店參與實驗,分三個價位,每個價位抽取8家,并對各店一周的銷售情況進行監測,以此看看在價格優惠條件下是否會對銷售量產生顯著效果。
例如,在列聯表分析中所舉的例子,我們已經知道不同年齡段對彩電品牌重要性的評價分布是不同的,但無法明確不同年齡段的消費者關于彩電品牌重要性評價的排序情況。這時就可以通過平均值比較和方差分析來實現。即先計算各年齡段對彩電品牌重要性評價的均值,然后進行不同年齡段均值的比較。
無論是單因素方差分析還是多因素方差分析,其步驟一般為:
(1)明確因變量與自變量,建立原假設;
(2)計算總方差、組間方差、組內方差,建立方差表;
(3)顯著性檢驗,即用F檢驗;
(4)分析結果。
(四)聚類分析
聚類分析也稱群分析或類分析,是對樣品或變量進行分類的一種多元統計方法,目的在于將相似的事物歸類。
對樣品(指標的觀測值)的分類被稱為Q型聚類分析;對變量(指標)的分類被稱為R型聚類分析。
變量如何選擇,取決于聚類的目的。
具體來說,變量的類型有三種尺度:
(1)間隔尺度,即變量用連續的量來表示,如果存在絕對零點,又稱比例尺度;例如,長度、重量、時間等。在調研中不常見。
(2)有序尺度,即變量用有序的等級來表示,有次序關系,但沒有數量表示;例如將十家啤酒公司的產量按高低自1排至10。
(3)名義尺度,即變量用一些“類”來表示,這些類之間沒有等級和數量關系,相似物體的集合稱為類。例如“1”代表男性,“2”代表女性。
不同類型的變量,在聚類分析中,處理方式各不一樣。聚類分析方法主要有系統聚類法、樣品聚類法、動態聚類法、模糊聚類法、圖論聚類法和聚類預報法等。
【例題11·單選題】(2009年)在市場調研過程中,對樣品的分類稱為( )。
A.R型聚類分析
B.Q型聚類分析
C.X型聚類分析
D.T型聚類分析
[答疑編號716030601]
『正確答案』B
『答案解析』對樣品的分類被稱為Q型聚類分析。
(五)判別分析
判別分析是根據表明事物特點的變量值和它們所屬的類求出判別函數,根據判別函數對未知所屬類別的事物進行分類的一種分析方法。
與聚類分析不同,它需要已知一系列反映事物特性的數值變量及其變量值。
例如,企業可以根據往年的年度宏觀經濟指標、企業生產銷售情況、銷售費用的指標把以往各年的市場情況區分為暢銷、平銷和滯銷三種,那么怎么樣根據現有資料判斷(預測)下一年產品是暢銷、平銷,還是滯銷,這就屬于判別分析。
根據判別的組數 |
兩組判別分析 |
多組判別分析 | |
根據判別函數的形式 |
線性判別 |
非線性判別 | |
根據判別時處理變量的方法不同 |
逐步判別 |
序貫判別 | |
根據判別標準的不同 |
距離判別 |
Fisher判別 | |
Bayes判別 |