在數(shù)理方法這章,我們可以將其可以分為四個(gè)部分:概率基礎(chǔ)、統(tǒng)計(jì)基礎(chǔ)、回歸分析和時(shí)間序列分析。目前股票投資分析的方法主要有三種,基本分析法、技術(shù)分析法和量化分析法,而數(shù)理方法是分析師進(jìn)行量化分析的基礎(chǔ)。
本文導(dǎo)航 | ||
收藏知識(shí)結(jié)構(gòu)圖,自我檢測(cè) | 學(xué)習(xí)筆記 | 真題演練,現(xiàn)在開始做 |
一、收藏知識(shí)結(jié)構(gòu)圖,現(xiàn)在開始做
二、學(xué)習(xí)筆記
(一)概率基礎(chǔ)
1、概率與隨機(jī)變量的含義、計(jì)算和原理
概率含義:概率是對(duì)隨機(jī)事件發(fā)生的可能性的度量,范圍為0<P<1;
計(jì)算和原理:
條件概率 | 給定事件B已經(jīng)發(fā)生的條件下,事件A發(fā)生的概率為條件概率,記為P(A∣B) | P(A∣B)=P(A∩B)/P(B) |
聯(lián)合概率 | 聯(lián)合概率表示兩個(gè)事件共同發(fā)生的概率,表示為P(AB)或P(A,B)或P(A∩B) | A、B互斥,P(A∩B)=0 A、B為獨(dú)立事件, P(A∩B)=P(A)P(B) |
邊緣概率 | 某個(gè)事件發(fā)生的概率 | A的邊緣概率為P(A) |
隨機(jī)變量的含義:一個(gè)能取得多個(gè)可能的數(shù)值變量X稱為隨機(jī)變量。若X最多只能取可數(shù)的不同值,則為離散型隨機(jī)變量;若X可以取遍某個(gè)期間的任意數(shù)值,取值無法一一列出,則我們稱之為連續(xù)型隨機(jī)變量。
2、多元分布函數(shù)及其數(shù)字特征
期望(均值):衡量X取值的平均水平,它是對(duì)X所有可能的取值按照其發(fā)生概率(P)的大小加權(quán)后得到的平均值。E(X)=P1X1+P2X2+...+PnXn。
方差與標(biāo)準(zhǔn)差:衡量數(shù)據(jù)分布的離散程度,分布越散,其波動(dòng)性和不可預(yù)測(cè)性也就越強(qiáng)。應(yīng)用到投資中,可以計(jì)算實(shí)際收益率相對(duì)預(yù)期收益率可能有多大的偏差,即投資回報(bào)的風(fēng)險(xiǎn)水平。
協(xié)方差:協(xié)方差用于描述兩個(gè)隨機(jī)變量之間的相關(guān)程度,
cov(X,Y)=E(XY)-E(X)E(Y)
相關(guān)關(guān)系:X和Y之間的相關(guān)系數(shù)記為ρxy:
,var(X),var(Y)分別代表X和Y的標(biāo)準(zhǔn)差。
相關(guān)系數(shù)性質(zhì):①ρxy一定在-1和1之間;
②若X和Y相互獨(dú)立,則ρxy=0;
③如果Y=aX+b(a,b≠0),那么∣ρxy∣=1,此時(shí)稱X和Y是完全相關(guān)的。X和Y的值越接近線性關(guān)系,∣ρxy∣越大。
(二)統(tǒng)計(jì)基礎(chǔ)
1、總體、樣本和統(tǒng)計(jì)量
總體:研究對(duì)象的全體稱為總體X,把構(gòu)成總體的每個(gè)成員稱為個(gè)體;
樣本:為了了解總體的分布,我們從總體中隨機(jī)抽取n個(gè)個(gè)體,記其指標(biāo)值為X1,X2,...,Xn,則X1,X2,...,Xn稱為總體的一個(gè)樣本,n稱為樣本容量,樣本中的個(gè)體稱為樣品。
統(tǒng)計(jì)量:由樣本加工得到的量(樣本的一個(gè)函數(shù))稱為統(tǒng)計(jì)量,記為f(X1,X2,...,Xn)。
2、統(tǒng)計(jì)推斷的參數(shù)估計(jì)
點(diǎn)估計(jì):以樣本的統(tǒng)計(jì)量(數(shù)軸上的一個(gè)點(diǎn))作為總體參數(shù)的估計(jì)值稱為點(diǎn)估計(jì)。
區(qū)間估計(jì):以一個(gè)統(tǒng)計(jì)量的區(qū)間來估計(jì)相應(yīng)的總體,它要求按照一定的概率要求,根據(jù)樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù)可能落入的數(shù)值范圍。區(qū)間估計(jì)中有三個(gè)重要概念,置信區(qū)間、置信系數(shù)和置信限。
置信區(qū)間 | 在特定的可靠性要求下估計(jì)總體參數(shù)所落的區(qū)間范圍; |
置信系數(shù) | 被估計(jì)的總體參數(shù)落在置信區(qū)間內(nèi)的概率P; |
置信限 | 置信界限是對(duì)單側(cè)置信區(qū)間中的界限以及雙側(cè)置信區(qū)間的上、下限的統(tǒng)稱。 |
(三)回歸分析
1、回歸模型常見問題和處理方法
多重共線性:對(duì)于解釋變量X2,...,XK,如果存在不全為0的數(shù)λ1,,λ2,...,λn,能使得λ1+λ2X2i+λ3X3i+...+λkXki=0,i=1,2,...n則成解釋變量X2,X3,...,XK之間存在著完全的多重共線性。
多重共線性的補(bǔ)救措施:①剔除變量法,刪除引起多重共線性的不重要的解釋變量;
②變換模型形式,將原設(shè)定的模型的形式作適當(dāng)變換,消除或減弱原模型中解釋變量的相關(guān)關(guān)系;
③利用非樣本先驗(yàn)信息;
④橫截面數(shù)據(jù)與時(shí)間數(shù)據(jù)序列并用;
⑤逐步回歸法。
異方差性:對(duì)于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)的方差互不相同,就是異方差性。
修正方法:①加權(quán)最小二乘法;②重新設(shè)定模型
(四)協(xié)整分析和誤差修正模型
1、協(xié)整概念
協(xié)整是指某些回見序列是非平穩(wěn)時(shí)間序列,但它們的線性組合卻存在長(zhǎng)期的均衡關(guān)系。雖然兩個(gè)經(jīng)濟(jì)變量有各自的長(zhǎng)期波動(dòng)規(guī)律,但是如果它們是協(xié)整的,那么它們之間存在一個(gè)長(zhǎng)期穩(wěn)定的比例關(guān)系。
2、誤差修正模型
若變量之間存在協(xié)整關(guān)系,則表明這些變量間存在著長(zhǎng)期均衡關(guān)系,而這種長(zhǎng)期均衡關(guān)系是在短期波動(dòng)過程的不斷調(diào)整下得以實(shí)現(xiàn)的。
3、常用統(tǒng)計(jì)軟件:Excel、SPSS、SAS、Minitab、Statistica、Eviews
三、真題演練,現(xiàn)在開始做
1、對(duì)回歸模型存在異方差問題的主要處理方法有( )。
Ⅰ.加權(quán)最小二乘法
Ⅱ.差分法
Ⅲ.改變模型的數(shù)學(xué)形式
Ⅳ.移動(dòng)平均法
A.Ⅰ、Ⅱ
B.Ⅰ、Ⅲ
C.Ⅱ、Ⅲ
D.Ⅱ、Ⅳ
【233網(wǎng)校解析】異方差性:對(duì)于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)的方差互不相同,就是異方差性。其修正方法:①加權(quán)最小二乘法;②重新設(shè)定模型
2、下列關(guān)于區(qū)間預(yù)測(cè)的說法中,正確的有( )。
Ⅰ.樣本容量n越大,預(yù)測(cè)精度越高
Ⅱ.樣本容量n越小,預(yù)測(cè)精度越高
Ⅲ.置信區(qū)間的寬度在x均值處最小
Ⅳ.預(yù)測(cè)點(diǎn)X0離x均值越大精度越高
A.Ⅰ、Ⅱ、Ⅲ
B.Ⅱ、Ⅳ
C.Ⅰ、Ⅲ
D.Ⅱ、Ⅲ、Ⅳ
【233網(wǎng)校解析】樣本容量n越大,預(yù)測(cè)精度越高,反之預(yù)測(cè)精度越低。樣本容量一定時(shí),置信區(qū)間的寬度在x均值處最小,預(yù)測(cè)點(diǎn)X0離X均值越小精度越高,越遠(yuǎn)精度越低。