“在日內(nèi)以及1個(gè)交易日的時(shí)間尺度上,不論是中證500還是滬深300的價(jià)格走勢(shì)均不為隨機(jī)游走且走勢(shì)強(qiáng)自相關(guān),也就是說在中高頻這個(gè)頻段上,市場(chǎng)尚未達(dá)到弱有效、價(jià)格本身存在規(guī)律性,所以中高頻的量化模式識(shí)別仍具有盈利空間?!?/span>
“不管是中證500期貨還是滬深300期貨,機(jī)器學(xué)習(xí)策略的夏普均顯著高于隨機(jī)信號(hào)策略,說明機(jī)器學(xué)習(xí)可以有效的從歷史數(shù)據(jù)中學(xué)到量?jī)r(jià)規(guī)律?!?/span>
“我們的優(yōu)化主要在三個(gè)方向。第一,在因子構(gòu)造層面引入了北上數(shù)據(jù),第二,在機(jī)器學(xué)習(xí)層面引入了LSTM模型,第三,我們把策略從時(shí)間序列維度拓寬到了橫截面維度?!?/span>
“量化選股和主動(dòng)投資的目的是一致的,都是希望找到基本面優(yōu)質(zhì)的公司,并把錢投向這些公司。只是在價(jià)值發(fā)現(xiàn)的過程中,量化模型會(huì)更頻繁地尋找市場(chǎng)中的價(jià)值洼地,并不斷對(duì)自身交易進(jìn)行糾錯(cuò),因此導(dǎo)致的一個(gè)結(jié)果是量化的交易頻率會(huì)高于主動(dòng)?!?/span>
“10月中旬以來市場(chǎng)呈現(xiàn)低波動(dòng)的震蕩格局,整體市場(chǎng)環(huán)境對(duì)股指策略較為不利,但我們預(yù)計(jì)當(dāng)指數(shù)的波動(dòng)率恢復(fù)時(shí),策略也將恢復(fù)其凈值彈性?!?/span>
以上是朱雀基金量化組組長(zhǎng)章曉玨12月18日在朱雀基金“贏在終局”2022年度策略會(huì)上發(fā)表的觀點(diǎn)。以下是我們整理的演講實(shí)錄。
大家好,我是朱雀基金專戶投資部投資經(jīng)理章曉玨。
在前兩年的策略會(huì)上,我們向大家介紹了什么是CTA策略、我們的CTA投資理念以及對(duì)策略的一些優(yōu)化方案。這里請(qǐng)?jiān)试S我再花兩分鐘時(shí)間,再和大家簡(jiǎn)單介紹下CTA策略。
我們今天所要講的量化CTA,其實(shí)就是通過量化的手段來建立交易模型,然后由模型給出期貨標(biāo)的價(jià)格走勢(shì)的漲跌判斷,從而在期貨上進(jìn)行做多、做空或多空雙向的操作。最終的目的是賺取絕對(duì)收益。目前CTA的投資范圍主要在股指期貨、大宗商品期貨和國(guó)債期貨三大類。在投資策略上,我們主要利用機(jī)器學(xué)習(xí)來做模式識(shí)別從而給出價(jià)格預(yù)測(cè)。
模式識(shí)別CTA介紹
那首先什么是基于模式識(shí)別的CTA?這里展示了一個(gè)簡(jiǎn)單的例子。假設(shè)當(dāng)前我們站在2021年8月20日的收盤時(shí)刻,我們?nèi)绾蝸頉Q策后續(xù)是在中證500上做多還是做空?
對(duì)于量化投資經(jīng)理來說,我們的判斷是建立在對(duì)歷史數(shù)據(jù)的回看上的,我們認(rèn)為歷史可以重演,所以一個(gè)思路就是,我們可以從歷史數(shù)據(jù)中尋找和當(dāng)前價(jià)格走勢(shì)相似的歷史片段,并且根據(jù)這些歷史片段此后的指數(shù)走勢(shì),來判斷當(dāng)前指數(shù)的未來走勢(shì)。
這里我們以價(jià)格走勢(shì)之間的歐氏距離來衡量歷史片段與當(dāng)前走勢(shì)的相似度。通過數(shù)據(jù)挖掘,我們發(fā)現(xiàn)12年的12月12號(hào)、13年的1月4號(hào)和今年的3月2號(hào)等交易日的日內(nèi)走勢(shì)和今天非常接近。找到了相似的歷史片段后,我們就可以統(tǒng)計(jì)這些歷史片段后續(xù)指數(shù)的漲跌分布。從下圖中我們可以看到,在所有走勢(shì)和今天接近的交易日里面,有63%的交易日在第二天是上漲的,也就是說站在當(dāng)下,明天上漲的概率大于50%,我們可以發(fā)出開多的交易指令。
注:日內(nèi)模式匹配度最高的10%樣本未來一日走勢(shì)統(tǒng)計(jì)
當(dāng)然這只是一個(gè)簡(jiǎn)化的例子,我們想要說明的是模式匹配型CTA的核心在于從歷史數(shù)據(jù)中去發(fā)掘大概率會(huì)發(fā)生的量?jī)r(jià)規(guī)律,再在實(shí)盤的時(shí)候根據(jù)市場(chǎng)的變化來進(jìn)行規(guī)律的匹配,從而從歷史數(shù)據(jù)中獲得對(duì)未來的啟示。
前面的例子里我們只是以價(jià)格走勢(shì)這一個(gè)維度來定義市場(chǎng)特征,實(shí)際上我們?cè)趯?shí)盤中會(huì)從價(jià)格、波動(dòng)率、趨勢(shì)性、盤口掛單情況等多個(gè)維度來定義所謂的“模式”,每一個(gè)維度都是一個(gè)可以刻畫當(dāng)前市場(chǎng)特征的因子。之后我們會(huì)用機(jī)器學(xué)習(xí)模型來從歷史數(shù)據(jù)中學(xué)習(xí)不同的市場(chǎng)特征下未來的漲跌規(guī)律,從而把多維的特征矩陣壓縮成一個(gè)對(duì)后市的漲跌概率預(yù)測(cè)。
模式識(shí)別CTA的盈利前提
在前面的例子里,模式識(shí)別型CTA要想盈利其實(shí)隱含了兩個(gè)串聯(lián)的先決條件,第一是價(jià)格的時(shí)間序列本身要存在一定規(guī)律,第二是機(jī)器學(xué)習(xí)模型要能夠從歷史數(shù)據(jù)中挖掘出有效的規(guī)律,而不僅僅是在過度擬合。接下來,我們分別來回答這兩個(gè)問題。
首先第一個(gè)問題,價(jià)格的時(shí)間序列里真的存在規(guī)律嗎?弱有效市場(chǎng)假說認(rèn)為當(dāng)前的證券價(jià)格已經(jīng)反應(yīng)了所有歷史信息,所以價(jià)格未來的走勢(shì)接近隨機(jī)游走,無法通過歷史數(shù)據(jù)被預(yù)測(cè)。但實(shí)際上是否真的是這樣?
這里我們測(cè)算了寬基指數(shù)在日內(nèi)不同頻率以及在1天、2天一直到10天的隨機(jī)性和自相關(guān)性。表格的第一行和第二行展示了隨機(jī)性檢驗(yàn)的結(jié)果,其中第二行的p值越小,則說明價(jià)格走勢(shì)越不具有隨機(jī)性。第三行和第四行展示了自相關(guān)性檢驗(yàn)的結(jié)果,同樣第四行的p值越小,就說明價(jià)格走勢(shì)的自相關(guān)性越強(qiáng)。
來源:朱雀基金,天軟科技
我們可以看到在日內(nèi)以及1個(gè)交易日的時(shí)間尺度上,不論是中證500還是滬深300的價(jià)格走勢(shì)均不為隨機(jī)游走且走勢(shì)強(qiáng)自相關(guān),也就是說在中高頻這個(gè)頻段上,市場(chǎng)尚未達(dá)到弱有效、價(jià)格本身存在規(guī)律性,所以中高頻的量化模式識(shí)別仍具有盈利空間。但是如果我們把持倉(cāng)周期拉長(zhǎng)到2天以上,則市場(chǎng)的有效性得到了大幅的提升,這主要?dú)w功于主動(dòng)研究員對(duì)上市公司基本面的深入研究糾正了長(zhǎng)周期上的錯(cuò)誤定價(jià)。
接下來我們?cè)賮砜匆幌律唐飞系那闆r。這里我們挑選了一些代表性品種。我們可以看到商品期貨價(jià)格在日內(nèi)具有較強(qiáng)規(guī)律性,同時(shí)在3~5天持倉(cāng)期上也有一定弱規(guī)律?;谏鲜鼋Y(jié)果,我們認(rèn)為在日內(nèi)及隔夜頻率上,市場(chǎng)尚未達(dá)到弱有效,價(jià)格走勢(shì)仍具有規(guī)律性。
來源:朱雀基金,天軟科技
其次第二個(gè)問題,機(jī)器學(xué)習(xí)能有效地學(xué)到價(jià)格規(guī)律嗎?這里我們用蒙特卡洛模擬法來生成隨機(jī)信號(hào)作為對(duì)照組,其中用于產(chǎn)生隨機(jī)信號(hào)的概率分布和實(shí)盤機(jī)器學(xué)習(xí)策略的信號(hào)分布保持一致,并且模擬策略在信號(hào)生成后采用和實(shí)盤策略一樣的交易邏輯,如此模擬1萬次來測(cè)試在隨機(jī)信號(hào)下CTA策略的夏普情況。
下面兩個(gè)圖中的灰色柱狀圖是這1萬個(gè)隨機(jī)模擬策略的夏普分布,紅線是我們實(shí)盤機(jī)器學(xué)習(xí)子策略的夏普,我們可以看到,不管是中證500期貨還是滬深300期貨,機(jī)器學(xué)習(xí)策略的夏普均顯著高于隨機(jī)信號(hào)策略,說明機(jī)器學(xué)習(xí)可以有效的從歷史數(shù)據(jù)中學(xué)到量?jī)r(jià)規(guī)律。
來源:朱雀基金
CTA優(yōu)化之路
到這里我們已經(jīng)論證了價(jià)格模式存在規(guī)律,并且用機(jī)器學(xué)習(xí)可以從歷史數(shù)據(jù)中找到規(guī)律,所以我們的模式識(shí)別策略是具有盈利基礎(chǔ)的。
今年我們的優(yōu)化主要在三個(gè)方向。第一,在因子構(gòu)造層面引入了北上數(shù)據(jù),第二,在機(jī)器學(xué)習(xí)層面引入了LSTM模型,第三,我們把策略從時(shí)間序列維度拓寬到了橫截面維度。后面我們會(huì)具體展開來講這三個(gè)方向。
首先,我們認(rèn)為相比于因子算法上的優(yōu)化,一個(gè)好的數(shù)據(jù)源是可以提供更多的alpha的,這也是為什么我們?cè)诮衲暌肓朔昼娂?jí)別的滬深港通數(shù)據(jù)。
近幾年北上資金已經(jīng)成為了A股市場(chǎng)中一股不可忽視的力量,這一方面是由北上資金本身的資金體量決定的,近幾年北上占兩市成交額的比例持續(xù)提升,另一方面,由于北上資金往往被認(rèn)為是“聰明錢”,所以一些投資者會(huì)選擇跟隨北上資金進(jìn)行交易,而這又會(huì)強(qiáng)化北上資金的風(fēng)格偏好,進(jìn)一步放大北上資金的影響。同時(shí)分鐘級(jí)別的北上資金流數(shù)據(jù)可以幫助我們更加精細(xì)地刻畫北上資金的交易行為及風(fēng)格偏好,是對(duì)原有實(shí)盤因子庫(kù)的一個(gè)有效補(bǔ)充。
下面這張圖展示了加入北上資金流因子前后股指策略的夏普變化,我們可以看到在2019年之前,由于北上資金成交占比較低,因此北上因子對(duì)策略沒有明顯的信息增益,但在2019年之后,加入北上資金流因子每年都可以顯著地提升策略夏普。
來源:朱雀基金,萬得
我們的第二個(gè)優(yōu)化是引入了循環(huán)神經(jīng)網(wǎng)絡(luò),它最大的特點(diǎn)是保留了金融數(shù)據(jù)的時(shí)間序列特性。這里展示了一種常用的循環(huán)神經(jīng)網(wǎng)絡(luò),LSTM模型的結(jié)構(gòu)。大家可以把它想象成一條時(shí)間的河流,在LSTM網(wǎng)絡(luò)中過去一段時(shí)間的市場(chǎng)特征信息是按從早到晚的順序依次從左向右流動(dòng)的。最早的特征信息最先進(jìn)入網(wǎng)絡(luò),在進(jìn)入下一個(gè)神經(jīng)元后,來自上一時(shí)刻的部分信息會(huì)經(jīng)過“遺忘門”被舍棄,同時(shí)下一時(shí)刻的市場(chǎng)特征信息被注入,并在經(jīng)過“記憶門”后和上一時(shí)刻的信息匯合,一同流向下一個(gè)神經(jīng)元。所以在LSTM中,信息流是按照時(shí)間順序從左向右流動(dòng)的,來自不同時(shí)刻的特征信息會(huì)在不同節(jié)點(diǎn)逐步匯入信息的洪流,最終在讀取了過去窗口期所有時(shí)刻的信息后,模型會(huì)輸出預(yù)測(cè)結(jié)果。
我們之所以會(huì)希望保留金融數(shù)據(jù)的時(shí)間序列特性,是因?yàn)閮r(jià)格的走勢(shì)是路徑依賴的。舉個(gè)例子,價(jià)格在底部上漲和在頂部上漲時(shí)對(duì)未來走勢(shì)的影響是不同的,底部上漲預(yù)示著新一輪行情的開始,而頂部上漲時(shí)可能已經(jīng)到了趨勢(shì)的末尾。普通的前向神經(jīng)網(wǎng)絡(luò)只能看到最近時(shí)點(diǎn)的市場(chǎng)特征;而LSTM的視野則更為寬廣,它會(huì)從左向右完整地讀取過去一段時(shí)間的市場(chǎng)演化過程,也就是說它不僅能看到價(jià)格在上漲,還能區(qū)分當(dāng)前是在底部還是頂部。另外,LSTM模型在不同時(shí)點(diǎn)的參數(shù)是共享的,因此相比于前向神經(jīng)網(wǎng)絡(luò),LSTM的參數(shù)更少,更能避免過度擬合。最后,LSTM模型很好的解決了梯度衰減的問題,使模型可以捕獲更早時(shí)點(diǎn)的市場(chǎng)特征。
u 價(jià)格走勢(shì)路徑依賴,而LSTM可以保留金融數(shù)據(jù)的時(shí)間序列特征
u 不同節(jié)點(diǎn)參數(shù)共享,更好地避免過度擬合
u 解決了梯度衰減問題,可以捕獲更早時(shí)點(diǎn)的市場(chǎng)特征
來源:朱雀基金收集
最后,我們?cè)谠械臅r(shí)間序列策略外,開發(fā)了全新的商品截面策略,兩者的盈利核心有所不同。時(shí)間序列策略試圖預(yù)測(cè)每個(gè)品種在未來一段時(shí)間的絕對(duì)漲跌,并通過買漲賣跌獲取收益。在時(shí)間序列框架下,每個(gè)品種的交易信號(hào)都是互相獨(dú)立的,因此我們可能同時(shí)在某一大類品種上做多或做空,并通過品種間的相對(duì)波動(dòng)率來控制倉(cāng)位。
而截面策略試圖預(yù)測(cè)多個(gè)品種在未來一段時(shí)間走勢(shì)的相對(duì)強(qiáng)弱,通過買強(qiáng)賣弱來獲得收益,此時(shí)我們?cè)谒衅贩N上的多頭總持倉(cāng)始終等于空頭持倉(cāng),也就是說沒有凈頭寸的暴露。這樣即使處于所有品種單邊上行或下行的極端行情中,買強(qiáng)賣弱的操作也可以捕捉到強(qiáng)勢(shì)品種和弱勢(shì)品種間漲跌幅的差異,從而給策略帶來收益。
來源:朱雀基金收集
值得一提的是,我們的截面策略同時(shí)用到了基本面和量?jī)r(jià)因子,這樣雙管齊下可以使策略既符合產(chǎn)業(yè)鏈供需邏輯,又能捕捉到市場(chǎng)中的不合理定價(jià)。另外,截面策略的優(yōu)勢(shì)也在于它的多空持倉(cāng)更為均衡。當(dāng)商品價(jià)格受調(diào)控或其他事件性沖擊而突然轉(zhuǎn)向的時(shí)候,各品種的走勢(shì)往往趨同,此時(shí)時(shí)序策略較高的裸多或裸空敞口可能帶來較大回撤。而截面策略多空持倉(cāng)更為均衡,在極端行情下表現(xiàn)更為穩(wěn)健。最后由于時(shí)序和截面策略有不同的收益風(fēng)險(xiǎn)特征,引入截面策略也能很好的起到分散化作用。
量化產(chǎn)品對(duì)市場(chǎng)的影響幾何
近幾年量化基金已經(jīng)發(fā)展到了萬億規(guī)模,這會(huì)給市場(chǎng)帶來什么影響?我們認(rèn)為當(dāng)前量化交易占全市場(chǎng)的成交量的比例大約在20%左右,在給市場(chǎng)提供流動(dòng)性的同時(shí),量化交易也在迅速提高市場(chǎng)的有效性。
這里我們想要澄清的一點(diǎn)是,量化并不會(huì)擾亂市場(chǎng)。實(shí)際上,量化選股和主動(dòng)投資的目的是一致的,都是希望找到基本面優(yōu)質(zhì)的公司,并把錢投向這些公司。只是在價(jià)值發(fā)現(xiàn)的過程中,量化模型會(huì)更頻繁地尋找市場(chǎng)中的價(jià)值洼地,并不斷對(duì)自身交易進(jìn)行糾錯(cuò),因此導(dǎo)致的一個(gè)結(jié)果是量化的交易頻率會(huì)高于主動(dòng)。但交易本身不是量化的目的,它只是反應(yīng)了量化不斷尋找并糾正錯(cuò)誤定價(jià)的過程。實(shí)際上,因?yàn)榱炕呗哉w是理性的,因此在大部分情況下量化交易平抑了市場(chǎng)波動(dòng),并提高了市場(chǎng)的有效性。
最后,9月以來量化產(chǎn)品均出現(xiàn)了不同程度的回撤,指增產(chǎn)品的回撤一方面是受500指數(shù)beta的拖累,另一方面是由于近期市場(chǎng)風(fēng)格快速切換,同時(shí)指增產(chǎn)品賴以獲取收益的盈利、成長(zhǎng)等因子發(fā)生反向,給超額收益帶來壓力。我們的CTA也在近期出現(xiàn)回撤,但實(shí)際上我們的策略在商品上很好地規(guī)避了本輪煤價(jià)腰斬,我們的回撤主要由股指策略導(dǎo)致。10月中旬以來市場(chǎng)呈現(xiàn)低波動(dòng)的震蕩格局,整體市場(chǎng)環(huán)境對(duì)股指策略較為不利,但我們預(yù)計(jì)當(dāng)指數(shù)的波動(dòng)率恢復(fù)時(shí),策略也將恢復(fù)其凈值彈性。
注:本文件非基金宣傳推介材料,僅作為本公司旗下基金的客戶服務(wù)事項(xiàng)之一。
本文件所提供之任何信息僅供閱讀者參考,既不構(gòu)成未來本公司管理之基金進(jìn)行投資決策之必然依據(jù),亦不構(gòu)成對(duì)閱讀者或投資者的任何實(shí)質(zhì)性投資建議或承諾。本公司并不保證本文件所載文字及數(shù)據(jù)的準(zhǔn)確性及完整性,也不對(duì)因此導(dǎo)致的任何第三方投資后果承擔(dān)法律責(zé)任。
本文所載的意見僅為本文出具日的觀點(diǎn)和判斷,在不同時(shí)期,朱雀基金可能會(huì)發(fā)出與本文所載不一致的意見。本文未經(jīng)朱雀基金書面許可,任何機(jī)構(gòu)和個(gè)人不得以任何形式轉(zhuǎn)發(fā)、翻版、復(fù)制、刊登、發(fā)表或引用。