第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學術咨詢

讓期刊論文更省時、省事、省心

基于機器學習和經驗模態分解的跨期套利研究

時間:2022年01月11日 分類:電子論文 次數:

摘要:采用滾動經驗模態分解(EMD)方法對滬深300股指期貨當月和下月合約的價差波動進行分解,分別利用Elman網絡、隨機森林(RF)、支持向量回歸(SVM)3種機器學習模型及自回歸移動平均模型(ARIMA)對不同頻率信號進行分析,合成最終的預測結果,并根據預測結果設計跨期套利

  摘要:采用滾動經驗模態分解(EMD)方法對滬深300股指期貨當月和下月合約的價差波動進行分解,分別利用Elman網絡、隨機森林(RF)、支持向量回歸(SVM)3種機器學習模型及自回歸移動平均模型(ARIMA)對不同頻率信號進行分析,合成最終的預測結果,并根據預測結果設計跨期套利策略.研究結果表明:SVM,RF和ARIMA模型的預測精確度相對Elman網絡較高,所有模型均能取得較高的套利收益,將非線性模型和線性模型融合使用能夠改善模型的風險控制能力;將機器學習預測與EMD分解技術相融合可以在不提高風險的同時大幅度提高模型的收益率,從而使得模型的夏普比率和索提諾比率均有較大幅度上漲;分樣本檢驗、全IMF信號預測以及基于商品期貨市場的套利分析,均證明融合EMD的機器學習模型可以獲得比純機器學習模型更優異的套利效果.研究結論有助于促進人工智能與金融學的交叉融合研究,同時也為期貨投資提供了理論和現實參考.

  關鍵詞:機器學習;經驗模態分解;跨期套利;期貨投資;人工智能

機器學習

  跨期套利是利用同一種期貨品種、不同到期時間合約間價差的不尋常變動,進而實施反向交易,在兩個合約間價差回歸常態時進行平倉獲利的投資方式.相對于股票等金融工具的買入并持有策略而言,跨期套利由于交易的是同一種期貨品種不同合約之間的價差,相對風險更低.

  相對于跨品種或者跨市場套利,跨期套利的合約價差更為穩定,因此投資的穩定性更高,風險也相對較低.跨期套利在價差超過正常值較遠的時候進行反向交易,單筆利潤相對于買入持有的趨勢投資策略往往更低,由于期貨市場具有較高的杠桿屬性,且T+0的交易模式使得交易頻率可以更高,致使套利交易的風險調整后收益往往更高[1-4],致使越來越多的基金公司在實踐中引入套利交易.

  同時,套利交易與買入持有策略間的相關性極低甚至為負,因此是分散投資風險及規避尾部風險的重要手段,如2020年年初新冠肺炎疫情導致全球股票市場、債券市場、商品市場均發生了大幅回撤,如果在投資組合中加入套利交易,則可以對尾部風險進行極為有效的控制.

  對價差的準確預測是跨期套利成功實施的關鍵所在,現有絕大部分文獻及實際投資者均是利用價差均值回復原理的標準距離法設計策略,即當價差超過合理范圍(常見的為均值±1倍或多倍標準差)的時候進行反向交易,待價差回到均值附近時進行平倉[5-7].

  隨著機器學習模型在金融預測領域應用得越來越廣泛、且預測精度高,眾多學者和投資者利用機器學習模型對價差進行預測,并在預測價差超過一定閾值后進行交易,從而獲得套利收益.常用來進行套利交易的機器學習模型包括人工神經網絡[8-12]、支持向量機[13-14]和隨機森林[15]等.

  但是,直接對價差進行預測無疑喪失了許多細節信息,如熊志斌[16]和周亮[17]對人民幣匯率的研究均發現,用ARIMA模型預測線性部分、用機器學習模型預測非線性部分或殘差部分能夠實現對離岸人民幣匯率更精準的預測.Huang等[18]提出的經驗模態分解(EMD)模型在工程信號領域有著廣泛的應用,該模型可以將信號分解為多個本征模函數(IMF)及殘差項,每個本征模函數及殘差項均有自身的特征益于分析及預測.

  自EMD模型提出后,眾多學者將該模型應用于經濟問題分析,包括原油價格分析[19-20]、環境問題分析[21-23]等,相對于對原始數據的直接分析,利用分解信號進行分析的研究結果更為準確和穩健.本文擬采用EMD模型對滬深300股指期貨當月合約與下月合約的價差進行分解,并利用神經網絡、支持向量機、隨機森林以及ARIMA模型分別對高頻和低頻信號進行預測,再從預測準確性及套利績效兩個方面來評估模型的優劣.

  相較于已有期貨跨期套利的文獻,本文的主要創新之處在于:①通過EMD模型對原始價差變動序列進行滾動分解,再利用各機器學習模型對分信號進行預測,相對于純機器學習預測模型,對序列信號考慮得更加周全和完整,也大幅提高了模型的預測精度及套利績效;②通過將多個機器學習模型及線性的時間序列模型進行比較及綜合,既挑選出了更適用于跨期套利的模型,同時也將線性模型和非線性模型整合,在增加模型套利績效的同時,也增加了機器學習模型的經濟解釋能力.

  1研究設計

  1.1機器學習模型

  1.1.1Elman網絡

  Elman神經網絡是一種簡單的循環神經網絡,在眾多學者的研究中均表現出超過普通反饋神經網絡(如BP網絡)的特征[12,24].Elman神經網絡除了常見的輸入層、隱藏層和輸出層之外,在隱藏層的輸入和輸出之間增加了一個承接層,該模塊存儲了隱藏層的輸入信號,再作為輸入變量影響隱藏層的下期輸入。

  1.1.2隨機森林

  隨機森林(RF)是一種集成學習方法,它的基本單元是決策樹,每棵決策樹都是一個分類器.隨機森林只關注樹的集成學習,在樹的集成(森林)產生之后,該模型使用投票的方法來組合預測結果,將投票次數最多的類別指定為最終的輸出.隨機森林可以處理大量的數據,而大數據中所謂的“維數災難”常常會讓其他模型失敗,同時隨機森林對于大多數學習任務的誤差率幾乎和其他方法處于同等水平,并具有更少的過度擬合傾向.本文中隨機森林采用500顆決策樹進行分析.

  1.2經驗模態分解(EMD)

  EMD是一種非線性、非平穩數據處理方法,它假定數據根據其復雜性可能同時存在多種振蕩模式.EMD可以基于數據本身的局部特征,從原始時間序列提取出本征模函數(IMF),它滿足以下兩個條件:①函數的極值和零交叉數相同,或最多相差1;②函數關于局部零均值是對稱的.這兩個條件確保IMF近似周期性的函數,并且均值為零.IMF是一種類似諧波的函數,但在不同時間具有可變的幅度和頻率.

  1.3套利模型設計

  本文利用機器學習的預測結果來構造跨期套利策略,當模型預測下期價差與當期價差的差值大于α時,則買入當月合約,賣出下月合約;當模型預測下期價差與當期價差小于-α時,則賣出當月合約,買入下月合約;當持有套利組合且模型預測值的絕對值小于α時平倉.股指期貨的杠桿是10倍,交易手續費為0.23%%,樣本區間內兩個合約的均價在3150附近,因此我們假定每單位交易手續費為0.15元.考慮到期貨市場杠桿率較高、風險較大,當出現套利機會時,我們只采用75%的資金進行滾動套利.

  2實證檢驗

  2.1樣本描述

  為了檢驗機器學習融合經驗模態分解的跨期套利策略的可行性,本文選擇滬深300股指期貨的當月連續合約和下月連續合約進行分析,由于滬深300股指期貨(以下簡稱IF合約)2010年4月16日才上市,因此最終選擇了IF當月連續和下月連續合約2010年4月16日-2020年7月31日的所有日數據進行分析,共2503個交易日.報告了兩個合約在樣本區間的走勢,左軸為IF當月連續合約價格曲線,右軸為IF下月連續合約價格曲線.兩者走勢幾乎一致,計算發現兩者相關系數高達0.999,兩者的價差在-130~70之間波動(99%置信區間),存在著跨期套利的可行性.

  2.2基于機器學習的預測和套利

  2.2.1預測效果

  采用3種機器學習方法(Elman網絡、RF、SVM)及ARIMA模型對價差變動進行預測.對于機器學習模型,采用前20期的數據(t-20至t-1期)作為輸入變量來預測第t期的價差;對于ARIMA則根據自相關系數(ACF)和偏自相關系數(PACF)確定模型的參數,并向前一步預測第t期的價差.所有模型均采用1000個滾動樣本進行建模,即第1001個價差變動數據是利用1~1000個價差變動數據進行建模;第1002個價差變動數據是利用2~1001個價差變動數據進行建模,依次類推.

  報告了4個模型的預測效果,可以看到SVM模型的RMSE、Theil-U指數和R2OS表現最佳;ARIMA模型的MAE和DAR表現最優;Elman模型表現相對較差,其R2OS甚至為負,說明用Elman進行預測略遜于用樣本內均值進行預測的效果;RF模型雖然整體誤差較SVM模型略高,但是其DAR卻略優于SVM模型,這與其他很多研究相似,由于RF模型集成了多個決策樹,表現出的結果更為穩健.

  2.2.2套利分析

  采用不同的α閾值進行套利,報告了4個模型的套利結果,其中PanelA是α=1時的套利效果,PanelB是α=4時的套利效果,PanelC是α=8時的套利效果.第2至第5列分別報告了基于Elman,RF,SVM及ARIMA模型預測結果的套利效果,為了避免單一模型進行預測時的弊端,第6列和第7列綜合了RF模型和ARIMA模型預測結果進行套利.本文采用RF模型是因為其表現較為穩健,預測效果介于Elman和SVM之間;綜合一個非線性的機器學習模型(RF)和一個線性的時序預測模型(ARIMA),預期會增加套利模型的穩健性;第6列是將兩個模型預測值進行平均,第7列是只有兩個模型預測值都超過閾值時才進行套利.

  2.3EMD分解及機器學習預測

  為了更好地了解跨期價差的微觀結構,提高跨期套利的績效表現,本文采用EMD模型對原始價差變動數據進行信號分解.EMD模型將原始信號分成了10個IMF信號及1個殘差信號,從IMF1-IMF10分別表示從高頻到低頻的本征模函數.IMF10及殘差信號已經變成了一條非常平滑的曲線.由于對所有序列進行建模會加大計算機的工作量,本文后面的分析將借鑒Zhang等[22]的方法,將所有IMF合成一個高頻信號和一個低頻信號,其中高頻信號波動劇烈,與原始信號相似性較強,而低頻信號及殘差信號則表現出較強的線性特征.

  2.4分樣本穩健性檢驗

  為了檢驗研究結論的穩健性,本文將整個套利區間劃分為兩個時間相等的分樣本,各包括3年時間,分別是2014年7月-2017年7月、2017年8月-2020年7月.報告了分樣本檢驗結果,其中PanelA和PanelB是2014年7月-2017年7月的套利結果,PanelC和PanelD是2017年8月-2020年7月的套利結果;PanelA和PanelC僅采用了機器學習模型,PanelB和PanelD采用了機器學習與EMD相結合的套利模型(限于篇幅,同樣僅報告了α=1時的套利結果).

  無論是2017年7月以前還是以后,機器學習加EMD模型的套利風險雖然與純機器學習模型相當,但其套利收益卻要顯著高于純機器學習模型(除第一階段RF+EMD的投資收益相對RF模型略有降低外),從而使得機器學習加EMD模型的夏普比率和索提諾比率均顯著高于純機器學習模型,本文的研究結論穩健.相對于2017年7月之前,2017年7月之后的套利收益有所下降,套利風險也有所降低,這也間接說明隨著期貨市場的不斷發展,市場有效性在逐步提高,從而使得套利空間有所收窄.

  2.5EMD全分解滾動套利效果

  均是基于EMD分解后再將多個本征模函數合成一個高頻信號和一個低頻信號,這樣的操作方式可以極大地提高計算機的運算速度,但是也會喪失較多的信號信息,因此本文利用RF,SVM和ARIMA分別對每個本征模函數及殘差信號進行預測,再綜合為最終的預測值.相對于合成兩個信號,這種方法利用到了更多的信息,但是運行速度慢了約5倍.表5報告了對每個分解信號單獨進行預測的套利結果,其中PanelA是模型的預測偏差,PanelB是基于預測值的套利結果,同樣僅報告了α=1時的套利績效.

  基于EMD所有信號的套利模型,RF模型和SVM模型的預測精度有所提高,ARIMA略有下降.所有模型的投資收益均有一定幅度的上升,波動率也略有上升,而下行波動率反而有所下降(除SVM模型略有上升),因此模型的夏普比率和索提諾比率均大幅上升,同時模型的勝率也顯著提高.總體來看,基于EMD所有信號預測值的套利模型相對于將信號合成高頻和低頻的模型,投資績效又有了一定程度的上升,只是損失了計算機的運行速度,在實際投資過程中可能會因價格變動過快而導致實際投資收益與回測收益有一定的偏差,比較適合于較低頻率及較穩定市場的套利投資.

  3結論與討論

  選擇IF當月連續和下月連續合約2010年4月16日-2020年7月31日的所有日數據,利用3種機器學習方法(Elman,RF,SVM)及ARIMA模型對兩個合約的價差變動序列進行預測并構建套利模型.研究結果發現:

  ①SVM和ARIMA模型的預測精確度相對較高,Elman模型表現較差,而RF模型由于集成了多個弱分類器,表現出的結果較為穩健.

  ②所有模型在任何閾值下均能取得較高的套利收益,同時絕大部分模型最大回撤均能控制在20%以內,波動率均低于33%,下行波動率均低于16%,說明套利模型風險控制較好;相對于僅采用RF或ARIMA進行預測,混合模型(將預測值進行平均或作為并列條件)的風險控制更好,表現為更低的波動率、下行波動率及最大回撤,說明將非線性模型和線性模型融合使用能夠改善模型的風險控制能力.

  ③將機器學習預測與EMD分解技術相融合可以在不提高風險的同時大幅提高模型的收益率,從而使得模型的夏普比率和索提諾比率均有較大幅度上升,表現最好的是EMD-ARIMA模型,其年化收益率高達96.52%,夏普比率和索提諾比率分別高達2.8549和8.2711.

  ④分樣本檢驗、全IMF信號預測及基于商品期貨市場的套利分析,均證明融合EMD的機器學習模型可以獲得比純機器學習模型更優異的套利效果.本文的研究結論不僅是對期貨投資理論及人工智能方法在金融領域中應用的補充,同時也具有較強的實踐價值:

  ①跨期套利是一種有效的投資策略,相對于買入持有等基于價格預測的投資策略,套利策略的風險更低,如果方法得當,收益卻反而可能獲得提高.同時,大量理論研究及實踐均證明,商品期貨策略(尤其是套利策略)與股市等投資策略的相關性極低甚至為負,因此在股票投資策略中增加跨期套利策略,可以有效降低整體投資組合的風險,從而提高投資收益率,并且可以在極端的市場風險下保護資產的安全性.

  ②機器學習模型在對非線性金融時間序列數據進行預測時具有較好的效果,但是機器學習模型完全由數據驅動,其經濟基礎較為薄弱,因此將其與經濟基礎更為穩健的線性預測模型相結合,可以在提升模型預測能力的同時,增加模型的經濟解釋能力.③金融時間序列具有較高的復雜性及噪聲比率,采用單一模型進行預測無疑會喪失很多信息,通過EMD等信號分解模型將金融時間序列進行分解,通過趨勢成分或波動成分的提取分別進行預測,可以實現對金融時間序列更為準確的預測,并進而提升跨期套利成功的幾率.

  參考文獻:

  [1]楊云飛,鮑玉昆,胡忠義,等.基于EMD和SVMs的原油價格預測方法[J].管理學報,2010,7(12):1884-1889.

  [2]JACOBSH,WEBERM.OntheDeterminantsofPairsTradingProfitability[J].JournalofFinancialMarkets,2015,23:75-97.

  [3]張波,劉曉倩.基于EGARCH-M模型的滬深300股指期貨跨期套利研究———一種修正的協整關系[J].統計與信息論壇,2017,32(4):34-40.

  [4]劉海飛,李偉,李冬昕,等.股指期貨跨期套利自適應機制理論與實證———基于滬深300股指期貨高頻數據的證據[J].華東經濟管理,2018,32(11):102-111.

  [5]KRAUSSC,DOXA,HUCKN.DeepNeuralNetworks,Gradient-BoostedTrees,RandomForests:StatisticalArbi-trageontheS&P500[J].EuropeanJournalofOperationalResearch,2017,259(2):689-702.

  [6]HAINM,HESSJ,UHRIG-HOMBURGM.RelativeValueArbitrageinEuropeanCommodityMarkets[J].EnergyEconomics,2018,69:140-154.

  [7]邢亞丹,勞蘭珺,孫謙.跨期套利收益與風險來源探究———基于滬深300股指期貨高頻跨期套利策略[J].投資研究,2015,34(10):98-109.

  作者:周亮1,陳辰2,李寧1

主站蜘蛛池模板: 国产一级做a爰片... | 大色香蕉色视频大全 | 久久亚洲综合中文字幕 | 国产欧美日韩视频在线观看 | 日韩午夜 | 午夜精品久久久久久久第一页 | 国产成人综合久久精品红 | 222在线看片免费 | 亚洲狠狠成人综合网 | 国产成人精品久久亚洲高清不卡 | 欧美一区二区三区在线可观看 | 亚洲一区色图 | 黄片毛片大全 | 欧美色视频免费高清播放 | 日韩欧美在线播放视频 | 国产欧美精品一区二区三区-老狼 | 日韩在线视频中文字幕 | 日韩国产精品99久久久久久 | 国产精品k | 精品国产女同疯狂摩擦2 | 成人免费视频无遮挡在线看 | 免费碰碰视频 | 打床炮视频在线观看免费 | 国语自产拍天天在线 | 久久中文精品 | 高清性色生活片免费观看 | 国产成人精品.一二区 | 免费国产一级特黄aa大片在线 | 久久99这里只有精品国产 | 久久精品国产一区二区三区日韩 | 麻豆网页 | 日韩欧美一及在线播放 | yy8090韩国日本三理论免费 | 国产成人在线视频播放 | 国产成人18黄网站在线观看网站 | 99综合 | 日韩在线精品 | 成人免费看片网站 | 国产萝控精品福利视频免费观看 | 国产福利写真视频在线观看 | 亚洲视频网址 |