為什麼金融機器學習會失敗?

為什麼金融機器學習會失敗?

作者丨馬科斯·德普拉多

量化金融領域的失敗率很高,其中的金融機器學習更是如此。

只有極少數成功的機構積累了大筆的資產,並持續為它們的投資者提供超乎尋常的業績回報。

在過去的20年中,我已經見識了太多人進來又出去,一個個公司起來又倒下。從我個人的經驗看,那些失敗案例都犯了同一個致命錯誤。

西西弗斯正規化

★ 關鍵詞:單打獨鬥

全權委託投資組合管理人做投資決策時,不會遵循一個特別的定律或基本原則(如果有的話,那就是普通管理人)。

他們獲取原始資訊並進行分析,不過主要還是依賴他們自己的判斷或直覺。他們為這些決策找的藉口是基於一些故事,但每一個決策都是一個故事。因為沒人能完全理解他們投注背後的邏輯,投資公司讓他們各自獨立工作,以保證多元化投資。

如果你曾經參加過全權委託投資組合管理人的會議,很可能已注意到了他們的會議冗長並且缺乏目標導向。參會人各執一詞,巨大的分歧在沒有實證的情況下被忽視。

當然,這並不意味著全權委託投資組合管理人不可能成功。相反,有些確實成功了。問題在於,他們天然地不能進行團隊工作:叫來50名全權委託投資組合管理人,他們的觀點會互相影響,最終結果是老闆不得不付50個人的工資,而他們完成的卻是一個人的工作。

因此,讓他們獨立工作,儘可能減少他們之間的互相影響,是非常合理的。

不管在哪裡,很多公司採用全權委託投資組合管理人模式去做量化或機器學習的專案,最終結果都很糟糕。

董事會的心態是,全權委託投資組合管理人都在用這種方式,那我們就用這種模式做量化吧。僱用50個博士,要求他們每人在6個月內製定一套投資策略。

這個方法往往事與願違,因為每個博士都會瘋狂地尋找投資機會,結果通常是:(1)擁有亮麗回測結果的過擬合;(2)標準的因子投資,一種低夏普比率(SR)的過飽和投資,但至少有理論支撐。這兩種結果都會讓投資委員會失望,致使專案最終被取消。

即使有5個博士發現了有效的投資策略,5個人的收益也無法支付50個博士的費用,因此這5個博士也要另謀高就。

這就是所謂的

讓每個員工日復一日搬石頭上山的西西弗斯(Sisyphus)正規化

,這種正規化的

投入產出比極低

元策略正規化

★ 關鍵詞:組織協作

如果你被要求自行制定一套機器學習策略,成功的機率是極其低的。

制定一套真正的投資策略所付出的努力完全不亞於制定100套投資策略所付出的努力,而且複雜度是超乎想象的:資料策劃、處理、高效能計算架構、軟體開發、特徵分析、執行模擬、回測等。

即使公司在這些領域提供了共享服務,你的處境也如同寶馬公司的一個工人被要求利用身處的車間單獨造出一輛完整的汽車一樣困難。你必須在一星期內是一個高階的焊工,另一星期又必須成為一個電工,下一星期又需要成為一個機械工程師,然後是油漆工……你不得不不斷嘗試,失敗,然後又回到焊工。這種感覺如何?

我所瞭解的每個成功的量化公司都使用了元策略(Meta Strategy)正規化。

透過《金融機器學習》這本書,你將

學到如何設立一個研究工廠以及裝配線上的各種崗位

。每個資料分析師的角色應專注於特定的任務,成為該任務的最佳人選,但同時也應該對整個過程有個全域性的視野。

《金融機器學習》概括了

工廠計劃

,其中

團隊以可預測的速度產生新的發現,並且不依賴於運氣

這也是

美國勞倫斯·伯克利國家實驗室以及其他美國國家實驗室在科學研究中常用的方法

,比如在元素週期表上新增16種元素,或者進行磁共振成像(MRI)以及正電子發射斷層掃描(PET)的基礎研究。因為新發現是團隊共同努力的結果,團隊中的個體都有所貢獻,所以沒有一個特定的個人需要為整個研究負責。

當然,設立這樣的金融實驗室需要很多時間,也需要了解自己所從事的工作以及有經驗的從業者。但是,你認為哪個成功的機會更大呢?是這個已得到證明的組織協作正規化,還是單打獨鬥的西西弗斯正規化——讓每個量化分析師將他們手中的巨石推上山頂?

* 本文節選自《金融機器學習》

為什麼金融機器學習會失敗?

[西]馬科斯·洛佩斯·德普拉多 著 中信出版集團

這是一本將機器學習演算法應用於金融建模的實戰指南。

過去幾十年,金融業一直過於依賴簡單的統計技術來識別資料中的模式,機器學習有望改變這種現狀。

在未來幾年,機器學習演算法將會給金融領域帶來顛覆性變化。

《金融機器學習》這本書的作者馬科斯·洛佩斯·德普拉多集投資經理、教授、研究員三重身份於一身,20多年來致力於透過普及機器學習演算法和超級計算的使用,以及開發識別錯誤投資策略(假陽性)的統計測試,實現金融領域的現代化。

在這本書中,他結合學術視角和豐富的行業經驗,提供了

一系列科學合理的工具和方法,解釋了投資組合經理如何使用機器學習來推導、測試和使用交易策略

《金融機器學習》這本書分為5部分。第1部分介紹瞭如何構造適合機器學習演算法的金融資料;第2部分介紹瞭如何科學地應用機器學習演算法研究這些資料並獲得實際發現;第3部分介紹瞭如何回測以及評估模型錯誤的機率;第4部分迴歸到資料,解釋從中提取資訊特徵的創新方法;第5部分介紹了高效能計算方法。書中大多數問題和解決方法都是用數學公示來解釋的,並提供了程式碼片段和練習,具有很強的實操性,可以作為金融領域投資人士的工具書。

[西]馬科斯·洛佩斯·德普拉多

美國勞倫斯·伯克利國家實驗室研究員,康奈爾大學電氣與計算機工程學院教授,擁有金融經濟學和數學金融學雙博士學位。

2020年擔任阿布扎比投資局(ADIA)量化研究與開發業務的全球負責人。擁有20多年利用機器學習演算法和超級計算開發投資策略的經驗。

曾在影響因子很高的學術期刊上發表了數十篇關於機器學習演算法和超級計算的科學文章。曾在美國國會就人工智慧對金融領域的影響發表演講。2019年被《投資組合管理雜誌》評為“年度量化分析師”。