無可否認,做投資的人都重視數據分析,現在更是用大數據做分析,並以此作為買入的基礎,跟過往通常限於財務比率的數據分析不同。大數據可以搜尋到的資訊,包括地圖、社交媒體上的留言、航運貨運資料等,這些資料都大量存在網上,但其缺點是這些數據都不能有系統地加以分類。如果以數學模型去分析,一般的電腦程式都不能做到, 需要用人工智能(Artificial Intelligence) 或機器學習(Machine Learning)這些不一樣的程式,歸納一個大的圖畫以達至投資結論。
舉一個例子,你透過觀察大數據如社交媒體的關鍵字、大市成交量,加上新開股票戶口的數目及買賣成交的落盤地點,得出一程式程序(Program Logic)去賺取每年足以跑贏大市那百分之零點零一的回報。在過往,要得出這樣的結論,需要搜集數百或千個的數據,然後經過統計學的驗證,才會被接納,成為有用的投資結論,繼而執行,相當花時間。
數據太多反而是問題
但數據太多卻衍生了另一問題,就是在統計學上,如果數據的量夠多,就算是一個很細小的結論(如只有百分之零點零零一的回報),都可被認為是一個有效的結論。但當你真的以此進行買賣時,卻不會帶來實際上的差異,特別是當考慮當中的交易費用、差價、人為的延誤等。所以,今天可能有不少人都能提出一眾投資策略,宣稱可以跑贏大市,此時投資者卻要自己想清楚其背後的科學根據是否成立。
依筆者所知,大數據的威力在於它能使用哪些支離破碎的數據,達至一個預測的結論。這種方法用於推測人類行為表現相當得心應手,因為人的行為不能單用傳統經濟邏輯及理性分析就能預測得到,而大數據可彌補不足;但應用在股市中,其必然的回報可能太少,在扣除手續費後可能得不償失,沒有實際效果。
當然,大數據放在分析客戶的信用卡還款狀況,絕對有助降低銀行的風險;用在了解客戶的基本資產分配,亦減省了前綫人手的時間;又可以藉此了解股民對大市的看法,可更準確預測大市的轉捩點;或用作了解對沖基金回報與大市及其他經濟指標的關聯性(Correlation)等。
畢竟,掌握更多數據可以幫助我們獲得更多洞見(Insights),但以為每個洞見都必然有科學上論證的背後,卻令我們容易迷失,容易忽視了其他觀點,例如公司是如何管理?憑甚麼賺取利潤?為甚麼客戶喜歡其產品?