重點
- 雖然人工智能﹙AI﹚的顛覆性潛力最近才備受關注,但在過去近二十年來,這些技術一直對貝萊德系統分析投資方針的發展舉足輕重。
- 相比通用型聊天機械人,我們用於證券分析的大型語言模型(LLM)以更具針對性及精選的數據集進行訓練及微調,能夠精準地執行特定投資任務。
- 在駕馭動態市場主題時,我們的主題性模型工具融合專家觀點及大型語言模型與大數據的力量,構建更高效及廣泛的股票籃子。
大型語言模型的崛起以及生成式人工智能工具向公眾開放,引發人們熱烈關注人工智能改變社會、經濟及工作流程的潛力。
隨著人工智能的影響力擴展至各行各業,本篇投資觀點探討有關技術對於投資管理的影響及應用。過去近二十年來,人工智能及機器學習一直在貝萊德系統分析的投資流程發揮關鍵作用。我們運用這些技能,不斷從定性領域轉向定量領域,擴大可衡量的投資範圍,追求更精確及與眾不同的投資成果。
運用人工智能技術從文本數據中發掘投資觀點
大型語言模型標誌著人工智能研究的突破性發展,這一發展建基於模型的進步、計算能力顯著提升,以及用於訓練的數據量激增。新世代模型採用了稱為Transformer技術的神經網絡架構,能夠處理長序列元素(例如句子中的詞語),同時考慮上下文關係。現代大型語言模型透過相當於維基百科的規模1,000倍以上的龐大文本進行訓練,在訓練過程中不僅掌握了語法知識,亦學習到一些事實知識及基本常識推理。
大型語言模型在投資應用上具備一項重要技能,就是能夠高效分析現有文本數據,並提取出精細的觀點。作為系統分析投資者,我們綜合各種文本來源的資料,包括分析師報告、企業業績會議記錄、新聞文章及社交媒體,為投資預測提供指引,幫助發掘潛在超額回報機遇。
我們最早的文本分析方法側重於計算文件中正面及負面詞語的數量,以創建整體情緒分數。雖然這些信號能發揮作用,但其設計並未考慮可能影響文本含義的多種因素。時至今日,我們不再獨立分析每個詞語,而是運用大型語言模型來整體處理一段文本,並考慮每句中詞語之間的關係,以及其與整篇文章的關係。
圖1以「company」一詞為例,說明模型如何評估其他詞語對其含義的重要性。最相關的詞語以最深橙色標示,包括公司名稱(「XYZ」)、「strong」及「earnings」。顏色較淺表示兩者之間的聯繫不太重要。透過將這種更深層次的分析擴展至廣泛的文本數據,我們能夠在證券分析中提取更精細及有價值的觀點。
圖1:透過分析上下文及一段文字中詞語之間的關係,我們有望獲得更準確及與別不同的投資觀點
不同顏色反映句子內的詞語與「company」一詞的關聯度
資料來源:貝萊德系統分析,僅供參考,截至2024年7月。
通用型聊天機械人背後的大型語言模型以涉及多個主題的大量參考數據進行訓練,因此其應用範圍廣泛,能夠執行大量不同任務。相比之下,我們投資過程使用的大型語言模型經過微調,以執行特定投資任務,例如預測企業業績會議後的市場反應。這些模型根據更具針對性及特定的參考數據進行訓練,以高度準確性去完成任務。
圖2使用了2024年第一季舉行的500場公司業績會議的隨機樣本,對比我們的業績會議模型與OpenAI最新GPT模型的預測準確度。值得留意的是,我們的分析顯示,較新版本的GPT-4推出後,OpenAI的GPT模型預測準確度有所下降。一個可能解釋是這些模型的定位是通用型助手,並以此基礎進行訓練及評估,每個新版本的重點均在於提高其生成人類感知更有用的內容。有證據顯示,這種形式的微調可增強其通用能力,但會犧牲其他應用層面的性能,有可能導致其在特定預測工作的表現下降。我們的專有模型則截然不同,該模型根據覆蓋17,000多間上市公司的400,000多份業績會議記錄進行訓練,並結合過去二十年來的市場數據,專門學習業績會議記錄文本與後續市場反應之間的關聯。
圖2:貝萊德的專有模型經過微調,以高度準確性預測業績公佈後的市場反應
模型預測業績公佈後40天的股票回報時的準確度
資料來源:貝萊德系統分析,截至2024年5月。此分析使用500個業績會議樣本來計算每個模型的預測,並與40天後的回報進行比較。準確度是每個模型正確預測的比例。用於分析的模型為GPT-3.5(2023年3月)、GPT-4(2023年6月)、GPT-4 Turbo(2024年1月)、GPT-4o(2024年5月)及貝萊德系統分析模型(2023年12月)。
運用人工智能技術駕馭主導市場的主題
大型語言模型在我們如何駕馭市場相關主題趨勢方面亦發揮關鍵作用。這些相關主題涵蓋長期趨勢以至新興結構性趨勢等廣泛議題,即使未必相關,但往往會推動證券產生顯著回報。這些主題通常橫跨行業、投資風格或地域界限。
當某個主題吸引市場關注時(例如,在家工作環境趨勢的迅速變遷或突破性創新技術的推出),投資者往往會構建專屬證券籃子,或運用現有經紀商籃子,前者可能涉及人手操作且花費時間,後者則可能缺乏透明度及廣度。為了應對這些挑戰,我們設計了一個快速靈活的股票籃子構建流程,我們稱之為主題性模型,該模型使我們能夠結合大型語言模型及專有數據,借助單一簡化工具來構建長短倉或長倉股票組合。
下圖展示了一個案例,說明基金經理如何使用這工具圍繞著GLP-1﹙一種快速流行的減重藥物﹚的主題構建組合。 該例子顯示了大型語言模型的深厚知識基礎如何結合業績會議文本分析,在短短數分鐘內發掘廣泛的利好及利淡因素。
識別與市場主題相關的股票可能相當複雜…
為了應對此問題,貝萊德系統分析團隊結合專家觀點、大型語言模型及大數據,以建立一個可重複應用的框架於股票組合構建上。
分析過程
投資組合經理首先指定需要分析的主題及參數,包括潛在種子公司。
大型語言模型識別受影響的商業模式,並利用文本分析的其他觀點,將相關投資配對到篩選後的股票,以構建股票組合。
分析結果顯示了標準化的組合表現,我們發現種子公司的長倉最為利好表現…
然而,多個其他主要利好表現的持倉均是短倉,凸顯了該模型有潛力識別交易策略中不易察覺的部分。
透過深入研究分析結果,我們能夠發現大型語言模型識別的相關業務模式。
大型語言模型亦為每個類別提供詳細理據,提高透明度。
文本分析有助識別較間接的公司關聯性,並詳細展示這些關聯性如何受到主題影響。
重要的是,此流程每個環節均整合了投資組合經理的專業知識:從定義個別主題或情景、根據專家判斷的前設定制分析、乃至完全了解大型語言模型的邏輯並反覆改進分析,以及完善投資組合反映的觀點。該工具旨在提高主題性組合構建的速度及規模,全面涵蓋與主題直接或間接相關的公司。
我們將這些主題觀點廣泛應用於系統分析策略,包括捕捉股票投資組合的超額回報、衡量現有投資組合對新興主題的持倉,以及長遠在推動市場的廣泛主題中進行戰術性輪換。
在上文的例子中,主題性模型能夠以最低限度的人為干預,識別主題性交易策略中不太顯眼的部分。然而,某些情況下,基金經理的觀點舉足輕重,能糾正大型語言模型的錯誤,或提供更多背景資訊以提升分析結果的質素。儘管大型語言模型的改進及框架不斷發展,致力減少技術限制及相關風險,但在投資管理方面,專家的參與對於應用人工智能仍然舉足輕重。
總結
隨著人工智能日益普及易於使用,人們日益關注相關技術對投資領域的潛在影響。貝萊德系統分析多年來一直運用人工智能及機器學習來大規模部署投資觀點,例如應用大型語言模型來提高文本投資分析的準確度以及構建主題組合的效率。隨著市場不斷改變,這些技能致力將數據轉化為有價值的觀點,以追求更佳投資成果。