# 大模型技術在金融業的演進:從狂熱到理性ChatGPT問世以來,金融業迅速掀起一股熱潮,行業普遍擔心被新技術浪潮甩在後面。這種焦慮情緒一度蔓延到各個角落,甚至在寺廟裏也能聽到有人討論大模型話題。然而,這種焦慮正逐漸平息,人們的思路也變得更加清晰和理性。金融業對大模型的態度經歷了幾個階段:二三月份,普遍感到焦慮;四五月份,紛紛組建團隊開始行動;之後幾個月,在尋找方向和落地過程中遇到困難,開始趨於理性;目前,更多關注標杆案例,嘗試驗證過的場景。一個新趨勢是,不少金融機構已將大模型提升到戰略層面。據不完全統計,A股上市公司中,至少有11家銀行在最新半年報中明確提出正在探索大模型應用。從近期動作看,他們也正從戰略和頂層設計層面進行更清晰的思考和路徑規劃。# 從熱情高漲到理性回歸與幾個月前相比,金融客戶對大模型的理解明顯提升。年初ChatGPT剛出現時,雖然大家熱情高漲,但對大模型的本質和應用方式了解有限。這一階段,一些大型銀行率先行動,開始進行各種"蹭熱度"的宣傳。另一方面,隨着多家廠商發布大模型,一些頭部金融機構的科技部門積極與大廠探討大模型建設事宜。他們普遍希望自建大模型,詢問數據集處理、服務器採購、訓練方法等問題。5月以後,情況逐漸變化。受限於算力資源緊缺、成本高昂等因素,很多金融機構開始從單純希望自建轉向更關注應用價值。"現在每家金融機構都在關心其他人用大模型做了什麼,實現了怎樣的效果。"不同規模企業也分出兩條路徑:大型金融機構可引入領先基礎大模型,自建企業大模型,同時採用微調形式,形成專業領域任務大模型;中小金融機構則可按需引入各類大模型的API或私有化部署服務。由於金融行業對數據合規性、安全性、可信性等要求高,部分人士認爲,這一行業的大模型落地進展實際略滯後於年初預期。一些金融機構已開始解決大模型落地過程中的各種"桎梏"。在算力方面,業內湧現出幾種解決思路:1. 直接自建算力,成本高但安全性高,適用於希望自建行業或企業大模型的大型金融機構。2. 算力混合部署,在敏感數據不出域情況下,接受從公有雲調用大模型服務接口,同時通過私有化部署處理本地數據服務。成本較低,適用於資金相對薄弱的中小型金融機構。不過,很多中小機構仍面臨買不到也買不起GPU卡的難題。針對這個問題,相關部門正在進行課題研究,探索是否能以折中方式,牽頭搭建面向特定行業的大模型基礎設施,集中算力、通用大模型等資源,讓中小金融機構也能用上大模型服務,防止"技術掉隊"。除算力外,不少金融機構也逐漸加強了數據治理。越來越多的中型金融機構開始構建數據中臺和數據治理體系。有銀行通過大模型+MLOps方式解決數據問題,實現了整個流程自動化,以及多源異構數據的統一管理和高效處理。# 從外圍場景切入過去半年多,大模型服務商和金融機構都在尋找場景,智慧辦公、智能開發、智慧營銷、智能客服、智慧投研、智能風控、需求分析等被一一探索。每家金融機構對大模型都有豐富構想。但要真正落地,大家的共識是先內部後外部。當前大模型技術尚不成熟,而金融行業是強監管、高安全、高可信的行業。短期內不建議直接面向客戶使用。金融機構應優先將大模型用於金融文本和圖像分析理解創作等智力密集型場景,以助手形式人機協同來提升業務人員工作效率。目前,代碼助手已在不少金融機構落地。智慧辦公領域也有不少案例。但業內人士判斷,這些廣泛落地的場景,實際都還不是金融機構的核心應用,大模型距離深入金融行業的業務層面還有一定距離。有預測認爲,今年底之前會有一批真正在金融機構核心業務場景中使用大模型的項目建設或招標信息出現。在此之前,一些頂層設計層面的改變正在進行。未來的整個智能化、數字化系統,都將重新建立在大模型基礎之上。這要求金融行業在推動大模型落地過程中,重新架構系統。同時,也不能忽視傳統小模型的價值,而應該讓大模型、小模型協同起來。目前已有多家頭部金融機構基於大模型,搭建了包含基礎設施層、模型層、大模型服務層、應用層等多個層級的分層系統框架。這些框架體系普遍有兩大特點:一是大模型發揮中樞能力,將傳統模型作爲技能進行調用;二是大模型層採用多模型策略,內部賽馬,選出最優效果。# 人才缺口依然龐大大模型的應用,已開始對金融行業的人員結構帶來一些挑戰和變革。一些工作崗位開始被大模型替代。不過,一些銀行並不希望大模型帶來減員,而是希望大模型帶來新機會,提升員工服務質量和工作效率,同時釋放部分員工做更多高價值的事情。這其中不乏人員和結構穩定的考量。另一方面,也是因爲行內很多崗位還有人才缺口。大行有大量工作需要完成,部分IT需求的工期甚至排到明年年底,他們希望大模型能助力員工提高效率和速度,而不是帶來人員縮減。更重要的是,大模型的火來得又急又烈,短時間內稀缺的人才供給難以匹配激增的需求。直接應用大模型的人才需求相對簡單,需要的是會提問題的人。但如果自建行業或企業大模型,則需要金融機構有一支精幹的垂直大模型技術隊伍。一些機構已經採取行動。有公司聯合銀行實驗室人力資源團隊,梳理了大模型在企業應用的人員轉身實踐,設計出系列培訓課程,如Prompt調優、微調、大模型運營等,並與各部門合作,建立聯合項目組,驅動企業人員能力提升。在這個過程中,金融機構的人員結構也會迎來一些調整和變革。會用大模型的開發人員,更容易在這個環境中留存下來。
金融業大模型應用趨勢:從狂熱到落地 戰略布局與人才需求持續升溫
大模型技術在金融業的演進:從狂熱到理性
ChatGPT問世以來,金融業迅速掀起一股熱潮,行業普遍擔心被新技術浪潮甩在後面。這種焦慮情緒一度蔓延到各個角落,甚至在寺廟裏也能聽到有人討論大模型話題。
然而,這種焦慮正逐漸平息,人們的思路也變得更加清晰和理性。金融業對大模型的態度經歷了幾個階段:二三月份,普遍感到焦慮;四五月份,紛紛組建團隊開始行動;之後幾個月,在尋找方向和落地過程中遇到困難,開始趨於理性;目前,更多關注標杆案例,嘗試驗證過的場景。
一個新趨勢是,不少金融機構已將大模型提升到戰略層面。據不完全統計,A股上市公司中,至少有11家銀行在最新半年報中明確提出正在探索大模型應用。從近期動作看,他們也正從戰略和頂層設計層面進行更清晰的思考和路徑規劃。
從熱情高漲到理性回歸
與幾個月前相比,金融客戶對大模型的理解明顯提升。年初ChatGPT剛出現時,雖然大家熱情高漲,但對大模型的本質和應用方式了解有限。
這一階段,一些大型銀行率先行動,開始進行各種"蹭熱度"的宣傳。另一方面,隨着多家廠商發布大模型,一些頭部金融機構的科技部門積極與大廠探討大模型建設事宜。他們普遍希望自建大模型,詢問數據集處理、服務器採購、訓練方法等問題。
5月以後,情況逐漸變化。受限於算力資源緊缺、成本高昂等因素,很多金融機構開始從單純希望自建轉向更關注應用價值。"現在每家金融機構都在關心其他人用大模型做了什麼,實現了怎樣的效果。"
不同規模企業也分出兩條路徑:大型金融機構可引入領先基礎大模型,自建企業大模型,同時採用微調形式,形成專業領域任務大模型;中小金融機構則可按需引入各類大模型的API或私有化部署服務。
由於金融行業對數據合規性、安全性、可信性等要求高,部分人士認爲,這一行業的大模型落地進展實際略滯後於年初預期。
一些金融機構已開始解決大模型落地過程中的各種"桎梏"。在算力方面,業內湧現出幾種解決思路:
直接自建算力,成本高但安全性高,適用於希望自建行業或企業大模型的大型金融機構。
算力混合部署,在敏感數據不出域情況下,接受從公有雲調用大模型服務接口,同時通過私有化部署處理本地數據服務。成本較低,適用於資金相對薄弱的中小型金融機構。
不過,很多中小機構仍面臨買不到也買不起GPU卡的難題。針對這個問題,相關部門正在進行課題研究,探索是否能以折中方式,牽頭搭建面向特定行業的大模型基礎設施,集中算力、通用大模型等資源,讓中小金融機構也能用上大模型服務,防止"技術掉隊"。
除算力外,不少金融機構也逐漸加強了數據治理。越來越多的中型金融機構開始構建數據中臺和數據治理體系。有銀行通過大模型+MLOps方式解決數據問題,實現了整個流程自動化,以及多源異構數據的統一管理和高效處理。
從外圍場景切入
過去半年多,大模型服務商和金融機構都在尋找場景,智慧辦公、智能開發、智慧營銷、智能客服、智慧投研、智能風控、需求分析等被一一探索。
每家金融機構對大模型都有豐富構想。但要真正落地,大家的共識是先內部後外部。當前大模型技術尚不成熟,而金融行業是強監管、高安全、高可信的行業。
短期內不建議直接面向客戶使用。金融機構應優先將大模型用於金融文本和圖像分析理解創作等智力密集型場景,以助手形式人機協同來提升業務人員工作效率。
目前,代碼助手已在不少金融機構落地。智慧辦公領域也有不少案例。但業內人士判斷,這些廣泛落地的場景,實際都還不是金融機構的核心應用,大模型距離深入金融行業的業務層面還有一定距離。
有預測認爲,今年底之前會有一批真正在金融機構核心業務場景中使用大模型的項目建設或招標信息出現。
在此之前,一些頂層設計層面的改變正在進行。未來的整個智能化、數字化系統,都將重新建立在大模型基礎之上。這要求金融行業在推動大模型落地過程中,重新架構系統。同時,也不能忽視傳統小模型的價值,而應該讓大模型、小模型協同起來。
目前已有多家頭部金融機構基於大模型,搭建了包含基礎設施層、模型層、大模型服務層、應用層等多個層級的分層系統框架。這些框架體系普遍有兩大特點:一是大模型發揮中樞能力,將傳統模型作爲技能進行調用;二是大模型層採用多模型策略,內部賽馬,選出最優效果。
人才缺口依然龐大
大模型的應用,已開始對金融行業的人員結構帶來一些挑戰和變革。
一些工作崗位開始被大模型替代。不過,一些銀行並不希望大模型帶來減員,而是希望大模型帶來新機會,提升員工服務質量和工作效率,同時釋放部分員工做更多高價值的事情。
這其中不乏人員和結構穩定的考量。另一方面,也是因爲行內很多崗位還有人才缺口。大行有大量工作需要完成,部分IT需求的工期甚至排到明年年底,他們希望大模型能助力員工提高效率和速度,而不是帶來人員縮減。
更重要的是,大模型的火來得又急又烈,短時間內稀缺的人才供給難以匹配激增的需求。直接應用大模型的人才需求相對簡單,需要的是會提問題的人。但如果自建行業或企業大模型,則需要金融機構有一支精幹的垂直大模型技術隊伍。
一些機構已經採取行動。有公司聯合銀行實驗室人力資源團隊,梳理了大模型在企業應用的人員轉身實踐,設計出系列培訓課程,如Prompt調優、微調、大模型運營等,並與各部門合作,建立聯合項目組,驅動企業人員能力提升。
在這個過程中,金融機構的人員結構也會迎來一些調整和變革。會用大模型的開發人員,更容易在這個環境中留存下來。