# 大模型技术在金融业的演进:从狂热到理性ChatGPT问世以来,金融业迅速掀起一股热潮,行业普遍担心被新技术浪潮甩在后面。这种焦虑情绪一度蔓延到各个角落,甚至在寺庙里也能听到有人讨论大模型话题。然而,这种焦虑正逐渐平息,人们的思路也变得更加清晰和理性。金融业对大模型的态度经历了几个阶段:二三月份,普遍感到焦虑;四五月份,纷纷组建团队开始行动;之后几个月,在寻找方向和落地过程中遇到困难,开始趋于理性;目前,更多关注标杆案例,尝试验证过的场景。一个新趋势是,不少金融机构已将大模型提升到战略层面。据不完全统计,A股上市公司中,至少有11家银行在最新半年报中明确提出正在探索大模型应用。从近期动作看,他们也正从战略和顶层设计层面进行更清晰的思考和路径规划。# 从热情高涨到理性回归与几个月前相比,金融客户对大模型的理解明显提升。年初ChatGPT刚出现时,虽然大家热情高涨,但对大模型的本质和应用方式了解有限。这一阶段,一些大型银行率先行动,开始进行各种"蹭热度"的宣传。另一方面,随着多家厂商发布大模型,一些头部金融机构的科技部门积极与大厂探讨大模型建设事宜。他们普遍希望自建大模型,询问数据集处理、服务器采购、训练方法等问题。5月以后,情况逐渐变化。受限于算力资源紧缺、成本高昂等因素,很多金融机构开始从单纯希望自建转向更关注应用价值。"现在每家金融机构都在关心其他人用大模型做了什么,实现了怎样的效果。"不同规模企业也分出两条路径:大型金融机构可引入领先基础大模型,自建企业大模型,同时采用微调形式,形成专业领域任务大模型;中小金融机构则可按需引入各类大模型的API或私有化部署服务。由于金融行业对数据合规性、安全性、可信性等要求高,部分人士认为,这一行业的大模型落地进展实际略滞后于年初预期。一些金融机构已开始解决大模型落地过程中的各种"桎梏"。在算力方面,业内涌现出几种解决思路:1. 直接自建算力,成本高但安全性高,适用于希望自建行业或企业大模型的大型金融机构。2. 算力混合部署,在敏感数据不出域情况下,接受从公有云调用大模型服务接口,同时通过私有化部署处理本地数据服务。成本较低,适用于资金相对薄弱的中小型金融机构。不过,很多中小机构仍面临买不到也买不起GPU卡的难题。针对这个问题,相关部门正在进行课题研究,探索是否能以折中方式,牵头搭建面向特定行业的大模型基础设施,集中算力、通用大模型等资源,让中小金融机构也能用上大模型服务,防止"技术掉队"。除算力外,不少金融机构也逐渐加强了数据治理。越来越多的中型金融机构开始构建数据中台和数据治理体系。有银行通过大模型+MLOps方式解决数据问题,实现了整个流程自动化,以及多源异构数据的统一管理和高效处理。# 从外围场景切入过去半年多,大模型服务商和金融机构都在寻找场景,智慧办公、智能开发、智慧营销、智能客服、智慧投研、智能风控、需求分析等被一一探索。每家金融机构对大模型都有丰富构想。但要真正落地,大家的共识是先内部后外部。当前大模型技术尚不成熟,而金融行业是强监管、高安全、高可信的行业。短期内不建议直接面向客户使用。金融机构应优先将大模型用于金融文本和图像分析理解创作等智力密集型场景,以助手形式人机协同来提升业务人员工作效率。目前,代码助手已在不少金融机构落地。智慧办公领域也有不少案例。但业内人士判断,这些广泛落地的场景,实际都还不是金融机构的核心应用,大模型距离深入金融行业的业务层面还有一定距离。有预测认为,今年底之前会有一批真正在金融机构核心业务场景中使用大模型的项目建设或招标信息出现。在此之前,一些顶层设计层面的改变正在进行。未来的整个智能化、数字化系统,都将重新建立在大模型基础之上。这要求金融行业在推动大模型落地过程中,重新架构系统。同时,也不能忽视传统小模型的价值,而应该让大模型、小模型协同起来。目前已有多家头部金融机构基于大模型,搭建了包含基础设施层、模型层、大模型服务层、应用层等多个层级的分层系统框架。这些框架体系普遍有两大特点:一是大模型发挥中枢能力,将传统模型作为技能进行调用;二是大模型层采用多模型策略,内部赛马,选出最优效果。# 人才缺口依然庞大大模型的应用,已开始对金融行业的人员结构带来一些挑战和变革。一些工作岗位开始被大模型替代。不过,一些银行并不希望大模型带来减员,而是希望大模型带来新机会,提升员工服务质量和工作效率,同时释放部分员工做更多高价值的事情。这其中不乏人员和结构稳定的考量。另一方面,也是因为行内很多岗位还有人才缺口。大行有大量工作需要完成,部分IT需求的工期甚至排到明年年底,他们希望大模型能助力员工提高效率和速度,而不是带来人员缩减。更重要的是,大模型的火来得又急又烈,短时间内稀缺的人才供给难以匹配激增的需求。直接应用大模型的人才需求相对简单,需要的是会提问题的人。但如果自建行业或企业大模型,则需要金融机构有一支精干的垂直大模型技术队伍。一些机构已经采取行动。有公司联合银行实验室人力资源团队,梳理了大模型在企业应用的人员转身实践,设计出系列培训课程,如Prompt调优、微调、大模型运营等,并与各部门合作,建立联合项目组,驱动企业人员能力提升。在这个过程中,金融机构的人员结构也会迎来一些调整和变革。会用大模型的开发人员,更容易在这个环境中留存下来。
金融业大模型应用趋势:从狂热到落地 战略布局与人才需求持续升温
大模型技术在金融业的演进:从狂热到理性
ChatGPT问世以来,金融业迅速掀起一股热潮,行业普遍担心被新技术浪潮甩在后面。这种焦虑情绪一度蔓延到各个角落,甚至在寺庙里也能听到有人讨论大模型话题。
然而,这种焦虑正逐渐平息,人们的思路也变得更加清晰和理性。金融业对大模型的态度经历了几个阶段:二三月份,普遍感到焦虑;四五月份,纷纷组建团队开始行动;之后几个月,在寻找方向和落地过程中遇到困难,开始趋于理性;目前,更多关注标杆案例,尝试验证过的场景。
一个新趋势是,不少金融机构已将大模型提升到战略层面。据不完全统计,A股上市公司中,至少有11家银行在最新半年报中明确提出正在探索大模型应用。从近期动作看,他们也正从战略和顶层设计层面进行更清晰的思考和路径规划。
从热情高涨到理性回归
与几个月前相比,金融客户对大模型的理解明显提升。年初ChatGPT刚出现时,虽然大家热情高涨,但对大模型的本质和应用方式了解有限。
这一阶段,一些大型银行率先行动,开始进行各种"蹭热度"的宣传。另一方面,随着多家厂商发布大模型,一些头部金融机构的科技部门积极与大厂探讨大模型建设事宜。他们普遍希望自建大模型,询问数据集处理、服务器采购、训练方法等问题。
5月以后,情况逐渐变化。受限于算力资源紧缺、成本高昂等因素,很多金融机构开始从单纯希望自建转向更关注应用价值。"现在每家金融机构都在关心其他人用大模型做了什么,实现了怎样的效果。"
不同规模企业也分出两条路径:大型金融机构可引入领先基础大模型,自建企业大模型,同时采用微调形式,形成专业领域任务大模型;中小金融机构则可按需引入各类大模型的API或私有化部署服务。
由于金融行业对数据合规性、安全性、可信性等要求高,部分人士认为,这一行业的大模型落地进展实际略滞后于年初预期。
一些金融机构已开始解决大模型落地过程中的各种"桎梏"。在算力方面,业内涌现出几种解决思路:
直接自建算力,成本高但安全性高,适用于希望自建行业或企业大模型的大型金融机构。
算力混合部署,在敏感数据不出域情况下,接受从公有云调用大模型服务接口,同时通过私有化部署处理本地数据服务。成本较低,适用于资金相对薄弱的中小型金融机构。
不过,很多中小机构仍面临买不到也买不起GPU卡的难题。针对这个问题,相关部门正在进行课题研究,探索是否能以折中方式,牵头搭建面向特定行业的大模型基础设施,集中算力、通用大模型等资源,让中小金融机构也能用上大模型服务,防止"技术掉队"。
除算力外,不少金融机构也逐渐加强了数据治理。越来越多的中型金融机构开始构建数据中台和数据治理体系。有银行通过大模型+MLOps方式解决数据问题,实现了整个流程自动化,以及多源异构数据的统一管理和高效处理。
从外围场景切入
过去半年多,大模型服务商和金融机构都在寻找场景,智慧办公、智能开发、智慧营销、智能客服、智慧投研、智能风控、需求分析等被一一探索。
每家金融机构对大模型都有丰富构想。但要真正落地,大家的共识是先内部后外部。当前大模型技术尚不成熟,而金融行业是强监管、高安全、高可信的行业。
短期内不建议直接面向客户使用。金融机构应优先将大模型用于金融文本和图像分析理解创作等智力密集型场景,以助手形式人机协同来提升业务人员工作效率。
目前,代码助手已在不少金融机构落地。智慧办公领域也有不少案例。但业内人士判断,这些广泛落地的场景,实际都还不是金融机构的核心应用,大模型距离深入金融行业的业务层面还有一定距离。
有预测认为,今年底之前会有一批真正在金融机构核心业务场景中使用大模型的项目建设或招标信息出现。
在此之前,一些顶层设计层面的改变正在进行。未来的整个智能化、数字化系统,都将重新建立在大模型基础之上。这要求金融行业在推动大模型落地过程中,重新架构系统。同时,也不能忽视传统小模型的价值,而应该让大模型、小模型协同起来。
目前已有多家头部金融机构基于大模型,搭建了包含基础设施层、模型层、大模型服务层、应用层等多个层级的分层系统框架。这些框架体系普遍有两大特点:一是大模型发挥中枢能力,将传统模型作为技能进行调用;二是大模型层采用多模型策略,内部赛马,选出最优效果。
人才缺口依然庞大
大模型的应用,已开始对金融行业的人员结构带来一些挑战和变革。
一些工作岗位开始被大模型替代。不过,一些银行并不希望大模型带来减员,而是希望大模型带来新机会,提升员工服务质量和工作效率,同时释放部分员工做更多高价值的事情。
这其中不乏人员和结构稳定的考量。另一方面,也是因为行内很多岗位还有人才缺口。大行有大量工作需要完成,部分IT需求的工期甚至排到明年年底,他们希望大模型能助力员工提高效率和速度,而不是带来人员缩减。
更重要的是,大模型的火来得又急又烈,短时间内稀缺的人才供给难以匹配激增的需求。直接应用大模型的人才需求相对简单,需要的是会提问题的人。但如果自建行业或企业大模型,则需要金融机构有一支精干的垂直大模型技术队伍。
一些机构已经采取行动。有公司联合银行实验室人力资源团队,梳理了大模型在企业应用的人员转身实践,设计出系列培训课程,如Prompt调优、微调、大模型运营等,并与各部门合作,建立联合项目组,驱动企业人员能力提升。
在这个过程中,金融机构的人员结构也会迎来一些调整和变革。会用大模型的开发人员,更容易在这个环境中留存下来。