機(jī)構(gòu)爭(zhēng)分奪秒搶灘金融大模型落地為時(shí)尚早

2023-11-30 00:00:00 證券時(shí)報(bào)

證券時(shí)報(bào)記者潘玉蓉

摩根士丹利已使用GPT-4進(jìn)行投資策略分析，高盛也用大型語言模型做風(fēng)險(xiǎn)管理分析……

在ChatGPT成為華爾街投行的新裝備時(shí)，更快、更準(zhǔn)、更定制的金融大模型來了——彭博社發(fā)布針對(duì)金融領(lǐng)域500億參數(shù)的大語言模型BloombergGPT，在處理金融專業(yè)任務(wù)上的表現(xiàn)，比通用大模型實(shí)現(xiàn)了大幅提升。

今年以來，大模型席卷金融業(yè)，一夜之間，幾乎所有金融場(chǎng)景都在探索適配大模型接口。然而，理想豐滿，現(xiàn)實(shí)骨感。有大型金融機(jī)構(gòu)IT部門人士比喻，金融大模型從戰(zhàn)略規(guī)劃到部署落地，有著從“賣家秀”走到“買家秀”的差別。大模型在金融場(chǎng)景落地的最后一公里并不好走，現(xiàn)在談效果為時(shí)尚早。

在接受證券時(shí)報(bào)記者采訪時(shí)，各類參與主體均多次提到“生態(tài)共建”，期待聯(lián)合多方力量解決算力、算法、數(shù)據(jù)、安全、監(jiān)管等問題，共赴這場(chǎng)金融大模型的“開卷考試”。

大模型席卷金融業(yè)

隨著大模型走向千行百業(yè)，一個(gè)共識(shí)逐漸形成：將通用大模型與垂直領(lǐng)域的專用大模型相結(jié)合，可以有效提升大模型的適配性。繼ChatGPT后，人工智能將在垂直應(yīng)用領(lǐng)域掀起第二波浪潮。

巨浪席卷而來，國內(nèi)金融機(jī)構(gòu)和大模型廠商們也在爭(zhēng)分奪秒搶灘。

今年8月份金融機(jī)構(gòu)發(fā)布半年報(bào)，大語言模型還停留在高管們的口頭報(bào)告中。如今，它們已經(jīng)化身一張張采購訂單投向市場(chǎng)。金融機(jī)構(gòu)的采購需求，從算力儲(chǔ)備到模型采購，從云計(jì)算資源到數(shù)據(jù)治理，覆蓋了人工智能產(chǎn)業(yè)鏈上的各類廠商。

10月10日，工商銀行發(fā)布“NLP大模型產(chǎn)品新技術(shù)采購項(xiàng)目”入圍結(jié)果，智譜華章入圍；同月，招商銀行(600036)千億級(jí)預(yù)訓(xùn)練基礎(chǔ)大語言模型招標(biāo)中，上海稀宇科技奪標(biāo)；11月10日，百度網(wǎng)訊、中國電子系統(tǒng)技術(shù)有限公司聯(lián)合拿下郵儲(chǔ)銀行“超大規(guī)模預(yù)訓(xùn)練模型金融場(chǎng)景應(yīng)用系統(tǒng)軟件開發(fā)”項(xiàng)目包。在各大保險(xiǎn)集團(tuán)內(nèi)部，針對(duì)大模型準(zhǔn)備的GPU服務(wù)器采購、數(shù)據(jù)治理服務(wù)項(xiàng)目的招標(biāo)，也在緊鑼密鼓地推進(jìn)。

據(jù)了解，金融機(jī)構(gòu)部署大模型主要有三種方式。

第一種，是獨(dú)立全棧自研，強(qiáng)調(diào)獨(dú)立自主可控。這是一些AI基礎(chǔ)較好的大型金融集團(tuán)布局大模型的路徑之一。

第二種，在通用大模型或者專業(yè)大模型基礎(chǔ)上進(jìn)行微調(diào)，結(jié)合自身海量數(shù)據(jù)(603138)和豐富場(chǎng)景，形成契合自身需求的金融大模型。

第三種，從云端調(diào)用，按需接入各類大模型API（應(yīng)用程序編程接口），完成私有化部署。當(dāng)前，百度的文心一言、阿里的通義千問、騰訊的混元大模型，都有面向金融行業(yè)構(gòu)建生態(tài)合作伙伴的部署。

擁有眾多子公司和業(yè)務(wù)場(chǎng)景的多元化金融集團(tuán)，通常選擇多種方式齊頭并進(jìn)，并在內(nèi)部形成賽馬機(jī)制；一些科技基礎(chǔ)相對(duì)薄弱的中小金融機(jī)構(gòu)，通常采用第三種方式，以控制成本。

面對(duì)龐大市場(chǎng)需求，各大廠商紛紛開發(fā)金融大模型，一些金融科技公司也憑借過往在金融領(lǐng)域的積累，發(fā)布適配各類業(yè)務(wù)場(chǎng)景的垂直類金融大模型。

市場(chǎng)火熱之下，今年國內(nèi)金融領(lǐng)域垂直大模型競(jìng)相出爐。5月，度小滿推出國內(nèi)首個(gè)開源的千億級(jí)中文金融大模型“軒轅”；8月，馬上消費(fèi)發(fā)布首個(gè)零售金融大模型“天鏡”；9月，螞蟻集團(tuán)針對(duì)金融產(chǎn)業(yè)深度定制的金融大模型AntFinGLM亮相，并在集團(tuán)內(nèi)的財(cái)富、保險(xiǎn)平臺(tái)上內(nèi)測(cè)；10月，恒生電子(600570)金融大模型LightGPT升級(jí)，在專業(yè)金融數(shù)據(jù)集、合規(guī)性要求和部署方式上實(shí)現(xiàn)突破,并宣布三款大模型應(yīng)用產(chǎn)品開放公測(cè)。

度小滿首席技術(shù)官許冬亮在近期一場(chǎng)公開活動(dòng)中感嘆：“今年以來，圍繞生成式AI的浪潮，每周都有新迭代、新發(fā)展，每天都能看到真實(shí)的效果，有點(diǎn)爆炸式發(fā)展、奇點(diǎn)臨近的感覺�！�

如雨后春筍般出現(xiàn)的金融大模型，也給金融機(jī)構(gòu)造成了選型困難。金融業(yè)需要什么樣的大模型？今年9月，由中國信通院牽頭，聯(lián)合騰訊云、科大訊飛(002230)、恒生電子、馬上消費(fèi)等40多家企業(yè)共同編制了國內(nèi)首個(gè)金融行業(yè)大模型標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)涵蓋了金融大模型的關(guān)鍵能力要求，包括場(chǎng)景適配度、能力支持度和應(yīng)用成熟度三大方面。此外，標(biāo)準(zhǔn)還從金融行業(yè)特性出發(fā)，覆蓋了投資研究、投資顧問、風(fēng)險(xiǎn)管理、市場(chǎng)營銷、客戶服務(wù)等多個(gè)應(yīng)用場(chǎng)景，并詳細(xì)規(guī)定了金融大模型在數(shù)據(jù)合規(guī)性、可追溯性、私有化部署、風(fēng)險(xiǎn)控制等方面的要求。

“值得重做一遍

金融服務(wù)鏈”

和傳統(tǒng)人工智能相比，大模型能為金融行業(yè)帶來什么增量?jī)r(jià)值？

如果說傳統(tǒng)人工智能是專用的、煙囪式的、孤立的，在大語言模型時(shí)代，人工智能已經(jīng)可以借助專業(yè)知識(shí)和推理能力，在特定領(lǐng)域完整地執(zhí)行一段任務(wù)。

不久前，一批數(shù)字員工被引入太保集團(tuán)審計(jì)中心，在審計(jì)檢查、公文質(zhì)檢、咨詢問答等工作環(huán)境下進(jìn)行能力試點(diǎn)，這些數(shù)字員工與真實(shí)員工進(jìn)行人機(jī)編隊(duì)，共同作業(yè)。太保數(shù)智研究院院長(zhǎng)王磊日前表示，大模型會(huì)帶來新的范式革命，和傳統(tǒng)人工智能的巨大區(qū)別體現(xiàn)在思考模式、行動(dòng)力、通用性和邊際成本等方面。“大模型出現(xiàn)后，實(shí)現(xiàn)了對(duì)人、對(duì)崗位建模的可能性�！�

在消費(fèi)金融領(lǐng)域，大模型能力也在顯露頭角。今年8月，馬上消費(fèi)發(fā)布“天鏡”大模型時(shí)披露，經(jīng)過近3個(gè)月的使用，新的智能客服對(duì)客戶意圖理解準(zhǔn)確率達(dá)到91%，相較于傳統(tǒng)人工智能的68%有明顯提升；客戶參與率61%，高于傳統(tǒng)模型43%的參與率，也高于人工座席平均28%的水平。

在近期舉辦的保險(xiǎn)行業(yè)大模型研討會(huì)上，陽光保險(xiǎn)集團(tuán)科技中心副總經(jīng)理顧青山詳解了“陽光正言”大模型開放平臺(tái)。據(jù)介紹，該模型在“夢(mèng)客全線上銷售機(jī)器人”項(xiàng)目中，信息抽取任務(wù)準(zhǔn)確率提升了15%，意圖識(shí)別和智能問答準(zhǔn)確率也均有明顯提升。

螞蟻集團(tuán)副總裁、螞蟻金融大模型負(fù)責(zé)人王曉航日前在金融街(000402)論壇上說，“金融服務(wù)鏈上的每一個(gè)關(guān)鍵環(huán)節(jié)，都值得用大模型重做一次”。

比如，將大模型與客戶洞察結(jié)合，提升交互式理財(cái)?shù)捏w驗(yàn)；讓大模型賦能專家理財(cái)和保險(xiǎn)顧問團(tuán)隊(duì)，幫助提升專業(yè)度；在數(shù)字化營銷方面，大模型能更好地理解客戶的金融需求、匹配供給，還能協(xié)助生成營銷創(chuàng)意，提升廣告投放的效率。

在金融中后臺(tái)，大模型也可以打開效率空間。比如，大模型在金融研判、量化編碼等方面，可以大量替代初級(jí)至中級(jí)難度的工作，將投研分析師、風(fēng)險(xiǎn)策略人員、精算師從事務(wù)性勞動(dòng)中解放出來。

“我們看到了創(chuàng)新應(yīng)用場(chǎng)景的爆發(fā)和涌現(xiàn)�！蓖鯐院秸f。

落地可靠性“闖關(guān)”

理想很豐滿，現(xiàn)實(shí)很骨感。大模型時(shí)代，看似一切都能重構(gòu)，但當(dāng)金融機(jī)構(gòu)將大模型部署到公司內(nèi)部的時(shí)候，往往發(fā)現(xiàn)挑戰(zhàn)不小。

“大模型好比一個(gè)優(yōu)秀的文科生，推理、理解、語言能力強(qiáng)大，但在金融投資領(lǐng)域，進(jìn)行風(fēng)險(xiǎn)定價(jià)、運(yùn)籌優(yōu)化、量化分析等更多是理科生的工作，大模型無法勝任。做嚴(yán)謹(jǐn)?shù)臎Q策并不是大模型的專長(zhǎng)�！蓖鯐院秸f，“金融業(yè)對(duì)可靠性極致的要求，與大模型‘生性浪漫’的幻覺，存在著嚴(yán)重沖突�！�

可靠性是大模型在金融領(lǐng)域落地最大的鴻溝。通用大模型對(duì)金融領(lǐng)域知識(shí)的欠缺，在嚴(yán)謹(jǐn)性上有明顯的短板，使其不可能“開箱即可用”，還需要經(jīng)歷復(fù)雜的工程以完成適配。

為了將大模型更好地“縫合”到業(yè)務(wù)場(chǎng)景中，提升可靠性、安全性和流暢度，各大廠商的主流方案有三種。一是將大模型與專業(yè)領(lǐng)域的小模型結(jié)合，大模型負(fù)責(zé)認(rèn)知、理解、溝通、創(chuàng)作，小模型負(fù)責(zé)把握風(fēng)險(xiǎn)、承載嚴(yán)謹(jǐn)?shù)倪壿�；二是將大模型的參�?shù)知識(shí)與結(jié)構(gòu)化、顯性化、可靠的金融知識(shí)圖譜相結(jié)合，此舉能很好地為大模型注入可靠性；三是將開放QA（問答）和封閉QA結(jié)合，讓大模型得到請(qǐng)求指令后，在專業(yè)知識(shí)領(lǐng)域內(nèi)進(jìn)行檢索，大幅提高準(zhǔn)確性。

例如，度小滿發(fā)布的軒轅大模型，在通用大模型基礎(chǔ)上增加了大量的金融領(lǐng)域?qū)I(yè)知識(shí)，從預(yù)訓(xùn)練開始調(diào)整模型，在國內(nèi)銀行從業(yè)資格考試的答題表現(xiàn)中明顯好于通用大模型。

數(shù)據(jù)訓(xùn)練攔路虎

無論是傳統(tǒng)人工智能時(shí)代，還是大模型時(shí)代，數(shù)據(jù)都是基礎(chǔ)。在大模型領(lǐng)域流行一句話：“garbage in，garbage out”，即輸入垃圾數(shù)據(jù)會(huì)導(dǎo)致輸出垃圾結(jié)果，可見對(duì)大模型進(jìn)行預(yù)訓(xùn)練，數(shù)據(jù)是重中之重。

據(jù)王曉航估計(jì)，全市場(chǎng)上有質(zhì)量的金融語料，大概不到2000億tokens，但滿足“高質(zhì)量、大規(guī)模、價(jià)值觀正確”條件的語料占比不到40%。在王曉航看來，語料質(zhì)量的重要性要高于數(shù)量。

“我們公司在大資管領(lǐng)域做了20多年的數(shù)據(jù)標(biāo)準(zhǔn)化，但是在大模型面前，仍感到過去的工作非常初級(jí)——各家機(jī)構(gòu)對(duì)于數(shù)據(jù)的標(biāo)準(zhǔn)都有自己的定義。”一位金融IT服務(wù)商高管道出了金融機(jī)構(gòu)存儲(chǔ)數(shù)據(jù)的現(xiàn)狀：標(biāo)準(zhǔn)不統(tǒng)一，非結(jié)構(gòu)化數(shù)據(jù)多，數(shù)據(jù)治理工作繁重。

華為盤古金融大模型人士表示，當(dāng)前金融機(jī)構(gòu)最重要的任務(wù)之一，是如何將散落在業(yè)務(wù)場(chǎng)景里非結(jié)構(gòu)化的數(shù)據(jù)集和企業(yè)原有的高質(zhì)量數(shù)據(jù)集相整合。

數(shù)據(jù)作為金融機(jī)構(gòu)最重要的資產(chǎn)，流通性差是其特點(diǎn)之一。目前，各家金融機(jī)構(gòu)引入的大模型都是私有化部署，各自訓(xùn)練，以最大程度保障數(shù)據(jù)安全、隱私和合規(guī)要求，但也造成算力的浪費(fèi)、數(shù)據(jù)庫重復(fù)建設(shè)和成本居高不下等問題。

北京本應(yīng)科技總經(jīng)理曹凱認(rèn)為，當(dāng)前金融大模型仍然是“小學(xué)生水平”，難以輔助對(duì)投資趨勢(shì)進(jìn)行洞察，原因包括，模型的數(shù)據(jù)參數(shù)量不夠大，對(duì)產(chǎn)業(yè)、社保、工商等多元異構(gòu)數(shù)據(jù)的積累不夠多，且數(shù)據(jù)間的關(guān)聯(lián)性較弱，無法達(dá)到大模型“涌現(xiàn)”的效果。

談?wù)撔Ч性?/p>

一位大型保險(xiǎn)集團(tuán)科技部門人士把大模型的部署過程比作“賣家秀”變“買家秀”的過程。

他透露，公司推進(jìn)大模型過程中遭遇到了各種問題，包括但不限于訓(xùn)練數(shù)據(jù)問題、算力不足問題、成本收益平衡問題、數(shù)據(jù)風(fēng)險(xiǎn)問題等等。

他忠告，在大模型應(yīng)用場(chǎng)景選擇上，應(yīng)先內(nèi)后外，先易后難；要有兜底機(jī)制，不能只談智能、沒有人工，短期內(nèi)還有深化傳統(tǒng)模型的需求�！按竽Ｐ彤a(chǎn)生的虹吸效應(yīng)，把許多IT資源都吸過去了，這對(duì)于多元化科技生態(tài)來講，不見得是好事�！�

王磊也表示，該集團(tuán)的“數(shù)字員工”項(xiàng)目要真正落地，仍是一件十分有挑戰(zhàn)性的工作。比如，要有強(qiáng)大的算力基礎(chǔ)、底座大模型平臺(tái)來支撐它運(yùn)作；要輸入崗位所需的專業(yè)知識(shí)和數(shù)據(jù)，構(gòu)建數(shù)字工作環(huán)境；除此之外，項(xiàng)目真正落地時(shí)還會(huì)碰到新的問題。

受現(xiàn)實(shí)條件的限制，金融大模型的落地應(yīng)用程度并非想象中那么高，談?wù)撔Ч鼮闀r(shí)尚早。恒生電子面向金融機(jī)構(gòu)進(jìn)行的大模型應(yīng)用狀況調(diào)研顯示，71%的受訪者所在的機(jī)構(gòu)正在調(diào)研大模型，17%的機(jī)構(gòu)已經(jīng)在測(cè)試中，真正落地實(shí)踐的機(jī)構(gòu)不到10%。

共建生態(tài)

“光靠自己不行”

打通大模型在金融業(yè)落地的最后一公里并非易事。在記者的采訪中，無論是大模型服務(wù)商、金融機(jī)構(gòu)，還是各類金融科技公司，在交流中均多次提到“生態(tài)共建”，其內(nèi)涵包括“共創(chuàng)、共建、共治”，如同共赴一場(chǎng)“開卷考試”。

不久前，眾安保險(xiǎn)發(fā)布了保險(xiǎn)行業(yè)首份AIGC應(yīng)用圖譜，協(xié)助保險(xiǎn)機(jī)構(gòu)在大模型內(nèi)嵌入行業(yè)專業(yè)領(lǐng)域知識(shí)庫，實(shí)現(xiàn)AIGC在保險(xiǎn)垂直領(lǐng)域的應(yīng)用快速適配。

日前舉辦的金融科技數(shù)智大會(huì)上，陽光保險(xiǎn)同時(shí)組織召開了“保險(xiǎn)科技數(shù)智創(chuàng)新聯(lián)合體”籌備閉門會(huì)議。據(jù)悉，該聯(lián)合體旨在推動(dòng)保險(xiǎn)垂類大模型的深入研發(fā)和應(yīng)用，提升保險(xiǎn)業(yè)整體智能化水平。

面對(duì)大模型落地的挑戰(zhàn)和技術(shù)難度，太保集團(tuán)也認(rèn)為“光靠自己是不行的”。據(jù)悉，太保和行業(yè)聯(lián)合建立實(shí)驗(yàn)室，希望實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)，行業(yè)共享，風(fēng)險(xiǎn)共擔(dān)。今年進(jìn)博會(huì)上，太保和華為、科大訊飛成立了實(shí)驗(yàn)室，希望三方聯(lián)合起來面對(duì)一些挑戰(zhàn)。

推動(dòng)大模型在金融領(lǐng)域發(fā)揮更大的價(jià)值，各界都在努力。日前，上海人工智能研究院院長(zhǎng)宋海濤對(duì)記者表示，該機(jī)構(gòu)正在推動(dòng)設(shè)立工業(yè)及制造業(yè)、金融等領(lǐng)域的專業(yè)語料庫，以減少資源的浪費(fèi)。

深圳天使投資引導(dǎo)基金副總經(jīng)理徐向東認(rèn)為，當(dāng)前金融行業(yè)存在數(shù)字化程度不足、金融數(shù)據(jù)流動(dòng)性不足、數(shù)據(jù)字典不統(tǒng)一等問題，制約了大模型的使用。他呼吁，應(yīng)盡快培育數(shù)據(jù)要素市場(chǎng)，加強(qiáng)金融數(shù)據(jù)標(biāo)準(zhǔn)化，增強(qiáng)數(shù)據(jù)可信、可用、可流通、可追溯水平，為大模型更好地在金融行業(yè)落地創(chuàng)造條件。

（責(zé)任編輯：王治強(qiáng) HF013）

看全文

寫評(píng)論已有條評(píng)論跟帖用戶自律公約

提交還可輸入500字

機(jī)構(gòu)爭(zhēng)分奪秒搶灘金融大模型落地為時(shí)尚早

最新評(píng)論

相關(guān)推薦

熱門閱讀

和訊特稿

機(jī)構(gòu)爭(zhēng)分奪秒搶灘 金融大模型落地為時(shí)尚早

最新評(píng)論

相關(guān)推薦

熱門閱讀

和訊特稿

推薦閱讀

機(jī)構(gòu)爭(zhēng)分奪秒搶灘金融大模型落地為時(shí)尚早