如何用好數(shù)據(jù)——金融機構(gòu)在移動互聯(lián)網(wǎng)時代就存在的難題,在AI時代同樣存在
▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼
文 | 周公子
編| 周星星
近期,一份來自銀行的千億級別大模型采購結(jié)果公布,引發(fā)不少科技公司關注。與此同時,也有不少銀行密集發(fā)布了“大模型”相關的需求調(diào)研、項目采購信息,有部分中標信息已經(jīng)公示。小周整理了部分公開的招投標文件發(fā)現(xiàn),目前已有明確“落地”需求的多為大型商業(yè)銀行,并且需求多與模型訓練、語言模型、數(shù)據(jù)處理相關。
一方面,這些公告固然是金融大模型正式“走出紙面規(guī)劃”,開始落地到行業(yè)應用的信號;
另一方面,綜合公告的情況亦可窺見,目前金融行業(yè)大模型談“效果”依然為時尚早,這些需求后面真正的“難題”被看見,也許只是開始。
這種現(xiàn)狀,或許恰好印證了此前恒生電子(600570)對數(shù)百家金融機構(gòu)的走訪調(diào)研結(jié)果:AI大模型在金融領域的應用只有8%在立項階段,17%在測試階段,超過70%的金融機構(gòu)還處于調(diào)研階段,在實際落地應用過程中的是極少數(shù)。
Part 1
多家銀行公布大模型招投標項目
除了大家熟知的“大廠”們,銀行供應商“預選”之列也讓業(yè)內(nèi)看到,“外腦”還有更豐富的選擇。
今年10月,招商銀行(600036)披露了“招商銀行預訓練基礎大語言模型(千億級)采購項目”結(jié)果,中選供應商為“上海稀宇科技有限公司”。
據(jù)悉,這家中標招行大模型項目的上海公司,也就是MiniMax,國內(nèi)最早入場大模型創(chuàng)業(yè)的公司之一,創(chuàng)始團隊出身中科院系,創(chuàng)始人是前商湯科技副總裁、通用智能技術負責人閆俊杰。MiniMax成立于2021年,比剛殺入AI大模型市場的另一家明星公司百川智能,還要早成立2年。今年,MiniMax還拿到了來自騰訊的2.5億美元投資。而和MiniMax一起參與招行招標的還有清華大學系的智譜AI和all in大模型的百度。
招商銀行之外,工商銀行、建設銀行、郵儲銀行、華夏銀行(600015)等也在最近公布了他們在大模型方面的招投標項目或結(jié)果。
其中,華夏銀行的招標項目也與大語言模型應用相關,具體項目名稱為“華夏銀行大語言模型應用(智能算例部分)”,主要為系統(tǒng)硬件設備采購。
此外,中信銀行(601998)信用卡也于今年11月7日發(fā)布了“中信銀行信用卡中心大模型訓練GPU服務器需求調(diào)研公告”,雖只是前期項目需求調(diào)研,不作為入圍或招標入選依據(jù),但亦可窺見其對大模型相關服務的潛在需求。
據(jù)現(xiàn)有公開資料不完全統(tǒng)計,目前銀行大模型相關招標項目并不多,且集中于大中銀行。
來源:周觀新金融根據(jù)銀行官網(wǎng)公開資料整理
可見,落到實際應用當中,不少銀行依然考慮引入“外腦”,借助科技公司的力量完善自身大模型建設和應用。
Part 2
銀行現(xiàn)階段重點需求較為集中
而結(jié)合招投標、業(yè)界討論及財報等公開資料來看,銀行等金融機構(gòu)關注的大模型落地應用需求較為集中。目前,業(yè)內(nèi)的共識性關注的,可降本提效,亦可廣泛應用場景的場景主要包括客戶服務、智能研投、風險控制、欺詐檢測、運營管理等。
從各家銀行更為詳細的半年報亦可窺見,大模型和人工智能被給予厚望,場景也離不開上述幾種。
例如,招商銀行的半年報就提到,要提升大模型的建設能力,打造面向智能化時代的應用平臺:
加快新技術應用推廣,提升GPT類自然語言處理大模型的建設能力,并重點發(fā)掘其在全流程財富管理中的應用,投產(chǎn)FinGPT創(chuàng)意中心,加快大模型應用模式探索。推進智慧財富引擎、智慧營銷引擎、智慧運營引擎、智慧風控引擎、智慧客服引擎五大引擎建設,打造智能化時代的智慧應用平臺。
招商銀行之外,平安、興業(yè)、農(nóng)行、交行、工商銀行等,無一不在半年報中提到了大模型的戰(zhàn)略展望,以及零星的布局進展。
例如,工商銀行提到,“完成人工智能AI大模型能力建設應用規(guī)劃,在國內(nèi)同業(yè)率先實現(xiàn)百億級基礎大模型在知識運營市場、金融市場投研助手等多個場景應用!
比如智能客服,只能機械回復“設定指令”的情況依然比較普遍,對進一步靈魂響應客戶訴求、服務響應等,依然遠遠不夠。用消費者視角來概況就是,目前多數(shù)銀行的智能客服,從“人工智障”真正進化到“人工智能”,依然有比較大的進步空間。
而基于大模型的智能客服,普遍被認為有更好的語音、語義理解能力,甚至是圖文生成能力,是提升多種自動化服務客戶體驗感的關鍵。
Part 3
核心難點:用好數(shù)據(jù)
技術之外,安全和數(shù)據(jù)才是短時間內(nèi)金融大模型落地最難邁過去的坎。
由于對安全、合規(guī)要求較高的特殊性,金融機構(gòu)通常不會在第三方基礎大模型上構(gòu)建專業(yè)大模型,而是采用數(shù)據(jù)私有化、模型私有化、本地私有云方式構(gòu)建大模型。
最直觀的對比是,ChatGPT是開放環(huán)境里用開放數(shù)據(jù),除技術之外也坐擁大量公開數(shù)據(jù),雙管齊下才能“大力出奇跡”,快速搭建護城河。而金融機構(gòu)是在自己家的安全保密環(huán)境里用自家數(shù)據(jù)訓練自家的AI大模型,這種方式雖然安全,但問題是成本高、技術門檻高,不是誰都有錢有實力能干。
換句話說,金融大模型落地到應用時,出于安全性、行業(yè)競爭性等因素考慮,其可用數(shù)據(jù)更多來源于自身,如何用好“窄而垂直”的數(shù)據(jù)會是一大挑戰(zhàn)。
一個正面例子是彭博的Bloom?bergGPT,同樣是金融賽道的選手,它突圍的關鍵因素之一,就是用好數(shù)據(jù)。
2023年3月底,彭博發(fā)布了500億參數(shù)、基于開源大模型Bloom研發(fā)的金融大語言模型Bloom?bergGPT,這是全球首個金融大模型,隨后也引發(fā)了全球市場對金融垂直領域大模型的關注。
在Bloom大模型的基礎上,Bloom?bergGPT在其積累超過多年的金融行業(yè)專有數(shù)據(jù)基礎上再進行精調(diào)訓練——3630億Tokens金融數(shù)據(jù)集、3450億Tokens公共數(shù)據(jù)集上進行了訓練。
正是因為有這樣的高質(zhì)量的行業(yè)專屬數(shù)據(jù)集和數(shù)據(jù)基礎,在金融領域自然語言處理(NLP)任務上,Bloom?bergGPT的表現(xiàn)明顯優(yōu)于其他類似規(guī)模的開放模型,在一般NLP基準上的表現(xiàn)也達到甚至超過同行的平均水平。
正因為如此,上半年業(yè)界普遍認為 “大模型+垂直行業(yè)數(shù)據(jù)”模式預會成為 AI 落 地 垂 直 行 業(yè) 的 典 型 范 式。而進入下半年之后,行業(yè)大模型的演進路線也確實是如此。
彭博的金融大模型基于BLOOM的開源模型結(jié)合金融專業(yè)數(shù)據(jù)進行精調(diào)訓練
“我們要解決數(shù)據(jù)的問題! 劉曙峰在談及金融大模型應用時也特別提及,要解決現(xiàn)有的數(shù)據(jù)、私有的數(shù)據(jù)、公有的數(shù)據(jù),以及數(shù)據(jù)如何不斷的產(chǎn)生、獲取和形成數(shù)據(jù)飛輪的閉環(huán)。
所以,金融大模型應用,核心難點遠不僅是技術能力問題。
數(shù)據(jù)非常關鍵,更關鍵的是,如何“合規(guī)”、“安全”地用好數(shù)據(jù)。
相比制造、交通等行業(yè),金融領域的數(shù)字化更早、更深,數(shù)據(jù)本來應該是優(yōu)勢所在,但由于監(jiān)管、安全等緣故,數(shù)據(jù)的價值挖掘并沒有被充分利用——金融機構(gòu)曾經(jīng)在移動互聯(lián)網(wǎng)時代就存在過的問題,如今面對來勢洶洶的AI時代,亦同樣存在。
未來,金融大模型的應用能否沖破這個局限,且拭目以待。
—THE END—
原創(chuàng)文章,未經(jīng)授權,請勿轉(zhuǎn)載。
投資有風險,入市須謹慎,以上觀點分享不構(gòu)成投資建議。
本文首發(fā)于微信公眾號:周觀新金融。文章內(nèi)容屬作者個人觀點,不代表和訊網(wǎng)立場。投資者據(jù)此操作,風險請自擔。
最新評論