隨著人工智能技術的快速發展,金融行業正在迎來前所未有的智能化變革。
近日,2025金融科技大會“新型數字基礎設施”在蘇州舉辦。會上,百度智能云金融業務部總經理徐旭圍繞金融行業的大模型基礎設施建設,分享了百度智能云在過去幾年深度參與金融機構智能轉型的經驗與觀察。他指出:大模型已進入金融機構的高強度、真實業務負載階段,AI云全棧能力正成為金融行業邁入智能化躍遷期的關鍵引擎。
徐旭表示,目前國內已有金融機構在內部大模型服務上日調用量突破百億Tokens,逼近互聯網級別的供給強度。這意味著大模型在銀行、保險、證券等金融場景中的應用已從試點階段全面進入規模化落地階段。
與此同時,全球范圍內的大模型仍在沿著ScalingLaw快速擴展至萬億量級。盡管PD分離、MoE架構等工程優化不斷降低單Tokens成本,但超大規模模型依舊對金融行業的計算基礎設施提出了前所未有的壓力,形成“模型規模、算力成本、吞吐性能”難以同時最優的“三難困境”。
更重要的是,大模型的應用場景也在發生明顯遷移:從內部輔助工具,快速向客戶經理助手、客服助手、財富管理助手等前臺、面客類業務延伸。這些場景要求更高并發、更低時延,使得金融行業必須重新思考如何構建可持續、可擴展的智能底座。
徐旭指出,金融機構不僅需要使用通用基礎模型,也迫切需要圍繞信用風控、交易監測、客戶服務、合規審查等垂直場景構建“專精模型”。隨著強化學習數據飛輪啟動,模型訓練已經從過去的“周級、天級”,加速進入“天級、小時級”的頻繁迭代。
同時,為滿足自主可控的要求,金融機構在底層算力層面臨異構化挑戰,這進一步加劇了智能基礎設施的復雜度。在這一背景下,金融機構面臨的核心命題可總結為四點:高效的算力供給、穩定的服務、靈活的共享調度、可持續的經濟性。
徐旭強調,要破解這一復雜命題,關鍵在于跳出單一組件的思維,以“選用管”的系統化理念來重構智能基礎設施。
百度智能云的獨特優勢在于其覆蓋算力、模型到應用的AI云全棧能力,能夠提供軟硬一體、價值驅動的優化方案。在“選”與“用”的層面,百度智能云倡導以場景驅動,實現算力價值最大化。通過其自研的昆侖芯和百舸AI計算平臺,為金融機構提供了高經濟性和高適配性的算力底座。
昆侖芯P800不僅性能卓越,更易于部署。據項目實測,其僅需不到200卡規模的服務器集群即可完成千億參數模型的全參數訓練,可快速提升多模態數據分析、智能客服、代碼助手等場景的應用效能,部分多模態模型推理性能達到行業領先水平。某股份制銀行的案例顯示,通過昆侖芯的集群部署,以不到百卡芯片的規模,高效支撐了熱點流量窗口下日均百億Tokens的大模型服務。
在“管”的層面,百度智能云推出了百舸AI計算平臺,構建了“都江堰”式的算力治理體系。面對昂貴且異構的算力資源,“百舸”平臺實現了對底層智算云底座和昆侖芯的深度感知與統一抽象。它不僅能確保任務調度的高效匹配,更將保障金融業務的穩定可靠放在首位,通過故障的快速診斷、自愈和自動化隔離機制,確保了單一訓練任務99.5%的高可用率。
更重要的是,百舸具備強大的異構資源池化和潮汐調度能力,能夠統一管理和分配不同型號、不同地理位置的算力資源,通過資源超發和高優先級任務搶占,打破了算力孤島,最大化了算力資源的共享和利用率。
徐旭表示,未來,百度智能云將持續以AI云全棧的整體優勢,深度參與金融機構的智能時代基礎設施建設,提供穩定、高效、經濟的“核心引擎”,助力金融機構在服務實體經濟、寫好“五篇大文章”的進程中,搶占新一輪競爭的制高點。


