以大模型為核心的人工智能(AI)技術是引領新一輪科技革命和產業變革的重要驅動力,它正廣泛改變著人們的生產和生活。AI不再停留于理論探索階段,而是迅速滲透至千行百業,從醫療健康、教育培訓到金融服務、交通運輸以及智能制造,AI應用的觸角不斷延伸,大模型的落地路徑逐漸清晰,落地場景逐漸明朗。未來,能否準確捕捉市場需求,落地大模型等AI技術的應用,將成為決定企業競爭力乃至國家發展的關鍵。這不僅需要我們持續推動底層技術突破,還需要從實踐層面進一步加強工程化能力,從而加速產品化和落地進程。
一、大模型代表了人工智能發展新范式
大模型具有規模可擴展性。在大語言模型領域,規模可擴展性表現尤為突出。DeepMind在2020年發布的一項研究報告率先揭示了增加數據量、提升算力和擴大模型參數規模能夠有效促進模型性能的持續優化。隨后,OpenAI在GPT系列的發展中也驗證了這一規律,通過不斷投入更多資源,實現了模型性能的顯著提升。迄今為止,大語言模型尚未遭遇規模擴展的瓶頸,且視覺模型也具有相似特性,Scaling Law仍然有效。這一現象成為全球對通用人工智能(AGI)即將到來持樂觀態度的重要依據。
大模型具備多任務適應性。相比于傳統AI模型只能完成一種任務,一個大模型能夠涵蓋廣泛的能力范疇,對下游任務具有極高的適應性和靈活性。由于所有物理信號均可編碼至同一高維向量空間,使得大模型具有多模態/跨模態理解和生成能力,增強了大模型對多任務的適應性,進一步強化了業界對于構建平臺化人工智能系統的共識。傳統上,人工智能應用往往孤立存在,企業內部同時維護成百上千個模型,難以形成協同效應和規模經濟。而今,隨著大模型多任務適應性的成熟,使人工智能規模化部署成為可能。
大模型表現出復雜推理能力。一方面,大模型能夠獨立進行高階復雜推理任務;另一方面,還可通過提供詳細的逐步指導,即構建思維鏈的方式,使模型展現出更高級別的邏輯推理能力。微軟曾發布一項研究報告顯示,在未對模型進行微調的前提下,僅通過相應的提示策略,GPT-4便化身醫學專家。由此表明,通過優化輸入內容的詳細程度,配置提示詞策略,可極大提升模型的性能表現,凸顯了大模型強大的推理能力及其極高的可塑性。
大模型具有強大知識吸收與整合能力。一方面,大模型具有強大的記憶力,能夠高效地吸收并保存廣泛的知識;另一方面,業界正積極探索將大模型與知識圖譜和向量數據庫技術的深度融合,提升其推理準確性。知識圖譜通過實體、屬性和關系的明確表述,為模型提供了一個邏輯嚴密的知識框架,有助于模型理解和推理復雜的信息關聯。向量數據庫將數據以高維空間中的向量表示,增強了模型對語境和概念相似性的理解,優化信息檢索與應用的效率。
二、大模型發展路徑逐漸清晰,部分領域應用效果顯著
大模型發展路徑呈現“一橫一縱”格局。橫向發展路徑是指大模型以通用人工智能為目標,從通用大模型出發向參數量更龐大、模型能力更強、效果更通用的方向發展,需要持續迭代優化。此路徑聚焦于構建能夠跨越多個領域、執行多樣任務的超大規模模型,主要思路是通過單一模型實現所有功能,是通往AGI的理想主義道路。縱向發展路徑是指利用大模型構筑智能基座,結合模型微調形成豐富的行業大模型,從而賦能更多行業與場景。此路徑降低了特定領域模型應用的門檻,加速技術成果轉化,是促進模型技術實際應用的現實主義道路。上述發展路徑并無優劣之分,我們需因地制宜地看待,兩者均需給予充分重視。
大模型行業落地場景豐富。面對特殊的復雜業務場景,企業需準備大規模預訓練數據集,從零開始構建大模型,此方法會消耗高額計算資源,僅適用于少量用戶。目前,大部分模型均非從零開始訓練,而是通過微調等方式得到,如監督式微調(SFT)、指令微調(IFT)、RAG、AI Agent等,企業可依據項目要求和可用資源,合理選擇策略。大模型在行業內落地場景豐富多樣,如金融行業,主要應用于營銷、客服、風控等場景,有效解決金融領域人力成本高、風險管控滯后等問題,某銀行基于AI的智能風控可實現毫秒級別的快速風控,將風險防控準確率提升約2倍;電信行業,主要應用于客戶服務、營銷推廣、網絡運維、故障預測等場景,有效解決電信領域用戶需求復雜、網絡優化難度高等問題,某運營商打造基于網絡大模型的網絡運維AI助手,使得網絡運維準確率達88%以上;政務行業,主要應用于市民咨詢、輿情分析等場景,有效解決基層工作強度大、響應速度慢、數據孤島等問題,某單位利用大模型提升政務工作效率,在接訴即辦場景中派單準確率達到87%以上。
大模型在部分領域展現出良好應用效果。各行業期望采納大模型技術推動業務變革,從而達到降本增效及業務重塑的目標。目前大模型在三大剛需場景展現出良好使用效果。一是內容生成場景,大模型推動生成創作能力的階躍,為文案、營銷和辦公領域注入智能化動力,重塑內容生產流程;二是知識管理場景,大模型將企業內不同系統的知識資源進行有效沉淀、管理和運用,如員工培訓系統、客服支持系統以及信息檢索系統等,提升知識構建及應用效率;三是軟件工程場景,大模型在開發、測試、運維等環節的應用,通過代碼生成、測試用力生成、運維助手等能力,可顯著提高軟件研發質效。
三、四方面抓手加速大模型工程化落地
盡管大模型展示了巨大的潛力和廣泛的應用前景,但在工程化過程中仍面臨諸多挑戰,需要從模型服務化、模型研運管理、數據治理及風險管控等方面共同提升落地能力。
構建和落地MaaS體系,推動模型服務以云的方式靈活供給。企業引入大模型首先面臨的挑戰是工具鏈不完整、模型建設成本高等問題,需要自行填補諸多空缺而增大了應用復雜度。為此,企業迫切需求一個綜合且高效的工具鏈平臺,或者靈活可調用的高效率高性能的模型服務。模型即服務(Model as a Service,MaaS)通過將AI模型及其相關能力打包成可重復使用的服務,使企業能夠快速高效地構建、部署、監控、調用模型,無須開發和維護底層基礎能力,大大降低AI模型應用的復雜度。
建立運營管理體系,提升模型能力的穩定性及模型管理的可靠性。軟件工程領域,DevOps通過整合開發與運維流程,確保了軟件產品的高效迭代與穩定運行。隨著AI技術的蓬勃發展,特別是大模型時代的到來,AI 領域也亟須一套聯結開發團隊、算法團隊、部署團隊、運營團隊和風險管理等團隊,共同建立研發、部署和運維各環節的標準化模型運營管理體系(MLOps),以提高整體運營效率,提升管理能力和模型能力。大模型時代的MLOps研運范圍進一步擴充,從對機器學習模型的管理,擴充至大模型、模型服務、模型應用、模型組件等對象的研發和運營管理,為大模型規模化落地提供管理層面的保障。
提升數據治理水平,強化模型構建和優化質量。大模型等AI的應用過程中,激活并有效利用私域數據成為不可或缺的一環。然而,現狀表明我國多數企業的數據治理水平尚處于較低階段,導致行業間在數據應用能力上的顯著差異。據統計,全國范圍內的四十萬家企業,僅有兩千家完成了數據管理能力成熟度的評估,意味著在為AI應用構建數據基礎方面,整體準備度是不足的。因此,伴隨AI技術的全棧部署和模型微調等實踐,通過構建面向AI的數據治理體系,可提高模型訓練和微調質量,提升模型推理能力。
構建風險管控機制,助力模型可信能力提升。推動AI應用,尤其是大模型應用的進程中固然伴隨風險因素,積極面對并妥善管理風險,是推動AI技術穩健前行的關鍵。通過構建風險度量體系、風險管控流程、風險規劃、風險監測和應對處理機制,方能全面管控AI風險,提升模型可信能力,從而為AI賦能千行百業做好充分準備。
以大模型為核心的人工智能技術已成為我國發展新型工業化過程中的關鍵技術變量,AI模型的集成應用與新型工業化發展的需求高度契合,為產業升級轉型提供了強大動能,為全面實現中國式現代化藍圖具有根本性的戰略意義。未來,通過技術能力的持續突破,AI落地場景的持續探索,大模型應用將成為構筑核心競爭優勢的關鍵。
作者簡介
魏凱,中國信息通信研究院人工智能研究所所長,正高級工程師,兼任中國人工智能產業聯盟總體組組長、國際電信聯盟SG16國內對口組組長。研究方向為人工智能技術,牽頭完成多項國內國際標準,參與多項國家重大政策文件的研究起草。
秦思思,中國信息通信研究院人工智能研究所高級工程師,主要研究方向為大模型工程化、智能化軟件工程、MLOps、MaaS等,牽頭系列標準的編制、評測、咨詢等工作。擔任AIIA智能化軟件工程(AI4SE)工作組組長、人工智能關鍵技術與應用評測工信部重點實驗室的人工智能研發運營組組長。