以大模型為核心的人工智能(AI)技術(shù)是引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力,它正廣泛改變著人們的生產(chǎn)和生活。AI不再停留于理論探索階段,而是迅速滲透至千行百業(yè),從醫(yī)療健康、教育培訓(xùn)到金融服務(wù)、交通運(yùn)輸以及智能制造,AI應(yīng)用的觸角不斷延伸,大模型的落地路徑逐漸清晰,落地場(chǎng)景逐漸明朗。未來(lái),能否準(zhǔn)確捕捉市場(chǎng)需求,落地大模型等AI技術(shù)的應(yīng)用,將成為決定企業(yè)競(jìng)爭(zhēng)力乃至國(guó)家發(fā)展的關(guān)鍵。這不僅需要我們持續(xù)推動(dòng)底層技術(shù)突破,還需要從實(shí)踐層面進(jìn)一步加強(qiáng)工程化能力,從而加速產(chǎn)品化和落地進(jìn)程。
一、大模型代表了人工智能發(fā)展新范式
大模型具有規(guī)模可擴(kuò)展性。在大語(yǔ)言模型領(lǐng)域,規(guī)模可擴(kuò)展性表現(xiàn)尤為突出。DeepMind在2020年發(fā)布的一項(xiàng)研究報(bào)告率先揭示了增加數(shù)據(jù)量、提升算力和擴(kuò)大模型參數(shù)規(guī)模能夠有效促進(jìn)模型性能的持續(xù)優(yōu)化。隨后,OpenAI在GPT系列的發(fā)展中也驗(yàn)證了這一規(guī)律,通過(guò)不斷投入更多資源,實(shí)現(xiàn)了模型性能的顯著提升。迄今為止,大語(yǔ)言模型尚未遭遇規(guī)模擴(kuò)展的瓶頸,且視覺(jué)模型也具有相似特性,Scaling Law仍然有效。這一現(xiàn)象成為全球?qū)νㄓ萌斯ぶ悄埽ˋGI)即將到來(lái)持樂(lè)觀態(tài)度的重要依據(jù)。
大模型具備多任務(wù)適應(yīng)性。相比于傳統(tǒng)AI模型只能完成一種任務(wù),一個(gè)大模型能夠涵蓋廣泛的能力范疇,對(duì)下游任務(wù)具有極高的適應(yīng)性和靈活性。由于所有物理信號(hào)均可編碼至同一高維向量空間,使得大模型具有多模態(tài)/跨模態(tài)理解和生成能力,增強(qiáng)了大模型對(duì)多任務(wù)的適應(yīng)性,進(jìn)一步強(qiáng)化了業(yè)界對(duì)于構(gòu)建平臺(tái)化人工智能系統(tǒng)的共識(shí)。傳統(tǒng)上,人工智能應(yīng)用往往孤立存在,企業(yè)內(nèi)部同時(shí)維護(hù)成百上千個(gè)模型,難以形成協(xié)同效應(yīng)和規(guī)模經(jīng)濟(jì)。而今,隨著大模型多任務(wù)適應(yīng)性的成熟,使人工智能規(guī)模化部署成為可能。
大模型表現(xiàn)出復(fù)雜推理能力。一方面,大模型能夠獨(dú)立進(jìn)行高階復(fù)雜推理任務(wù);另一方面,還可通過(guò)提供詳細(xì)的逐步指導(dǎo),即構(gòu)建思維鏈的方式,使模型展現(xiàn)出更高級(jí)別的邏輯推理能力。微軟曾發(fā)布一項(xiàng)研究報(bào)告顯示,在未對(duì)模型進(jìn)行微調(diào)的前提下,僅通過(guò)相應(yīng)的提示策略,GPT-4便化身醫(yī)學(xué)專家。由此表明,通過(guò)優(yōu)化輸入內(nèi)容的詳細(xì)程度,配置提示詞策略,可極大提升模型的性能表現(xiàn),凸顯了大模型強(qiáng)大的推理能力及其極高的可塑性。
大模型具有強(qiáng)大知識(shí)吸收與整合能力。一方面,大模型具有強(qiáng)大的記憶力,能夠高效地吸收并保存廣泛的知識(shí);另一方面,業(yè)界正積極探索將大模型與知識(shí)圖譜和向量數(shù)據(jù)庫(kù)技術(shù)的深度融合,提升其推理準(zhǔn)確性。知識(shí)圖譜通過(guò)實(shí)體、屬性和關(guān)系的明確表述,為模型提供了一個(gè)邏輯嚴(yán)密的知識(shí)框架,有助于模型理解和推理復(fù)雜的信息關(guān)聯(lián)。向量數(shù)據(jù)庫(kù)將數(shù)據(jù)以高維空間中的向量表示,增強(qiáng)了模型對(duì)語(yǔ)境和概念相似性的理解,優(yōu)化信息檢索與應(yīng)用的效率。
二、大模型發(fā)展路徑逐漸清晰,部分領(lǐng)域應(yīng)用效果顯著
大模型發(fā)展路徑呈現(xiàn)“一橫一縱”格局。橫向發(fā)展路徑是指大模型以通用人工智能為目標(biāo),從通用大模型出發(fā)向參數(shù)量更龐大、模型能力更強(qiáng)、效果更通用的方向發(fā)展,需要持續(xù)迭代優(yōu)化。此路徑聚焦于構(gòu)建能夠跨越多個(gè)領(lǐng)域、執(zhí)行多樣任務(wù)的超大規(guī)模模型,主要思路是通過(guò)單一模型實(shí)現(xiàn)所有功能,是通往AGI的理想主義道路。縱向發(fā)展路徑是指利用大模型構(gòu)筑智能基座,結(jié)合模型微調(diào)形成豐富的行業(yè)大模型,從而賦能更多行業(yè)與場(chǎng)景。此路徑降低了特定領(lǐng)域模型應(yīng)用的門(mén)檻,加速技術(shù)成果轉(zhuǎn)化,是促進(jìn)模型技術(shù)實(shí)際應(yīng)用的現(xiàn)實(shí)主義道路。上述發(fā)展路徑并無(wú)優(yōu)劣之分,我們需因地制宜地看待,兩者均需給予充分重視。
大模型行業(yè)落地場(chǎng)景豐富。面對(duì)特殊的復(fù)雜業(yè)務(wù)場(chǎng)景,企業(yè)需準(zhǔn)備大規(guī)模預(yù)訓(xùn)練數(shù)據(jù)集,從零開(kāi)始構(gòu)建大模型,此方法會(huì)消耗高額計(jì)算資源,僅適用于少量用戶。目前,大部分模型均非從零開(kāi)始訓(xùn)練,而是通過(guò)微調(diào)等方式得到,如監(jiān)督式微調(diào)(SFT)、指令微調(diào)(IFT)、RAG、AI Agent等,企業(yè)可依據(jù)項(xiàng)目要求和可用資源,合理選擇策略。大模型在行業(yè)內(nèi)落地場(chǎng)景豐富多樣,如金融行業(yè),主要應(yīng)用于營(yíng)銷、客服、風(fēng)控等場(chǎng)景,有效解決金融領(lǐng)域人力成本高、風(fēng)險(xiǎn)管控滯后等問(wèn)題,某銀行基于AI的智能風(fēng)控可實(shí)現(xiàn)毫秒級(jí)別的快速風(fēng)控,將風(fēng)險(xiǎn)防控準(zhǔn)確率提升約2倍;電信行業(yè),主要應(yīng)用于客戶服務(wù)、營(yíng)銷推廣、網(wǎng)絡(luò)運(yùn)維、故障預(yù)測(cè)等場(chǎng)景,有效解決電信領(lǐng)域用戶需求復(fù)雜、網(wǎng)絡(luò)優(yōu)化難度高等問(wèn)題,某運(yùn)營(yíng)商打造基于網(wǎng)絡(luò)大模型的網(wǎng)絡(luò)運(yùn)維AI助手,使得網(wǎng)絡(luò)運(yùn)維準(zhǔn)確率達(dá)88%以上;政務(wù)行業(yè),主要應(yīng)用于市民咨詢、輿情分析等場(chǎng)景,有效解決基層工作強(qiáng)度大、響應(yīng)速度慢、數(shù)據(jù)孤島等問(wèn)題,某單位利用大模型提升政務(wù)工作效率,在接訴即辦場(chǎng)景中派單準(zhǔn)確率達(dá)到87%以上。
大模型在部分領(lǐng)域展現(xiàn)出良好應(yīng)用效果。各行業(yè)期望采納大模型技術(shù)推動(dòng)業(yè)務(wù)變革,從而達(dá)到降本增效及業(yè)務(wù)重塑的目標(biāo)。目前大模型在三大剛需場(chǎng)景展現(xiàn)出良好使用效果。一是內(nèi)容生成場(chǎng)景,大模型推動(dòng)生成創(chuàng)作能力的階躍,為文案、營(yíng)銷和辦公領(lǐng)域注入智能化動(dòng)力,重塑內(nèi)容生產(chǎn)流程;二是知識(shí)管理場(chǎng)景,大模型將企業(yè)內(nèi)不同系統(tǒng)的知識(shí)資源進(jìn)行有效沉淀、管理和運(yùn)用,如員工培訓(xùn)系統(tǒng)、客服支持系統(tǒng)以及信息檢索系統(tǒng)等,提升知識(shí)構(gòu)建及應(yīng)用效率;三是軟件工程場(chǎng)景,大模型在開(kāi)發(fā)、測(cè)試、運(yùn)維等環(huán)節(jié)的應(yīng)用,通過(guò)代碼生成、測(cè)試用力生成、運(yùn)維助手等能力,可顯著提高軟件研發(fā)質(zhì)效。
三、四方面抓手加速大模型工程化落地
盡管大模型展示了巨大的潛力和廣泛的應(yīng)用前景,但在工程化過(guò)程中仍面臨諸多挑戰(zhàn),需要從模型服務(wù)化、模型研運(yùn)管理、數(shù)據(jù)治理及風(fēng)險(xiǎn)管控等方面共同提升落地能力。
構(gòu)建和落地MaaS體系,推動(dòng)模型服務(wù)以云的方式靈活供給。企業(yè)引入大模型首先面臨的挑戰(zhàn)是工具鏈不完整、模型建設(shè)成本高等問(wèn)題,需要自行填補(bǔ)諸多空缺而增大了應(yīng)用復(fù)雜度。為此,企業(yè)迫切需求一個(gè)綜合且高效的工具鏈平臺(tái),或者靈活可調(diào)用的高效率高性能的模型服務(wù)。模型即服務(wù)(Model as a Service,MaaS)通過(guò)將AI模型及其相關(guān)能力打包成可重復(fù)使用的服務(wù),使企業(yè)能夠快速高效地構(gòu)建、部署、監(jiān)控、調(diào)用模型,無(wú)須開(kāi)發(fā)和維護(hù)底層基礎(chǔ)能力,大大降低AI模型應(yīng)用的復(fù)雜度。
建立運(yùn)營(yíng)管理體系,提升模型能力的穩(wěn)定性及模型管理的可靠性。軟件工程領(lǐng)域,DevOps通過(guò)整合開(kāi)發(fā)與運(yùn)維流程,確保了軟件產(chǎn)品的高效迭代與穩(wěn)定運(yùn)行。隨著AI技術(shù)的蓬勃發(fā)展,特別是大模型時(shí)代的到來(lái),AI 領(lǐng)域也亟須一套聯(lián)結(jié)開(kāi)發(fā)團(tuán)隊(duì)、算法團(tuán)隊(duì)、部署團(tuán)隊(duì)、運(yùn)營(yíng)團(tuán)隊(duì)和風(fēng)險(xiǎn)管理等團(tuán)隊(duì),共同建立研發(fā)、部署和運(yùn)維各環(huán)節(jié)的標(biāo)準(zhǔn)化模型運(yùn)營(yíng)管理體系(MLOps),以提高整體運(yùn)營(yíng)效率,提升管理能力和模型能力。大模型時(shí)代的MLOps研運(yùn)范圍進(jìn)一步擴(kuò)充,從對(duì)機(jī)器學(xué)習(xí)模型的管理,擴(kuò)充至大模型、模型服務(wù)、模型應(yīng)用、模型組件等對(duì)象的研發(fā)和運(yùn)營(yíng)管理,為大模型規(guī)模化落地提供管理層面的保障。
提升數(shù)據(jù)治理水平,強(qiáng)化模型構(gòu)建和優(yōu)化質(zhì)量。大模型等AI的應(yīng)用過(guò)程中,激活并有效利用私域數(shù)據(jù)成為不可或缺的一環(huán)。然而,現(xiàn)狀表明我國(guó)多數(shù)企業(yè)的數(shù)據(jù)治理水平尚處于較低階段,導(dǎo)致行業(yè)間在數(shù)據(jù)應(yīng)用能力上的顯著差異。據(jù)統(tǒng)計(jì),全國(guó)范圍內(nèi)的四十萬(wàn)家企業(yè),僅有兩千家完成了數(shù)據(jù)管理能力成熟度的評(píng)估,意味著在為AI應(yīng)用構(gòu)建數(shù)據(jù)基礎(chǔ)方面,整體準(zhǔn)備度是不足的。因此,伴隨AI技術(shù)的全棧部署和模型微調(diào)等實(shí)踐,通過(guò)構(gòu)建面向AI的數(shù)據(jù)治理體系,可提高模型訓(xùn)練和微調(diào)質(zhì)量,提升模型推理能力。
構(gòu)建風(fēng)險(xiǎn)管控機(jī)制,助力模型可信能力提升。推動(dòng)AI應(yīng)用,尤其是大模型應(yīng)用的進(jìn)程中固然伴隨風(fēng)險(xiǎn)因素,積極面對(duì)并妥善管理風(fēng)險(xiǎn),是推動(dòng)AI技術(shù)穩(wěn)健前行的關(guān)鍵。通過(guò)構(gòu)建風(fēng)險(xiǎn)度量體系、風(fēng)險(xiǎn)管控流程、風(fēng)險(xiǎn)規(guī)劃、風(fēng)險(xiǎn)監(jiān)測(cè)和應(yīng)對(duì)處理機(jī)制,方能全面管控AI風(fēng)險(xiǎn),提升模型可信能力,從而為AI賦能千行百業(yè)做好充分準(zhǔn)備。
以大模型為核心的人工智能技術(shù)已成為我國(guó)發(fā)展新型工業(yè)化過(guò)程中的關(guān)鍵技術(shù)變量,AI模型的集成應(yīng)用與新型工業(yè)化發(fā)展的需求高度契合,為產(chǎn)業(yè)升級(jí)轉(zhuǎn)型提供了強(qiáng)大動(dòng)能,為全面實(shí)現(xiàn)中國(guó)式現(xiàn)代化藍(lán)圖具有根本性的戰(zhàn)略意義。未來(lái),通過(guò)技術(shù)能力的持續(xù)突破,AI落地場(chǎng)景的持續(xù)探索,大模型應(yīng)用將成為構(gòu)筑核心競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵。
作者簡(jiǎn)介
魏凱,中國(guó)信息通信研究院人工智能研究所所長(zhǎng),正高級(jí)工程師,兼任中國(guó)人工智能產(chǎn)業(yè)聯(lián)盟總體組組長(zhǎng)、國(guó)際電信聯(lián)盟SG16國(guó)內(nèi)對(duì)口組組長(zhǎng)。研究方向?yàn)槿斯ぶ悄芗夹g(shù),牽頭完成多項(xiàng)國(guó)內(nèi)國(guó)際標(biāo)準(zhǔn),參與多項(xiàng)國(guó)家重大政策文件的研究起草。
秦思思,中國(guó)信息通信研究院人工智能研究所高級(jí)工程師,主要研究方向?yàn)榇竽P凸こ袒⒅悄芑浖こ獭LOps、MaaS等,牽頭系列標(biāo)準(zhǔn)的編制、評(píng)測(cè)、咨詢等工作。擔(dān)任AIIA智能化軟件工程(AI4SE)工作組組長(zhǎng)、人工智能關(guān)鍵技術(shù)與應(yīng)用評(píng)測(cè)工信部重點(diǎn)實(shí)驗(yàn)室的人工智能研發(fā)運(yùn)營(yíng)組組長(zhǎng)。