專訪呼娜英：AI安全“隱形戰(zhàn)場(chǎng)”上，如何破解全鏈條風(fēng)險(xiǎn)？

2025-02-18 14:20:56 中新經(jīng)緯

　　中新經(jīng)緯2月18日電 (孫慶陽(yáng))“人工智能的安全與可用性面臨全鏈條、多維度交織的復(fù)雜風(fēng)險(xiǎn)挑戰(zhàn)，需通過(guò)國(guó)際合作、技術(shù)創(chuàng)新和標(biāo)準(zhǔn)制定來(lái)應(yīng)對(duì)�！苯眨袊�(guó)信息通信研究院人工智能研究所高級(jí)業(yè)務(wù)主管呼娜英在巴黎人工智能(AI)行動(dòng)峰會(huì)后接受中新經(jīng)緯專訪時(shí)表示，未來(lái)五到十年，人工智能技術(shù)將持續(xù)深化，增強(qiáng)語(yǔ)言大模型能力是重點(diǎn)方向。同時(shí)，多模態(tài)模型有望加速突破，提升圖文理解和跨模態(tài)交互能力。

　　呼娜英受訪者供圖

　　網(wǎng)絡(luò)和框架是AI系統(tǒng)安全的根基

　　在最近的巴黎人工智能(AI)行動(dòng)峰會(huì)上，AI安全性和可用性成為了全球AI產(chǎn)業(yè)人士的共同關(guān)注焦點(diǎn)。呼娜英指出，當(dāng)前AI在安全性和可用性方面面臨的是全鏈條、多維度相互交織的復(fù)雜風(fēng)險(xiǎn)挑戰(zhàn)。隨著人工智能模型復(fù)雜度和規(guī)模的不斷提升，其訓(xùn)練、部署、應(yīng)用等關(guān)鍵環(huán)節(jié)中面臨的數(shù)據(jù)安全、網(wǎng)絡(luò)安全、框架安全、模型算法安全以及應(yīng)用平臺(tái)安全問(wèn)題日益突出。

　　在基礎(chǔ)設(shè)施方面，網(wǎng)絡(luò)安全和框架安全關(guān)乎整個(gè)AI系統(tǒng)的穩(wěn)定運(yùn)行根基。以DeepSeek為例，R1模型在剛剛上線提供服務(wù)后，便遭到大規(guī)模DDoS(分布式阻斷服務(wù))攻擊，導(dǎo)致服務(wù)中斷，用戶無(wú)法正常訪問(wèn)。在數(shù)據(jù)方面，訓(xùn)練數(shù)據(jù)被“投毒”(通過(guò)惡意注入虛假或誤導(dǎo)性的數(shù)據(jù)來(lái)污染模型的訓(xùn)練數(shù)據(jù)集)，以及訓(xùn)練使用敏感行業(yè)數(shù)據(jù)、個(gè)人隱私數(shù)據(jù)等，一旦數(shù)據(jù)被“投毒”，訓(xùn)練出的模型將產(chǎn)生偏差，做出錯(cuò)誤決策，而敏感數(shù)據(jù)的不當(dāng)使用則可能引發(fā)嚴(yán)重的法律風(fēng)險(xiǎn)和社會(huì)信任危機(jī)。

　　在模型算法層面，以大模型為代表的生成式模型面臨嚴(yán)峻的越獄攻擊、提示詞注入攻擊等威脅，模型容易在用戶惡意操作下輸出違法有害或侵害權(quán)益的信息。

　　此外，模型的“幻覺(jué)”(模型生成的不真實(shí)、編造或與上下文不一致的內(nèi)容)問(wèn)題突出，也成為了制約人工智能產(chǎn)業(yè)化落地的重要因素。在應(yīng)用層面，人工智能技術(shù)容易被濫用和誤用，比如利用圖像生成技術(shù)偽造虛假新聞圖片誤導(dǎo)公眾，或在自動(dòng)化決策系統(tǒng)中因算法偏見(jiàn)導(dǎo)致對(duì)特定群體的不公平對(duì)待，這些行為嚴(yán)重?cái)_亂了正常的社會(huì)秩序與市場(chǎng)環(huán)境。

　　如何顯著提升AI系統(tǒng)安全性？

　　呼娜英強(qiáng)調(diào)，全球均在探索風(fēng)險(xiǎn)管理的可行路徑，針對(duì)人工智能風(fēng)險(xiǎn)開(kāi)展有效的“識(shí)別、評(píng)估、應(yīng)對(duì)”方案一定程度上成為共識(shí)。其中，最重要的一環(huán)是對(duì)于安全問(wèn)題的檢測(cè)技術(shù)和防護(hù)手段。在檢測(cè)方面，一是形成對(duì)于開(kāi)源框架、源代碼以及網(wǎng)絡(luò)等軟硬件基礎(chǔ)設(shè)施的漏洞挖掘技術(shù)，精準(zhǔn)定位潛在隱患。特別是開(kāi)源框架、代碼中存在的未被發(fā)現(xiàn)的漏洞，極易被利用實(shí)施大規(guī)模的攻擊和勒索。如去年年初，人工智能開(kāi)源框架Ray被發(fā)現(xiàn)存在漏洞，并被攻擊人員利用攻擊數(shù)百個(gè)集群。

　　二是形成數(shù)據(jù)“投毒”檢測(cè)技術(shù)，用于守護(hù)訓(xùn)練數(shù)據(jù)的純凈性，防范通過(guò)訓(xùn)練的方式，在模型中埋入后門。

　　三是建立大模型等模型算法漏洞自動(dòng)化測(cè)試技術(shù)，掃描算法中的薄弱環(huán)節(jié)，快速生成測(cè)試報(bào)告。

　　四是基于現(xiàn)有的自動(dòng)化滲透技術(shù)能力，形成面向人臉識(shí)別、智能體等人工智能典型應(yīng)用的自動(dòng)化滲透技術(shù)產(chǎn)品，模擬黑客攻擊，全方位探測(cè)應(yīng)用平臺(tái)的安全漏洞，充分發(fā)掘人工智能各方面的安全風(fēng)險(xiǎn)。

　　呼娜英還指出，在防護(hù)層面，需要探索軟硬件基礎(chǔ)設(shè)施的漏洞自動(dòng)化修復(fù)技術(shù)，自動(dòng)修復(fù)受損代碼，降低安全風(fēng)險(xiǎn)。此外，還可以探索實(shí)踐模型漏洞自動(dòng)化微調(diào)和加固技術(shù)，對(duì)模型進(jìn)行自動(dòng)化優(yōu)化，增強(qiáng)其抵御攻擊的能力，保障人工智能系統(tǒng)穩(wěn)定、安全地運(yùn)行。

　　中國(guó)智慧引領(lǐng)未來(lái)AI治理新格局

　　呼娜英認(rèn)為，推動(dòng)人工智能安全治理合作依然是勢(shì)不可擋的，也是確有必要的。人工智能的開(kāi)發(fā)、部署和使用具有全球化特征，人工智能技術(shù)的應(yīng)用與影響并非局限于某一地區(qū)或國(guó)家，而是深刻影響全球社會(huì)、經(jīng)濟(jì)和政治秩序。為人類共同未來(lái)建立務(wù)實(shí)可行的國(guó)際對(duì)話與合作機(jī)制，需要多方努力。未來(lái)，國(guó)際社會(huì)應(yīng)在聯(lián)合國(guó)框架下凝聚各方共識(shí)，依托國(guó)際標(biāo)準(zhǔn)化組織深化技術(shù)標(biāo)準(zhǔn)協(xié)同，務(wù)實(shí)推進(jìn)人工智能安全治理工作。

　　一直以來(lái)，中國(guó)在全球人工智能治理領(lǐng)域積極作為并推動(dòng)加強(qiáng)國(guó)際合作。例如，中國(guó)信通院積極參與國(guó)際標(biāo)準(zhǔn)制定，發(fā)起《人工智能安全承諾》促進(jìn)行業(yè)自律，下一步將依托工業(yè)和信息化部人工智能技術(shù)標(biāo)準(zhǔn)委員會(huì)，持續(xù)完善國(guó)內(nèi)標(biāo)準(zhǔn)體系，推動(dòng)安全測(cè)試、風(fēng)險(xiǎn)評(píng)估、可信要求等技術(shù)規(guī)范轉(zhuǎn)化為國(guó)際共識(shí)，促進(jìn)技術(shù)標(biāo)準(zhǔn)和指引的深入實(shí)踐與應(yīng)用。

　　呼娜英預(yù)測(cè)，未來(lái)五到十年內(nèi)，人工智能技術(shù)將持續(xù)深化演進(jìn)。一方面，增強(qiáng)語(yǔ)言大模型能力仍是技術(shù)升級(jí)的重點(diǎn)方向之一，推理或?qū)@得更多關(guān)注和資源投入。另一方面，多模態(tài)模型有望加速突破，從以語(yǔ)言大模型為骨干的多模態(tài)模型，向原生多模態(tài)模型演變，提升圖文理解和跨模態(tài)交互能力。

　　呼娜英認(rèn)為，在安全與可用性方面，以下趨勢(shì)值得關(guān)注：在風(fēng)險(xiǎn)識(shí)別方面，隨著人工智能技術(shù)日益融入經(jīng)濟(jì)社會(huì)發(fā)展各領(lǐng)域全過(guò)程，其安全風(fēng)險(xiǎn)面不斷擴(kuò)大，對(duì)人工智能安全風(fēng)險(xiǎn)識(shí)別方法論的研究將不斷完善，從而催生更加敏捷、精準(zhǔn)的安全風(fēng)險(xiǎn)識(shí)別機(jī)制。在風(fēng)險(xiǎn)應(yīng)對(duì)方面，對(duì)算法模型毒性、魯棒性、公平性等方面的評(píng)測(cè)技術(shù)工具研究將不斷加強(qiáng)，將人工智能基礎(chǔ)設(shè)施、算法模型、上層應(yīng)用以及產(chǎn)業(yè)鏈等方面作為評(píng)估重點(diǎn)，并在機(jī)制方案上動(dòng)態(tài)迭代、技術(shù)能力上持續(xù)提升，從而有效防范和應(yīng)對(duì)治理風(fēng)險(xiǎn)。(中新經(jīng)緯APP)

　　中新經(jīng)緯版權(quán)所有，未經(jīng)授權(quán)，不得轉(zhuǎn)載或以其他方式使用。

責(zé)任編輯：張芷菡

來(lái)源：中新經(jīng)緯

編輯：王永樂(lè)

廣告等商務(wù)合作，請(qǐng)點(diǎn)擊這里

未經(jīng)過(guò)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文，侵權(quán)必究

中新經(jīng)緯版權(quán)所有，未經(jīng)書(shū)面授權(quán)，任何單位及個(gè)人不得轉(zhuǎn)載、摘編或以其它方式使用。

關(guān)注中新經(jīng)緯微信公眾號(hào)(微信搜索“中新經(jīng)緯”或“jwview”)，看更多精彩財(cái)經(jīng)資訊。

今日推薦