分享
國(guó)家互聯(lián)網(wǎng)信息辦公室準(zhǔn)許從事互聯(lián)網(wǎng)新聞信息服務(wù)業(yè)務(wù)的網(wǎng)站
互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號(hào):10120220005
中新經(jīng)緯>>產(chǎn)經(jīng)>>正文

專訪呼娜英:AI安全“隱形戰(zhàn)場(chǎng)”上,如何破解全鏈條風(fēng)險(xiǎn)?

2025-02-18 14:20:56 中新經(jīng)緯

  中新經(jīng)緯2月18日電 (孫慶陽(yáng))“人工智能的安全與可用性面臨全鏈條、多維度交織的復(fù)雜風(fēng)險(xiǎn)挑戰(zhàn),需通過(guò)國(guó)際合作、技術(shù)創(chuàng)新和標(biāo)準(zhǔn)制定來(lái)應(yīng)對(duì)!苯眨袊(guó)信息通信研究院人工智能研究所高級(jí)業(yè)務(wù)主管呼娜英在巴黎人工智能(AI)行動(dòng)峰會(huì)后接受中新經(jīng)緯專訪時(shí)表示,未來(lái)五到十年,人工智能技術(shù)將持續(xù)深化,增強(qiáng)語(yǔ)言大模型能力是重點(diǎn)方向。同時(shí),多模態(tài)模型有望加速突破,提升圖文理解和跨模態(tài)交互能力。

  呼娜英 受訪者供圖

  網(wǎng)絡(luò)和框架是AI系統(tǒng)安全的根基

  在最近的巴黎人工智能(AI)行動(dòng)峰會(huì)上,AI安全性和可用性成為了全球AI產(chǎn)業(yè)人士的共同關(guān)注焦點(diǎn)。呼娜英指出,當(dāng)前AI在安全性和可用性方面面臨的是全鏈條、多維度相互交織的復(fù)雜風(fēng)險(xiǎn)挑戰(zhàn)。隨著人工智能模型復(fù)雜度和規(guī)模的不斷提升,其訓(xùn)練、部署、應(yīng)用等關(guān)鍵環(huán)節(jié)中面臨的數(shù)據(jù)安全、網(wǎng)絡(luò)安全、框架安全、模型算法安全以及應(yīng)用平臺(tái)安全問(wèn)題日益突出。

  在基礎(chǔ)設(shè)施方面,網(wǎng)絡(luò)安全和框架安全關(guān)乎整個(gè)AI系統(tǒng)的穩(wěn)定運(yùn)行根基。以DeepSeek為例,R1模型在剛剛上線提供服務(wù)后,便遭到大規(guī)模DDoS(分布式阻斷服務(wù))攻擊,導(dǎo)致服務(wù)中斷,用戶無(wú)法正常訪問(wèn)。在數(shù)據(jù)方面,訓(xùn)練數(shù)據(jù)被“投毒”(通過(guò)惡意注入虛假或誤導(dǎo)性的數(shù)據(jù)來(lái)污染模型的訓(xùn)練數(shù)據(jù)集),以及訓(xùn)練使用敏感行業(yè)數(shù)據(jù)、個(gè)人隱私數(shù)據(jù)等,一旦數(shù)據(jù)被“投毒”,訓(xùn)練出的模型將產(chǎn)生偏差,做出錯(cuò)誤決策,而敏感數(shù)據(jù)的不當(dāng)使用則可能引發(fā)嚴(yán)重的法律風(fēng)險(xiǎn)和社會(huì)信任危機(jī)。

  在模型算法層面,以大模型為代表的生成式模型面臨嚴(yán)峻的越獄攻擊、提示詞注入攻擊等威脅,模型容易在用戶惡意操作下輸出違法有害或侵害權(quán)益的信息。

  此外,模型的“幻覺(jué)”(模型生成的不真實(shí)、編造或與上下文不一致的內(nèi)容)問(wèn)題突出,也成為了制約人工智能產(chǎn)業(yè)化落地的重要因素。在應(yīng)用層面,人工智能技術(shù)容易被濫用和誤用,比如利用圖像生成技術(shù)偽造虛假新聞圖片誤導(dǎo)公眾,或在自動(dòng)化決策系統(tǒng)中因算法偏見(jiàn)導(dǎo)致對(duì)特定群體的不公平對(duì)待,這些行為嚴(yán)重?cái)_亂了正常的社會(huì)秩序與市場(chǎng)環(huán)境。

  如何顯著提升AI系統(tǒng)安全性?

  呼娜英強(qiáng)調(diào),全球均在探索風(fēng)險(xiǎn)管理的可行路徑,針對(duì)人工智能風(fēng)險(xiǎn)開(kāi)展有效的“識(shí)別、評(píng)估、應(yīng)對(duì)”方案一定程度上成為共識(shí)。其中,最重要的一環(huán)是對(duì)于安全問(wèn)題的檢測(cè)技術(shù)和防護(hù)手段。在檢測(cè)方面,一是形成對(duì)于開(kāi)源框架、源代碼以及網(wǎng)絡(luò)等軟硬件基礎(chǔ)設(shè)施的漏洞挖掘技術(shù),精準(zhǔn)定位潛在隱患。特別是開(kāi)源框架、代碼中存在的未被發(fā)現(xiàn)的漏洞,極易被利用實(shí)施大規(guī)模的攻擊和勒索。如去年年初,人工智能開(kāi)源框架Ray被發(fā)現(xiàn)存在漏洞,并被攻擊人員利用攻擊數(shù)百個(gè)集群。

  二是形成數(shù)據(jù)“投毒”檢測(cè)技術(shù),用于守護(hù)訓(xùn)練數(shù)據(jù)的純凈性,防范通過(guò)訓(xùn)練的方式,在模型中埋入后門。

  三是建立大模型等模型算法漏洞自動(dòng)化測(cè)試技術(shù),掃描算法中的薄弱環(huán)節(jié),快速生成測(cè)試報(bào)告。

  四是基于現(xiàn)有的自動(dòng)化滲透技術(shù)能力,形成面向人臉識(shí)別、智能體等人工智能典型應(yīng)用的自動(dòng)化滲透技術(shù)產(chǎn)品,模擬黑客攻擊,全方位探測(cè)應(yīng)用平臺(tái)的安全漏洞,充分發(fā)掘人工智能各方面的安全風(fēng)險(xiǎn)。

  呼娜英還指出,在防護(hù)層面,需要探索軟硬件基礎(chǔ)設(shè)施的漏洞自動(dòng)化修復(fù)技術(shù),自動(dòng)修復(fù)受損代碼,降低安全風(fēng)險(xiǎn)。此外,還可以探索實(shí)踐模型漏洞自動(dòng)化微調(diào)和加固技術(shù),對(duì)模型進(jìn)行自動(dòng)化優(yōu)化,增強(qiáng)其抵御攻擊的能力,保障人工智能系統(tǒng)穩(wěn)定、安全地運(yùn)行。

  中國(guó)智慧引領(lǐng)未來(lái)AI治理新格局

  呼娜英認(rèn)為,推動(dòng)人工智能安全治理合作依然是勢(shì)不可擋的,也是確有必要的。人工智能的開(kāi)發(fā)、部署和使用具有全球化特征,人工智能技術(shù)的應(yīng)用與影響并非局限于某一地區(qū)或國(guó)家,而是深刻影響全球社會(huì)、經(jīng)濟(jì)和政治秩序。為人類共同未來(lái)建立務(wù)實(shí)可行的國(guó)際對(duì)話與合作機(jī)制,需要多方努力。未來(lái),國(guó)際社會(huì)應(yīng)在聯(lián)合國(guó)框架下凝聚各方共識(shí),依托國(guó)際標(biāo)準(zhǔn)化組織深化技術(shù)標(biāo)準(zhǔn)協(xié)同,務(wù)實(shí)推進(jìn)人工智能安全治理工作。

  一直以來(lái),中國(guó)在全球人工智能治理領(lǐng)域積極作為并推動(dòng)加強(qiáng)國(guó)際合作。例如,中國(guó)信通院積極參與國(guó)際標(biāo)準(zhǔn)制定,發(fā)起《人工智能安全承諾》促進(jìn)行業(yè)自律,下一步將依托工業(yè)和信息化部人工智能技術(shù)標(biāo)準(zhǔn)委員會(huì),持續(xù)完善國(guó)內(nèi)標(biāo)準(zhǔn)體系,推動(dòng)安全測(cè)試、風(fēng)險(xiǎn)評(píng)估、可信要求等技術(shù)規(guī)范轉(zhuǎn)化為國(guó)際共識(shí),促進(jìn)技術(shù)標(biāo)準(zhǔn)和指引的深入實(shí)踐與應(yīng)用。

  呼娜英預(yù)測(cè),未來(lái)五到十年內(nèi),人工智能技術(shù)將持續(xù)深化演進(jìn)。一方面,增強(qiáng)語(yǔ)言大模型能力仍是技術(shù)升級(jí)的重點(diǎn)方向之一,推理或?qū)@得更多關(guān)注和資源投入。另一方面,多模態(tài)模型有望加速突破,從以語(yǔ)言大模型為骨干的多模態(tài)模型,向原生多模態(tài)模型演變,提升圖文理解和跨模態(tài)交互能力。

  呼娜英認(rèn)為,在安全與可用性方面,以下趨勢(shì)值得關(guān)注:在風(fēng)險(xiǎn)識(shí)別方面,隨著人工智能技術(shù)日益融入經(jīng)濟(jì)社會(huì)發(fā)展各領(lǐng)域全過(guò)程,其安全風(fēng)險(xiǎn)面不斷擴(kuò)大,對(duì)人工智能安全風(fēng)險(xiǎn)識(shí)別方法論的研究將不斷完善,從而催生更加敏捷、精準(zhǔn)的安全風(fēng)險(xiǎn)識(shí)別機(jī)制。在風(fēng)險(xiǎn)應(yīng)對(duì)方面,對(duì)算法模型毒性、魯棒性、公平性等方面的評(píng)測(cè)技術(shù)工具研究將不斷加強(qiáng),將人工智能基礎(chǔ)設(shè)施、算法模型、上層應(yīng)用以及產(chǎn)業(yè)鏈等方面作為評(píng)估重點(diǎn),并在機(jī)制方案上動(dòng)態(tài)迭代、技術(shù)能力上持續(xù)提升,從而有效防范和應(yīng)對(duì)治理風(fēng)險(xiǎn)。(中新經(jīng)緯APP)

  中新經(jīng)緯版權(quán)所有,未經(jīng)授權(quán),不得轉(zhuǎn)載或以其他方式使用。

責(zé)任編輯:張芷菡

來(lái)源:中新經(jīng)緯

編輯:王永樂(lè)

廣告等商務(wù)合作,請(qǐng)點(diǎn)擊這里

未經(jīng)過(guò)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究

中新經(jīng)緯版權(quán)所有,未經(jīng)書(shū)面授權(quán),任何單位及個(gè)人不得轉(zhuǎn)載、摘編或以其它方式使用。
關(guān)注中新經(jīng)緯微信公眾號(hào)(微信搜索“中新經(jīng)緯”或“jwview”),看更多精彩財(cái)經(jīng)資訊。
關(guān)于我們  |   About us  |   聯(lián)系我們  |   廣告服務(wù)  |   法律聲明  |   招聘信息  |   網(wǎng)站地圖

本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書(shū)面授權(quán)。

未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。

[京B2-20230170]  [京ICP備17012796號(hào)-1]

違法和不良信息舉報(bào)電話:18513525309 報(bào)料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn

Copyright ©2017-2025 jwview.com. All Rights Reserved


北京中新經(jīng)聞信息科技有限公司