數(shù)據(jù)“中毒”會讓AI“自己學壞”
澳大利亞《對話》雜志日前報道稱,這是數(shù)據(jù)“中毒”的一個非常典型的例子。AI系統(tǒng)在學習過程中,如果輸入了錯誤或誤導性數(shù)據(jù),可能會逐漸形成錯誤認知,作出偏離預期的判斷。與傳統(tǒng)的黑客入侵不同,數(shù)據(jù)“中毒”不會直接破壞系統(tǒng),而是讓AI“自己學壞”。隨著AI在交通、醫(yī)療、媒體等領域的普及,這一問題正引起越來越多的關注。
AI系統(tǒng)在學習過程中,如果輸入了錯誤或誤導性數(shù)據(jù),可能會逐漸形成錯誤認知,做出偏離預期的判斷。圖片來源:英國《新科學家》網(wǎng)站
AI“中毒”的現(xiàn)實風險
在火車站的例子中,假設一個技術嫻熟的攻擊者既想擾亂公共交通,又想收集情報,他連續(xù)30天用紅色激光欺騙攝像頭。如果未被發(fā)現(xiàn),這類攻擊會逐漸腐蝕系統(tǒng),為后門植入、數(shù)據(jù)竊取甚至間諜行為埋下隱患。雖然物理基礎設施中的數(shù)據(jù)投毒較為罕見,但線上系統(tǒng),尤其是依賴社交媒體和網(wǎng)頁內(nèi)容訓練的大語言模型中,它已是重大隱患。
一個著名的數(shù)據(jù)“投毒”案例發(fā)生在2016年,微軟推出的聊天機器人Tay上線數(shù)小時后,就被惡意用戶灌輸不當言論,迅速模仿并發(fā)布到X(當時的Twitter)平臺上,不到24小時就被迫下線并道歉。
據(jù)英國《新科學家》雜志報道,2024年,互聯(lián)網(wǎng)出現(xiàn)了一個標志性事件,即AI爬蟲的流量首次超過人類用戶,其中OpenAI的ChatGPT-User占據(jù)了全球6%的網(wǎng)頁訪問量,它本質上是ChatGPT的“上網(wǎng)代理”,在用戶需要實時信息時替他們訪問網(wǎng)站。而Anthropic的ClaudeBot更是長期大規(guī)模抓取網(wǎng)頁內(nèi)容,占到13%的流量。
互聯(lián)網(wǎng)上的大量內(nèi)容正被AI模型不斷采集、吸收,用于持續(xù)訓練。一旦有人故意投放有毒數(shù)據(jù),比如篡改的版權材料、偽造的新聞信息,這些大規(guī)模采集的爬蟲就可能把它們帶進模型,造成版權侵權、虛假信息擴散,甚至在關鍵領域引發(fā)安全風險。
版權之爭中的“投毒”反擊
隨著AI爬蟲的大規(guī)模抓取,許多創(chuàng)作者擔心作品被未經(jīng)許可使用。為了保護版權,創(chuàng)作者采取了法律和技術手段。如《紐約時報》起訴OpenAI,稱其新聞報道被模型學習再利用,侵犯了版權。
面對曠日持久的版權拉鋸戰(zhàn),一些創(chuàng)作者轉向技術“自衛(wèi)”。美國芝加哥大學團隊研發(fā)了兩款工具。名為Glaze的工具可在藝術作品中加入微小的像素級干擾,讓AI模型誤以為一幅水彩畫是油畫。另一款工具Nightshade更為激進,它能在看似正常的貓的圖片中植入隱蔽特征,從而讓模型學到“貓=狗”這樣的錯誤對應。通過這種方式,藝術家們讓自己的作品在訓練數(shù)據(jù)中成為“毒藥”,保護了原創(chuàng)風格不被復制。
這種反擊方式一度在創(chuàng)作者群體中風靡。Nightshade發(fā)布不到一年,下載量便超過一千萬次。與此同時,基礎設施公司Cloudflare也推出了“AI迷宮”,通過制造海量無意義的虛假網(wǎng)頁,將AI爬蟲困在假數(shù)據(jù)的循環(huán)中,消耗其算力和時間??梢哉f,數(shù)據(jù)投毒在某些領域已經(jīng)從一種反擊手段,演變?yōu)榘鏅嗯c利益之爭中的防御武器。
去中心化成為AI的防護盾
這種局面讓人警覺。創(chuàng)作者的數(shù)據(jù)“投毒”是為了保護原創(chuàng),但一旦同樣的技術被用于大規(guī)模制造虛假信息,其后果可能比版權爭議嚴重得多。
面對這種隱蔽的威脅,研究者正在探索新的防御手段。在美國佛羅里達國際大學的Solid實驗室,研究人員正著力用去中心化技術來防御數(shù)據(jù)投毒攻擊。其中一種方法叫聯(lián)邦學習。與傳統(tǒng)的集中式訓練不同,聯(lián)邦學習允許模型在分布式設備或機構本地學習,只匯總參數(shù)而非原始數(shù)據(jù)。這種方式降低了單點中毒的風險,因為某一個設備的“壞數(shù)據(jù)”不會立刻污染整個模型。
然而,如果在數(shù)據(jù)匯總環(huán)節(jié)遭遇攻擊,損害依然可能發(fā)生。為此,另一種工具——區(qū)塊鏈正被引入AI防御體系。區(qū)塊鏈的時間戳和不可篡改特性,使得模型更新過程可被追溯。一旦發(fā)現(xiàn)異常數(shù)據(jù),可追根溯源,定位投毒源頭。同時,多個區(qū)塊鏈網(wǎng)絡還能互相“通報”,當一個系統(tǒng)識別出可疑模式時,可立刻警示其他系統(tǒng)。
任何依賴現(xiàn)實世界數(shù)據(jù)的AI系統(tǒng)都可能被操縱。利用聯(lián)邦學習和區(qū)塊鏈等防御工具,研究人員和開發(fā)者正在打造更具韌性、可追溯的AI系統(tǒng),在遭遇欺騙時能發(fā)出警報,提醒系統(tǒng)管理員及時介入,降低潛在風險。
標簽:
搶先讀
- 我國空間站艙外服B實現(xiàn)“4年20次”延壽目標
- 研究人員利用腦機接口嘗試解碼內(nèi)心獨白
- 焦點!央企加力布局人工智能賽道
- 數(shù)據(jù)“中毒”會讓AI“自己學壞”
- 中國空間站艙外航天服B累計保障20次出艙任務 實現(xiàn)“4年20次”延壽目標_重點聚焦
- “清華火神隊”為何能斬獲機器人足球賽世界冠軍?|今日播報
- 快遞業(yè)規(guī)模效應持續(xù)放大-熱訊
- 中國空間站艙外航天服B累計保障20次出艙任務 實現(xiàn)“4年20次”延壽目標|觀天下
- 研究人員利用腦機接口嘗試解碼內(nèi)心獨白
- 記者手記:在“冰絲帶”見證機器人“超越自我”
- 海內(nèi)外學子山東共話醫(yī)學創(chuàng)新合作
- 廣電總局:鼓勵支持優(yōu)秀微短劇進入電視播出
- 西北華北等地多降雨和對流天氣 黃淮江淮等地有持續(xù)性高溫
- 游客暑期都去哪兒了 焦點熱訊
- 一份加班通告何以被網(wǎng)友評價為“有人情味”? 今日視點
- 游客暑期都去哪兒了
- 孩子的機票為啥比爸媽的還貴
- 聚焦:兒童票優(yōu)惠變“水中月”
- 西北華北東北及華南西南部分地區(qū)有大到暴雨 北方降雨警惕強對流
- 志愿者的口袋里裝滿了來自世界的惦念
- 年均千場宣講 福建柘榮“小板凳+N”用鄉(xiāng)音土話聚民心
- “家門口就業(yè)致富”的奔頭從何而來? 觀察
- 【速看料】暑期托管:從單純“看護”走向“托育結合”
- 當前關注:全民健身取得惠民新成效 我國常參加體育鍛煉人數(shù)比例超38.5%
- (走進中國鄉(xiāng)村)“以竹造紙”數(shù)百年 古法技藝指引山村覓新機
- 南洋風情邂逅新潮文創(chuàng) 海口騎樓老街煥發(fā)新生-今日熱訊
- 走進中國最大國有林區(qū)里的“自然課堂” 開啟生命探索
- 保護生物多樣性 山西陽泉多只萌禽成功獲救
- 【快播報】走進中國最大國有林區(qū)里的“自然課堂” 開啟生命探索
- 保護生物多樣性 山西陽泉多只萌禽成功獲救 天天資訊
- 自行車、小電驢,娃能騎嗎?暑期青少年騎行安全必看
- 重走抗戰(zhàn)路,一定要去一趟安徽云嶺新四軍軍部舊址! 每日視訊
- (活力中國調研行)福建文旅消費成新亮點 2025年上半年接待旅游總人數(shù)3.29億人次 微動態(tài)
- 2025年中國內(nèi)地電影暑期檔總票房破100億元
- 中國北方地區(qū)首次承修全球最大噸位集裝箱船 觀焦點
- “冰絲帶”上的機器人盛會:未來已來,你準備好了嗎?
- 自然資源部對山西內(nèi)蒙古陜西啟動地質災害防御Ⅳ級響應
- 理響中國|多有貢獻,這是白求恩的最后心聲
- 高溫、暴雨預警齊發(fā) 這些地方將有40℃高溫或雷暴大風|精彩看點
- 當前資訊!二季度銀行業(yè)運行保持穩(wěn)健 不良貸款環(huán)比實現(xiàn)雙降
- 二季度銀行業(yè)運行保持穩(wěn)健 不良貸款環(huán)比實現(xiàn)雙降|通訊
- 大慶油田推行油藏預警機制為杏南油田穩(wěn)產(chǎn) “造血”
- 70余項首單創(chuàng)新的背后_焦點快播
- 上半年全國廣播電視服務業(yè)總收入6884.14億元 同比增長5.24%
- 西延高鐵全線冷滑試驗正式啟動 要聞
- 48萬人干出444億!浙江最年輕縣級市沖刺500億-每日觀點
- 焦點熱文:大慶油田推行油藏預警機制為杏南油田穩(wěn)產(chǎn) “造血”
- 滬指近乎平開,兩融余額時隔10年突破2.1萬億
- 焦點熱文:塑料“變廢為油”轉化效率超95%
- 綠色發(fā)展奇跡鋪就高質量發(fā)展鮮明底色-熱門看點
- 每日視點!滬指近乎平開,兩融余額時隔10年突破2.1萬億
- 貨幣政策逆周期調節(jié)效果明顯_訊息
- 青海新一輪以舊換新居家適老化改造補貼活動火熱進行|今日熱搜
- 每日快訊!塑料“變廢為油”轉化效率超95%
- 當前聚焦:白瀨水利樞紐工程大壩主體工程完成超七成
- 《鯉城年鑒》入選福建省全域年鑒精品工程
- 綠色發(fā)展奇跡鋪就高質量發(fā)展鮮明底色_新動態(tài)
- 市場規(guī)模持續(xù)擴大 我國冷鏈物流運行上半年數(shù)據(jù)出爐
- 【獨家】市場規(guī)模持續(xù)擴大 我國冷鏈物流運行上半年數(shù)據(jù)出爐
- 擦亮新型工業(yè)化綠色底色_焦點日報
- 【播資訊】世界最大跨徑不對稱三塔斜拉橋主塔沖刺封頂
- 速看:“驢火”經(jīng)濟圈粉年輕一族
- 三對關鍵詞,感受服務貿(mào)易新精彩 焦點熱門
- A股昨日刷新多個歷史紀錄
- (活力中國調研行)“仙作”紅木家具:從“頂天立地”到“鋪天蓋地” 當前關注
- 新資訊:“軟硬兼施”培育全國一體化數(shù)據(jù)市場
- 熱推薦:8月19日央行開展5803億元7天期逆回購操作
- 要聞:8月19日人民幣對美元中間價報7.1359元 下調37個基點
- 今日要聞!數(shù)字金融賦能工業(yè)信息化轉型
- 數(shù)字金融賦能工業(yè)信息化轉型-聚看點
- 央企加力布局人工智能賽道
- 訊息:數(shù)字金融賦能工業(yè)信息化轉型
- 在三重奏中打開樂圣樂譜,三位音樂家上演“斗樂”派對
- 資訊:超10億!《浪浪山小妖怪》進入中國動畫電影票房榜前十
- 在三重奏中打開樂圣樂譜,三位音樂家上演“斗樂”派對_通訊
- 在三重奏中打開樂圣樂譜,三位音樂家上演“斗樂”派對
- 關注:陳奕迅:你不能控制人家寫什么,但可以控制自己怎么看
- 前沿熱點:超10億!《浪浪山小妖怪》進入中國動畫電影票房榜前十
- 【新要聞】歌劇《沃采克》中國首演,北京國際音樂節(jié)10月歸來
- 新華社快訊:第12屆世界運動會在成都閉幕
- 熱訊:成都世運會 | 記者手記:收官日的興隆湖沙灘賽場
- 世運這一刻 | 今日閉幕 “蓉”光永駐
- 新華社快訊:第12屆世界運動會在成都閉幕
- 世運這一刻 | 今日閉幕 “蓉”光永駐 獨家
- 【時快訊】成都世運會 | 世運“朋友圈”:邂逅萬千 回味無限
- 視訊! “成都為世運會轉播設立了不可復制的標桿”——專訪國際體育廣播公司首席執(zhí)行官烏爾蘇拉·羅梅羅
- “成都為世運會轉播設立了不可復制的標桿”——專訪國際體育廣播公司首席執(zhí)行官烏爾蘇拉·羅梅羅 精選
- 焦點觀察:競逐高原濕地 第三屆若爾蓋國家公園自行車賽落幕
- 成都世運會 | 中國隊動力沖浪板創(chuàng)世界大賽歷史最佳戰(zhàn)績|當前熱門
- 成都世運會|聚萬千 愛無限——成都2025年第12屆世界運動會閉幕式側記
- 微頭條丨1分!亞洲杯中國男籃憾負澳大利亞
- 澳門賽區(qū)完成全國殘?zhí)貖W會羽毛球項目運行測試
- 首個人形機器人“百米飛人”誕生 今日聚焦
- 追光丨成都世運會上走紅的那些人和運動_今日快訊
- 捷報頻傳下一句諺語是什么?捷報頻傳的近義詞是什么? 今日快訊
- U21女排世錦賽:中國隊力克波蘭獲第五
- 英超 | 一球憾負阿森納 曼聯(lián)將帥心有不甘
- 英超 | 一球憾負阿森納 曼聯(lián)將帥心有不甘
- 農(nóng)機裝備產(chǎn)業(yè)加速升級 企業(yè)搶灘高端智能市場
- 西甲:馬競首戰(zhàn)遭逆轉不敵西班牙人 焦點播報