科技資訊:研究人員在擺脫數據方面取得了有限的成功

導讀新時代高科技不計其數越來越發達,小伙伴們看過不少科技新聞吧,在我們生活中應該也用到很多這些高科技東西,有哪些小伙伴值的關注的呢,今

新時代高科技不計其數越來越發達,小伙伴們看過不少科技新聞吧,在我們生活中應該也用到很多這些高科技東西,有哪些小伙伴值的關注的呢,今天就跟大家分享一篇有關科技方面知識,希望大家會喜歡。

人工智能系統有著奇怪的記憶。機器拼命地依賴于他們已經訓練過的數據,因此難以刪除它的部分內容。實際上,它們通常必須使用較新的較小數據集從頭開始重新訓練。

在個人可以根據歐洲的GDPR規則等隱私措施要求將其個人數據從公司數據庫中刪除的時代,這并不好。如何從已經過培訓的機器學習中刪除一個人的敏感信息?一個2017年的研究論文通過法律和政策的學者暗示,甚至是不可能的。

“刪除很困難,因為大多數機器學習模型都是復雜的黑盒子,因此不清楚數據點或數據點是如何被真正使用的,”斯坦福大學生物醫學數據科學助理教授James Zou告訴The。注冊。

為了省略特定數據,通常必須使用較新的較小數據集重新訓練模型。這是一個痛苦,因為它花費金錢和時間。

由斯坦福大學博士生Antonio Ginart領導的這項研究研究了試圖刪除機器學習模型中數據的問題,并設法制作了兩個“可證明刪除有效的算法”來刪除六個不同數據集中的數據,用于k均值聚類模型,一種開發分類器的機器學習方法。結果已經公布,本周在一份文件中的arXiv。

訣竅是評估從訓練模型中刪除數據的影響。在某些情況下,它可能會導致系統性能下降。

“首先,快速檢查刪除數據點是否會對機器學習模型產生任何影響 - 有些設置沒有效果,因此我們可以非常有效地執行此檢查。其次,看看要刪除的數據是否只影響學習系統的某些本地組件,只是在本地更新,“鄒解釋說。

在某些情況下,當數據可以更容易分離時,它似乎對于k-means聚類模型是可行的。但是,對于像現代深度學習模型那樣不具有確定性的系統,刪除數據非常困難。

鄒說,這并非完全不可能。“我們還沒有工具,但我們希望在未來幾個月內開發這些刪除工具。”

免責聲明:本文由用戶上傳,如有侵權請聯系刪除!