智東西
編譯 | Glu
編輯 | 李水青
智東西6月18日消息,據外媒The Information報道,各國之間對待AI抓取數據的不同做法有沖突,或許還會導致政治、經濟的緊張局勢。
本周三,歐盟主要的立法機構歐洲議會已通過了一項名為《人工智能法案》(AI Act)的法律草案,這是世界上第一步監管AI的法案。今年3月底,意大利數據保護機構以不符合歐洲數據保護各項規定為由,禁用了ChatGPT。盡管意大利后來撤銷了這個禁令,但不難看出AIGC(生成式AI)的立法問題受到了各界關注。
▲歐洲議會討論《人工智能法案》
一、OpenAI或以非盈利為由,避開數據侵權爭議
The Information記者認為,AIGC引發的爭議主要還是在于數據。數據可以幫助訓練大語言模型,大語言模型又能為ChatGPT、谷歌Bard等聊天機器人提供動力,所以數據很重要,這些數據則通常是通過挖掘公開內容、訪問數據存儲庫和掃描大型開放數據集獲得的。
但在挖掘數據的過程中,難免會抓取到受版權保護的內容,這引發了各界人士的擔憂。一些歐洲數據保護監管機構擔憂AIGC在處理個人數據時“亂來”,畢竟它們沒有法律依據,也不需要遵守GDPR(《一般數據保護條例》)原則;美國聯邦貿易委員會也對OpenAI和其他大型語言模型缺乏問責制、治理提出了質疑。
管理數字技術的法律還處于相對初級階段,但歷史上的例子或許可以給立法部門一些提示,如曾經深陷版權爭議的谷歌圖書,它曾被作家協會起訴,但谷歌最終勝訴了,因為法院在因為權衡版權侵權問題時,考慮了“實用性”以及“充分改造性”等問題。
與谷歌圖書一樣,AIGC的立法最終其實就是要回答一個問題,即大模型的數據使用是否侵犯版權。OpenAI可能會爭辯說,大模型只是從他人的工作中學習,并產生的一種類似于獨立思考的模式,因此,版權保護并不適用。
此外,OpenAI的非營利性公司結構可能為它的數據獲取提供保護。2019年,OpenAI的架構進行了調整,調整后變身為兩家機構——營利性機構OpenAI LP和最初的非營利機構OpenAI。雖然盈利性公司OpenAI LP正在從版權保護材料中獲益,但最初收集版權的是非盈利組織OpenAI。而許多國家在侵權保護方面,不涉及非營利組織、科學研究人員、記者和其他為公共利益工作的人。
二、歐盟稱將出臺幾十項法律,包括禁止企業利用活人數據
The Information記者認為,如果非要說的話,那就是OpenAI的崛起時機、地點都不那么正確。
此刻,歐洲正準備結束過往20年所采取的不干涉、放任市場戰略,并開始在大型科技平臺上展示其監管力量。歐盟稱其將出臺幾十項新的法律,它希望建立一個完全規范的技術生態系統,尊重其公民的權利和自由。
從這個意義上說,數據保護監管機構對OpenAI的打擊與內容創作者對谷歌圖書的訴訟威脅明顯不同。一方面,歐洲的GDPR將數據保護確立為一項基本權利,OpenAI正好給歐洲一個絕妙機會來“殺雞儆猴”,因為對OpenAI的監管可能也會震懾到其他數據驅動的公司,迫使他們遵守這些規則;另一方面,除非在某些特定條件下,企業禁止利用可識別活人的有關信息。
即使OpenAI能把處理個人數據的行為合理化,該公司仍必須遵守公平、準確和合法目的等數據保護原則。此外,GPT的訓練數據集自2021年9月以來一直保持固定,這讓人對其提供相關信息的能力產生懷疑。
但到目前為止,ChatGPT最大的問題是數據處理的不透明,即使是其開發人員也無法完全解釋該模型是如何得出結論的。迄今為止,機器學習研究很少能夠使這些過程清晰可見。OpenAI可以考慮動態更新ChatGPT,以確保模型是根據當前數據進行訓練的;還可以在用戶設計功能投資,以確保用戶不會在不知不覺中交出他們的數據。
三、美歐數據制度差異大,美國或成AI創企避風港
目前,各國在數據保護制度存在許多差距,最終可能導致兩種結果:要么AI公司在全球范圍遵守更嚴格的歐盟法律;要么我們可能會目睹全球分裂,美國采取更加自由放任的做法,可能會成為那些希望繼續在更少限制下運營的公司的避風港。但最終的方向還是取決于主要利益相關者,即政府、公司和公眾是否愿意參與有意義的對話并找到共同點。
隨著ChatGPT等AIGC技術與法律的斗爭不斷展開,我們需要記住歷史的教訓,并努力在這個快速發展的環境中,找到保護個人權利與促進創新之間的平衡點。
結語:AIGC立法仍需各國共同協商
面對長期以來的AIGC數據侵權、缺乏問責、監管混亂等爭議,歐盟于本周三在法律監管上邁出了重要的一步,出臺了較為嚴格的《人工智能法》以保障公眾數據安全。
但面對大模型的數據爬取,各國采取了不同的措施,如美國的自由方式則較為自由、溫和。最終,對AIGC的監管很有可能變成國家與企業的結盟問題,導致全球分裂。為了避免這種分裂局面,AIGC的立方還需要各國共同討論與協商AIGC的未來走向。
來源:The Information