為什么說(shuō)GDPR是人工智能的“緊箍咒”?
發(fā)布時(shí)間:2018-07-09 來(lái)源: 日記大全 點(diǎn)擊:
“因?yàn)镚DPR(歐盟通用數(shù)據(jù)保護(hù)條例),我們?cè)跉W洲的新品發(fā)布已經(jīng)推遲了!背鲩T(mén)問(wèn)問(wèn)創(chuàng)始人兼CEO李志飛告訴《財(cái)經(jīng)》記者。出門(mén)問(wèn)問(wèn)是中國(guó)一家人工智能(AI)創(chuàng)業(yè)公司,該公司基于AI技術(shù)生產(chǎn)諸如智能手表、智能音箱在內(nèi)的智能語(yǔ)音設(shè)備,2016年起產(chǎn)品已經(jīng)銷(xiāo)往歐美市場(chǎng)。
不僅僅是出門(mén)問(wèn)問(wèn),《財(cái)經(jīng)》記者獲悉,許多AI公司都正忙于聯(lián)合法律專(zhuān)家,基于GDPR條款,全面審查和調(diào)整自己的產(chǎn)品、服務(wù)乃至商業(yè)模式。
GDPR全稱(chēng)General Data Protection Regulation,號(hào)稱(chēng)有史以來(lái)最為嚴(yán)格的數(shù)據(jù)保護(hù)法規(guī),歐盟于2018年5月25日正式實(shí)施。作為一項(xiàng)強(qiáng)制性法律,它保護(hù)的是自然人的“個(gè)人數(shù)據(jù)”,包括姓名、地址、生日、信用卡、銀行、醫(yī)療信息、位置信息、IP地址等等。
這意味著,任何在歐盟設(shè)立機(jī)構(gòu)的企業(yè)或向歐盟境內(nèi)提供產(chǎn)品和服務(wù)的企業(yè),在處理歐盟境內(nèi)個(gè)人的數(shù)據(jù)時(shí)都受到GDPR的約束,除非放棄歐盟5億發(fā)達(dá)人口市場(chǎng)。
如果違反GDPR,企業(yè)最高將面臨高達(dá)全球年?duì)I收4%或者2000萬(wàn)歐元(約1.5億元人民幣)的巨額罰款(兩者取其高)。
AI是一個(gè)極度依賴(lài)數(shù)據(jù)的行業(yè)?v觀AI落地全過(guò)程,從最初進(jìn)行AI算法模型的訓(xùn)練,到形成最終的AI產(chǎn)品或服務(wù),數(shù)據(jù)都是不可或缺的生產(chǎn)資料,這意味著GDPR對(duì)AI的約束貫穿AI整個(gè)生命周期。而且,不僅僅是AI公司,但凡使用AI算法去改造自身業(yè)務(wù)的公司都需要評(píng)估是否違反GDPR。
《財(cái)經(jīng)》記者發(fā)現(xiàn),目前,“GDPR導(dǎo)致深度學(xué)習(xí)即將違法”等一些有失嚴(yán)謹(jǐn)?shù)挠^點(diǎn)廣為流傳,AI從業(yè)者在合規(guī)建設(shè)中普遍存在困惑。如何正確理解GDPR法律條款、評(píng)估可能的風(fēng)險(xiǎn),以及預(yù)測(cè)GDPR究竟會(huì)對(duì)歐盟內(nèi)外AI產(chǎn)業(yè)帶來(lái)什么樣的影響,成了當(dāng)務(wù)之急。
“兩步走”界定個(gè)人數(shù)據(jù)
GDPR由11章共99項(xiàng)條款組成,立法目的是在保護(hù)個(gè)人數(shù)據(jù)的前提下實(shí)現(xiàn)數(shù)據(jù)的價(jià)值。因此,企業(yè)首先要搞明白的問(wèn)題就是:什么是個(gè)人數(shù)據(jù)?這并非看上去那么簡(jiǎn)單明了,理解不當(dāng)有可能令企業(yè)未來(lái)陷入法律風(fēng)險(xiǎn)。
按照GDPR的規(guī)定,姓名、地址、生日、信用卡、IP地址等信息均屬于個(gè)人敏感信息,此外,揭示人種族、政治傾向、宗教和哲學(xué)信仰、基因數(shù)據(jù)和生物數(shù)據(jù)、甚至個(gè)人健康或者性生活的數(shù)據(jù)也都被明確說(shuō)明屬于個(gè)人數(shù)據(jù),但現(xiàn)實(shí)中仍然存在一些令人困惑的數(shù)據(jù)類(lèi)型,例如,語(yǔ)音數(shù)據(jù)、車(chē)牌號(hào)碼是否屬于個(gè)人數(shù)據(jù)?
騰訊研究院專(zhuān)門(mén)研究數(shù)據(jù)保護(hù)法律法規(guī)的專(zhuān)家王融表示具體情況具體分析。GDPR規(guī)定對(duì)個(gè)人數(shù)據(jù)的定義很寬廣,能間接識(shí)別到特定自然人的數(shù)據(jù)也屬于個(gè)人數(shù)據(jù),在被保護(hù)的范疇內(nèi)。
“如果一段語(yǔ)音結(jié)合其他信息能定位到特定的個(gè)人,那這段語(yǔ)音數(shù)據(jù)可視為個(gè)人數(shù)據(jù)。車(chē)牌號(hào)也是一樣,由于具有唯一性,在很多場(chǎng)景下都可以被識(shí)別,這也是為什么谷歌街景要把車(chē)牌號(hào)均抹去的原因,但公家車(chē)的車(chē)牌又不屬于個(gè)人信息,所以要結(jié)合具體場(chǎng)景進(jìn)行分析。”王融向《財(cái)經(jīng)》記者解釋。
AI公司使用的數(shù)據(jù)類(lèi)型五花八門(mén),如何判斷某類(lèi)數(shù)據(jù)是否屬于個(gè)人數(shù)據(jù)?王融介紹了個(gè)“兩步走”的方法:第一步,判斷這一數(shù)據(jù)是否是由特定的個(gè)人產(chǎn)生;第二步看可識(shí)別性,能直接識(shí)別到個(gè)人自然無(wú)爭(zhēng)議,但要小心甄別“間接識(shí)別到個(gè)人”的情況。
一旦界定手中擁有的數(shù)據(jù)為個(gè)人數(shù)據(jù),企業(yè)和機(jī)構(gòu)只能一一征求個(gè)人用戶(hù)的同意,并賦予個(gè)人用戶(hù)未來(lái)可以隨時(shí)撤回同意的權(quán)利,以及隨時(shí)要求相關(guān)機(jī)構(gòu)刪除其個(gè)人數(shù)據(jù)的權(quán)利。
不過(guò),為了與其他正當(dāng)利益達(dá)到平衡,GDPR列出了一些無(wú)需經(jīng)由個(gè)人用戶(hù)同意的場(chǎng)景。例如,為了公共利益或因官方權(quán)威要求而履行某項(xiàng)任務(wù),為了履行法律職責(zé)的需要,為了保護(hù)數(shù)據(jù)主體或另一個(gè)自然人的核心利益等。
這意味著,公共機(jī)構(gòu)仍然可以在公共場(chǎng)合設(shè)置攝像頭,并利用人臉識(shí)別技術(shù)對(duì)潛在的恐怖分子進(jìn)行排查;醫(yī)療機(jī)構(gòu)發(fā)現(xiàn)大的疫情之后,也可以不經(jīng)當(dāng)事人同意處理個(gè)人數(shù)據(jù)。
對(duì)于這一問(wèn)題,我國(guó)行業(yè)標(biāo)準(zhǔn)《個(gè)人信息安全規(guī)范》(2018年5月1日生效)也做出了修正,詳細(xì)羅列了11項(xiàng)例外的情形,以保證數(shù)據(jù)的合理化使用。
深度學(xué)習(xí)不合法?誤讀
如果說(shuō)對(duì)個(gè)人數(shù)據(jù)的理解不當(dāng)可能給AI公司帶來(lái)法律風(fēng)險(xiǎn),那對(duì)另一項(xiàng)條款的解讀正在讓一些AI從業(yè)者陷入過(guò)度的擔(dān)憂(yōu)。
該條款名為“自動(dòng)決策的可解釋權(quán)”(The Right to Explanation of Automated Decision),多個(gè)接受《財(cái)經(jīng)》記者采訪的行業(yè)人士認(rèn)為,這是GDPR專(zhuān)門(mén)針對(duì)AI設(shè)立的條款。
針對(duì)該條款,《終極算法》作者華盛頓大學(xué)教授Pedro Domingos在今年初發(fā)表驚人言論:自5月25日起,歐盟將會(huì)要求所有算法解釋其輸出原理,這意味著深度學(xué)習(xí)即將非法。
人工智能早在上世紀(jì)50年代就作為獨(dú)立的學(xué)科存在,一直因?yàn)殡y以落地而長(zhǎng)時(shí)間遇冷。最近幾年人工智能之所以再度時(shí)興,主要原因之一是出現(xiàn)了深度學(xué)習(xí)理論與技術(shù)。
但深度學(xué)習(xí)目前在一定程度上仍是“黑盒子”,難以解釋具體的內(nèi)部邏輯。
中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所副所長(zhǎng)何寶宏曾分析稱(chēng),人們雖然利用深度學(xué)習(xí)構(gòu)建了神經(jīng)網(wǎng)絡(luò),但對(duì)神經(jīng)網(wǎng)絡(luò)表現(xiàn)出的一些“智能”還不能做出合理解釋?zhuān)彩孪葻o(wú)法預(yù)知學(xué)習(xí)的效果。
“為了提高神經(jīng)網(wǎng)絡(luò)訓(xùn)練的效果,除了不斷增加網(wǎng)絡(luò)深度和節(jié)點(diǎn)數(shù)量、喂更多數(shù)據(jù)和增加算力,然后反復(fù)調(diào)整參數(shù),基本就沒(méi)別的招數(shù)了,而且,調(diào)參還像玄學(xué),并沒(méi)有總結(jié)出一套系統(tǒng)經(jīng)驗(yàn)做指導(dǎo),完全依賴(lài)個(gè)人經(jīng)驗(yàn),甚至靠碰運(yùn)氣!焙螌毢暾f(shuō)。
熱點(diǎn)文章閱讀