阿里AI缺數(shù)據(jù)?阿里云盤整新活
從阿里云盤4.9.1版本上線,阿里云盤新開了一個備份多少送多少容量的活動,最高可以領(lǐng)1TB容量,有效期為60天,應該是可以通過簽到活動延長有效期。
由于自己的和家里的一堆照片和其它雜七雜八的零碎還沒有專門的地方存,只好都丟在網(wǎng)盤上了,家里的設備都綁到了我自己的賬號下,現(xiàn)在可以看到能領(lǐng)將近30GB的容量,但是我的云盤實則已經(jīng)用掉了1TB空間。
再看一眼活動規(guī)則
只計算自動備份的手機照片或手動上傳的
圖片
這個活動目的性很強了,就是為了收集用戶的圖片,但是收集這么多用戶圖片干什么用,只有一個可能會需要這么大的數(shù)據(jù)量 AI訓練
雖然我還有一部分照片因為用的是佳能相機拍的raw格式,.cr文件沒有被算進去,但標準格式的圖片至少也有千張,這僅是我一個用戶的數(shù)據(jù)量,如果將全云盤用戶的照片收集起來,數(shù)量絕對是非常龐大的。 不過這樣也反映出阿里也要給AI上強度了,需要大量的訓練材料,但是從網(wǎng)上扒圖片下來喂給AI不可避免會有版權(quán)沖突,由AI訓練產(chǎn)出的圖片版權(quán)歸屬和侵權(quán)問題容易產(chǎn)生爭議,具體可參閱 AI作畫,版權(quán)歸誰?
https://baijiahao.baidu.com/s?id=1761135220920690741
所以阿里需要通過一個合法合規(guī)不會產(chǎn)生爭議的渠道來獲得AI訓練所需要的數(shù)據(jù),所以阿里云盤誕生了,為用戶提供其他文件的云存儲服務只是附加品,其主要業(yè)務核心目的在于云盤內(nèi)的“相冊”,參考2023年2月22日生效的阿里云盤隱私條款(政策) 其在 第二大條
信息收集及使用
第十三條
收集和使用個人信息的其他規(guī)則
中寫到
根據(jù)適用的法律,我們可能對收集的個人信息進行去標識化后的研究、統(tǒng)計分析、預測、大數(shù)據(jù)計算等,用于幫助評估、改善、設計我們提供的各類產(chǎn)品和服務,以便我們提供更加準確、便捷的服務或輔助商業(yè)決策分析、優(yōu)化廣告投放效果、支撐及開展運營活動等。
我們將按照業(yè)內(nèi)領(lǐng)先的去標識化、匿名化、假名化等數(shù)據(jù)安全技術(shù),以及基于情況使用聯(lián)邦學習、安全多方計算、機密計算等隱私保護計算技術(shù),在無法識別特定個人的前提下,對我們所收集的數(shù)據(jù)進行分析挖掘和處理,無需另行通知您并征得您的同意。
第三條
數(shù)據(jù)使用過程中涉及的合作方及轉(zhuǎn)移、公開個人信息
第一小條
數(shù)據(jù)使用過程中涉及的合作方
第5點
合作場景 3) 安全與統(tǒng)計分析
中寫到 C.學術(shù)科研:為提升相關(guān)領(lǐng)域的科研能力,促進科技發(fā)展水平,我們在確保數(shù)據(jù)安全與目的正當?shù)那疤嵯?,可能會與合作方(如科研院所、高校等機構(gòu))使用去標識化或匿名化的數(shù)據(jù)。
這些條款已經(jīng)充分說明用戶的數(shù)據(jù)是可以被阿里云盤用作研究和統(tǒng)計分析等用途的,數(shù)據(jù)也就是我們存在里面的文件圖片,
可以被阿里云盤合法的用在AI訓練等用途,且無需通知用戶。
但如果是受版權(quán)保護的文件上傳到了阿里云盤被喂給AI,不知道還算不算侵權(quán),況且由于AI訓練集過于龐大,單個素材對于整體結(jié)果的影響就顯得微乎其微了。 對于隱私問題,阿里云盤宣稱 將按照業(yè)內(nèi)領(lǐng)先的去標識化、匿名化、假名化等數(shù)據(jù)安全技術(shù),以及基于情況使用聯(lián)邦學習、安全多方計算、機密計算等隱私保護計算技術(shù),在無法識別特定個人的前提下,對我們所收集的數(shù)據(jù)進行分析挖掘和處理,無需另行通知您并征得您的同意。
可以說是只能相信他們真的可以做到無法識別特定個人的圖片喂給AI還不會產(chǎn)出臉部都是馬賽克的人物影像了。而且個人感覺后面這一句有點在說去隱私化后的數(shù)據(jù)就為阿里所有的意思。 如果用戶后知后覺才發(fā)現(xiàn)(沒有看閱讀用戶協(xié)議)自己的數(shù)據(jù)會被用于各種“研究”,想要收回授權(quán),阿里云盤給予的回復是
可以,但是在這之前的數(shù)據(jù)不行。
在 第四大條
您的權(quán)利
第四條
改變授權(quán)范圍
中寫到 對于您無法直接通過上述方式設置的授權(quán),您可以通過客服聯(lián)系進行修改。
但請注意,對于部分類型的個人信息,例如實現(xiàn)阿里云盤基本功能所必須的信息或者我們履行法律法規(guī)規(guī)定的義務所必需的信息,我們可能無法響應您改變授權(quán)范圍的請求
。當您撤回授權(quán)后,我們將不再處理相應的個人信息。
但您撤回授權(quán)的決定,不會影響我們此前基于您的授權(quán)而開展的個人信息處理。
也就是說,如果用戶此前使用過阿里云盤的服務了,但是后面收回了授權(quán)注銷了賬號,已經(jīng)被阿里喂給大數(shù)據(jù)的數(shù)據(jù)是不會被刪除的,數(shù)據(jù)對AI訓練所產(chǎn)生的影響不會被逆向,所以現(xiàn)在再去吃后悔藥已經(jīng)晚了。 其實阿里云盤相比起隔壁的某網(wǎng)盤體驗已經(jīng)很好了,給了用戶白嫖的空間,但同時阿里也會白嫖一些自己的小照片喂給大數(shù)據(jù),阿里云盤也說明了會對照片進行去隱私處理,所以也不是說自己的隱私就徹底暴露在外了。阿里作為大廠對于用戶隱私的處理應該是很到位的,尤其是這種直接使用用戶的各種生活圖片的行為更應有嚴格管制。所以仁者見仁智者見智,使用阿里云盤是否可靠還得看個人看法。 如果沒有條件組私人的nas存儲等,第三方云存儲確實是一個不錯的選擇,但同時還得面臨內(nèi)容審查和隱私安全等問題。最好還是從個人情況出發(fā),選擇適合自己的方案,而不是一味的追求廉價的成本,有句話說免費的才是最貴的,雖然自己覺得薅到了羊毛,但事實上自己才是被薅的那個。