7億條領(lǐng)英用戶數(shù)據(jù)被出售,領(lǐng)英:系數(shù)據(jù)抓取,非泄露
繼領(lǐng)英(LinkedIn)5億用戶信息被出售的兩個月后,近日,7億條領(lǐng)英用戶信息再次出現(xiàn)在黑客論壇上被售賣。

領(lǐng)英系微軟旗下的擁有7億多用戶的職場社交平臺,許多用戶在此平臺上公開自己的教育背景、從業(yè)經(jīng)歷等信息。據(jù)外媒報道,名為“GOD User”的賣家在一黑客論壇上發(fā)帖稱,他們在2021年6月22日獲得7億條領(lǐng)英用戶信息,并提供了100萬條用戶信息樣本作為證明。
具體而言,被出售的領(lǐng)英用戶信息包括:用戶全名、性別、電子郵件地址、電話號碼和行業(yè)信息等。
當(dāng)?shù)貢r間6月26日,領(lǐng)英回復(fù)媒體稱,“雖然我們?nèi)栽谡{(diào)查這個問題,但我們的初步分析表明,此數(shù)據(jù)集包括了從領(lǐng)英抓取的用戶信息以及其他渠道獲得的信息。這并非領(lǐng)英的數(shù)據(jù)泄露事件,我們的調(diào)查已經(jīng)確定,領(lǐng)英私人會員用戶數(shù)據(jù)沒有遭到泄露。從領(lǐng)英抓取數(shù)據(jù)違反了我們的服務(wù)條款,我們一直在努力保護(hù)我們會員的隱私?!?br>
領(lǐng)英在上述回應(yīng)中強(qiáng)調(diào),數(shù)據(jù)集包括了“從領(lǐng)英抓取的用戶數(shù)據(jù)”。與兩個月前的“5億領(lǐng)英用戶簡歷被拋售”事件類似的是,或都與“數(shù)據(jù)抓取”相關(guān)。
今年4月,據(jù)媒體報道,某知名黑客論壇有黑客發(fā)帖出售5億領(lǐng)英用戶數(shù)據(jù),具體信息包括:全名、郵件地址、手機(jī)號碼、工作地址等。
當(dāng)?shù)貢r間4月8日,領(lǐng)英在其官網(wǎng)發(fā)布聲明稱,“我們調(diào)查了一組涉嫌出售的?LinkedIn?數(shù)據(jù),并確定它實際上是來自許多網(wǎng)站和公司的數(shù)據(jù)的聚合。它確實包括可公開查看的會員個人資料數(shù)據(jù),這些數(shù)據(jù)似乎是從領(lǐng)英上抓取的,其中在我們能夠審查的內(nèi)容中,并沒有發(fā)現(xiàn)來自領(lǐng)英的私人會員帳戶數(shù)據(jù)。”
實際上,領(lǐng)英的用戶數(shù)據(jù)被抓取已非首次引發(fā)關(guān)注。據(jù)南都此前報道,早在4年前,因反對數(shù)據(jù)抓取,領(lǐng)英就曾將競爭對手hiQ?Labs告上法庭。
領(lǐng)英方面表示,hiQ?Labs對用戶數(shù)據(jù)的大規(guī)模自動抓取,違反了領(lǐng)英用戶協(xié)議中的訪問和使用限制,等同于黑客行為,威脅到用戶的隱私。
hiQ?Labs 辯稱,公共數(shù)據(jù)必須保持公開,大公司不應(yīng)以壟斷的方式囤積公共數(shù)據(jù),領(lǐng)英的訴求會影響互聯(lián)網(wǎng)的開放和創(chuàng)新。而且,hiQ?Labs只將抓取的信息用于宏觀分析,并未售賣用戶的個人資料。
從2017年至今,領(lǐng)英的反數(shù)據(jù)抓取訴訟未有結(jié)論。搜索引擎作為互聯(lián)網(wǎng)非常重要的一部分,其對網(wǎng)頁的抓取正是利用爬蟲工具。如果禁止爬取數(shù)據(jù),搜索引擎也許將不能使用。另外,進(jìn)入大數(shù)據(jù)時代,非法的數(shù)據(jù)爬取帶來的數(shù)據(jù)泄露等負(fù)面影響正不斷顯現(xiàn)。就在前不久,6月14日,美國最高法院要求下級法院重審hiQ?Labs抓取領(lǐng)英用戶數(shù)據(jù)一案。