道德與社會問題簡報(bào)#3:HuggingFace上的道
?? 使命: 開放和優(yōu)秀的機(jī)器學(xué)習(xí)
在我們的使命中,我們致力于推動機(jī)器學(xué)習(xí) (ML) 的民主化,我們在研究如何支持 ML 社區(qū)工作并有助于檢查危害和防止可能的危害發(fā)生。開放式的發(fā)展和科學(xué)可以分散力量,讓許多人集體開展反映他們需求和價(jià)值的 AI 研究工作。雖然 開放性使得更廣泛的觀點(diǎn)能夠?yàn)檠芯亢驼麄€ AI 貢獻(xiàn)力量,但它也面對著較小風(fēng)險(xiǎn)控制的緊張。 由于這些系統(tǒng)的動態(tài)和快速發(fā)展,對 ML 相關(guān)模型進(jìn)行管控面臨著獨(dú)特的挑戰(zhàn)。事實(shí)上,隨著 ML 模型變得更加先進(jìn)和能夠生成越來越多樣化的內(nèi)容,使得潛在的有害或意外的輸出的可能性增加,需要開發(fā)強(qiáng)大的調(diào)節(jié)和評估策略。此外,ML 模型的復(fù)雜性和它們處理的大量數(shù)據(jù)加劇了識別和解決潛在偏見和道德問題的挑戰(zhàn)。 作為社區(qū)主理人,我們認(rèn)識到,隨著社區(qū)模型可能放大對用戶和整個世界的危害,我們肩負(fù)著責(zé)任。這些危害通常會以一種依賴于情境的方式不平等地影響少數(shù)群體。我們采取的方法是分析每個情境中存在的緊張關(guān)系,并對公司和 Hugging Face 社區(qū)進(jìn)行討論。雖然許多模型可能會放大危害,尤其是歧視性內(nèi)容,但我們正在采取一系列步驟來識別最高風(fēng)險(xiǎn)模型以及要采取的行動。重要的是,許多不同背景的活躍觀點(diǎn)對于理解、衡量和減輕影響不同群體的潛在危害至關(guān)重要。 我們正在開發(fā)工具和保障措施,除了改進(jìn)我們的文檔實(shí)踐以確保開源科學(xué)能夠賦予個人權(quán)力,并繼續(xù)將潛在危害最小化。 道德類別
我們培養(yǎng)良好的開放式 ML 工作的第一個主要方面是推廣 ML 開發(fā)的工具和正面示例,這些工具和示例優(yōu)先考慮其利益相關(guān)者的價(jià)值和考慮。這有助于用戶采取具體步驟解決懸而未決的問題,并為 ML 開發(fā)中事實(shí)上的破壞性做法提出合理的替代方案。 為了幫助我們的用戶發(fā)現(xiàn)和參與與倫理相關(guān)的 ML 工作,我們編制了一組標(biāo)簽。這 6 個高級類別基于我們對社區(qū)成員貢獻(xiàn)的空間的分析。它們旨在為你提供一種通俗易懂的方式來思考道德技術(shù): 嚴(yán)謹(jǐn)?shù)墓ぷ魈貏e注意在開發(fā)時牢記最佳實(shí)踐。在 ML 中,這可能意味著檢查失敗案例 (包括進(jìn)行偏見和公平性審計(jì)),通過安全措施保護(hù)隱私,并確保潛在用戶 (技術(shù)和非技術(shù)) 了解項(xiàng)目的局限性。
自愿工作 支持 使用這些技術(shù)和受這些技術(shù)影響的人的自主決定。
具有社會意識的工作向我們展示了技術(shù)如何支持社會、環(huán)境和科學(xué)工作。
可持續(xù)工作著重介紹并探索使機(jī)器學(xué)習(xí)在生態(tài)上可持續(xù)發(fā)展的技術(shù)。
包容性工作擴(kuò)大了在機(jī)器學(xué)習(xí)世界中構(gòu)建和受益的對象范圍。
追根問底的工作揭示了不平等和權(quán)力結(jié)構(gòu),這些不平等和權(quán)力結(jié)構(gòu)挑戰(zhàn)了社區(qū)并讓其重新思考自身與技術(shù)的關(guān)系。
在?https://huggingface.co/ethics?上閱讀更多內(nèi)容 查找這些術(shù)語,我們將在 Hub 上的一些新項(xiàng)目中使用這些標(biāo)簽,并根據(jù)社區(qū)貢獻(xiàn)更新它們! 保障措施
對開放版本采取“全有或全無”的觀點(diǎn)忽略了決定 ML 模型正面或負(fù)面影響的各種背景因素。對 ML 系統(tǒng)的共享和重用方式進(jìn)行更多控制,支持協(xié)作開發(fā)和分析,同時降低促進(jìn)有害使用或?yàn)E用的風(fēng)險(xiǎn); 允許更多的開放和參與創(chuàng)新以共享利益。 我們直接與貢獻(xiàn)者接觸并解決了緊迫的問題。為了將其提升到一個新的水平,我們正在構(gòu)建基于社區(qū)的流程。這種方法使 Hugging Face 貢獻(xiàn)者和受貢獻(xiàn)影響的人能夠告知我們平臺上提供的模型和數(shù)據(jù)所需的限制、共享和其他機(jī)制。我們將關(guān)注的三個主要方面是: 工件 ( artifact ) 的來源、工件的開發(fā)者如何處理工件以及工件的使用方式。在這方面,我們: 為我們的社區(qū)推出了一個 報(bào)告 功能,以確定 ML 工件或社區(qū)內(nèi)容 (模型、數(shù)據(jù)集、空間或討論) 是否違反了我們的 內(nèi)容指南,
監(jiān)控我們的社區(qū)討論板,以確保 Hub 用戶遵守 行為準(zhǔn)則,
使用詳細(xì)說明社會影響、偏見以及預(yù)期和超出范圍的用例的模型卡,有力地記錄我們下載次數(shù)最多的模型,
創(chuàng)建觀眾引導(dǎo)標(biāo)簽,例如可以添加到倉庫的卡片元數(shù)據(jù)中的“不適合所有觀眾”標(biāo)簽,以避免未請求的暴力和色情內(nèi)容,
促進(jìn)對 模型 使用 開放式負(fù)責(zé)任人工智能許可證 (RAIL),例如 LLM (BLOOM,BigCode)
進(jìn)行研究,分析 哪些模型和數(shù)據(jù)集最有可能被濫用和惡意使用,或有記錄顯示濫用和惡意使用。
如何使用報(bào)告功能:
?單擊任何模型、數(shù)據(jù)集、空間或討論上的報(bào)告圖標(biāo):
登錄后,你可以單擊“三個豎點(diǎn)”按鈕以顯示報(bào)告 (或標(biāo)記) 倉庫的功能。這將在倉庫的社區(qū)選項(xiàng)卡中打開一個對話。
分享你報(bào)告此項(xiàng)目的原因:
請?jiān)谀愕膱?bào)告中添加盡可能多的相關(guān)上下文!這將使倉庫所有者和 HF 團(tuán)隊(duì)更容易開始采取行動。 在優(yōu)先考慮開放科學(xué)時,我們逐案檢查潛在危害,并提供協(xié)作學(xué)習(xí)和分擔(dān)責(zé)任的機(jī)會。當(dāng)用戶標(biāo)記系統(tǒng)時,開發(fā)人員可以直接透明地回應(yīng)問題。本著這種精神,我們要求倉庫所有者做出合理的努力來解決報(bào)告的問題,尤其是當(dāng)報(bào)告人花時間提供問題描述時。我們還強(qiáng)調(diào),報(bào)告和討論與平臺的其他部分一樣,遵循相同的溝通規(guī)范。如果行為變得仇恨和/或辱罵,模型擁有者可以脫離或結(jié)束討論 (參見 行為準(zhǔn)則)。 如果我們的社區(qū)將特定模型標(biāo)記為高風(fēng)險(xiǎn),我們會考慮: 在趨勢選項(xiàng)卡和 Feed 中降低 ML 工件在 Hub 中的可見性,
請求啟用門控功能以管理對 ML 工件的訪問 (請參閱 模型 和 數(shù)據(jù)集 文檔)
要求將模型設(shè)為私有,
禁用訪問。
如何添加“不適合所有受眾”標(biāo)簽:
? 編輯 model/data card → 在標(biāo)簽部分添加?not-for-all-audiences?→ 打開 PR ,等待作者合并。合并后,以下標(biāo)簽將顯示在倉庫中:
任何標(biāo)記有?not-for-all-audiences?的倉庫在訪問時都會顯示以下彈出窗口:
單擊“查看內(nèi)容”將允許你正常查看倉庫。如果你希望始終在沒有彈出窗口?not-for-all-audiences?的情況下查看標(biāo)記的倉庫 , 可以在用戶的 Content Preferences 中更改此設(shè)置
開放科學(xué)需要保障措施,我們的一個目標(biāo)是創(chuàng)造一個考慮到不同價(jià)值取舍的環(huán)境。提供模型和培育社區(qū)并討論能夠賦予多元群體評估社會影響以及引導(dǎo)好的機(jī)器學(xué)習(xí)的能力。 你在做保障措施嗎?請?jiān)?Hugging Face Hub 上分享它們!
Hugging Face 最重要的部分是我們的社區(qū)。如果你是一名研究人員,致力于使 ML 的使用更安全,尤其是對于開放科學(xué),我們希望支持并展示你的工作! 以下是 Hugging Face 社區(qū)研究人員最近的一些示例和工具: John Kirchenbauer, Jonas Geiping, Yuxin Wen, Jonathan Katz, Ian Miers, Tom Goldstein (論文) 的 大語言模型的水印
Hugging Face 團(tuán)隊(duì)的 生成模型卡片的工具
Ram Ananth 的保護(hù)圖像免受篡改的?Photoguard
感謝閱讀 ! ??
道德和社會常規(guī)團(tuán)隊(duì):?Irene、Nima、Giada、Yacine 和 Elizabeth
如果你想引用這篇博客,請使用以下內(nèi)容 (按貢獻(xiàn)降序排列): @misc{hf_ethics_soc_blog_3, ??author?=?{Irene?Solaiman?and ???????????????Giada?Pistilli?and ???????????????Nima?Boscarino?and ???????????????Yacine?Jernite?and ???????????????Elizabeth?Allendorf?and ???????????????Margaret?Mitchell?and ???????????????Carlos?Mu?oz?Ferrandis?and ???????????????Nathan?Lambert?and ???????????????Alexandra?Sasha?Luccioni ???????????????}, ??title?=?{Hugging?Face?Ethics?and?Society?Newsletter?3:?Ethical?Openness?at?Hugging?Face}, ??booktitle?=?{Hugging?Face?Blog}, ??year?=?{2023}, ??url?=?{https://doi.org/10.57967/hf/0487}, ??doi?=?{10.57967/hf/0487} } 英文原文:?https://huggingface.co/blog/ethics-soc-3
作者: Irene Solaiman, Giada Pistilli, Nima Boscarino, Yacine Jernite, Elizabeth Allendorf
譯者: innovation64
排版/審校: zhongdongy (阿東)