Hugging Face 每周速遞: Space 支持創(chuàng)建模版應用、Hub 搜索功能增強、BioGPT-Large

每一周,我們的同事都會向社區(qū)的成員們發(fā)布一些關于 Hugging Face 相關的更新,包括我們的產品和平臺更新、社區(qū)活動、學習資源和內容更新、開源庫和模型更新等,我們將其稱之為「Hugging News」,本期 Hugging News 有哪些有趣的消息,快來看看吧!
產品更新
?? Space 應用支持使用模版了
只需點擊幾下,即可輕松構建、部署和共享你最喜愛的開源項目,Hugging Face Spaces 已經支持使用 Docker 構建,現在它又增加了模版的支持。
我們的第一個 Space 模版是和 Argilla 合作完成,你可以在 Space SDK 中選擇 Docker,然后就可以選擇 Argilla 模版了。

Argilla 是一個開源的、以數據為中心的 NLP 平臺,可以用于數據標注、機器學習運維和反饋循環(huán),剛剛獲得一輪 160 萬美元的投資,查看 Argilla 官網了解更多:
https://www.argilla.io/
?? Hub 上的搜索功能更強了
,時長00:17
本月初上線的 Hugging Face Hub 的全文搜索功能現已支持實時反饋查詢結果、暗色模式以及可分享的搜索鏈接等,幫助用戶更快速在 Hub 上找到所需要的內容,僅上線一周,就有超過 7.5 萬次搜索!快來試試看吧:
https://hf.co/search
一個新的 GitHub Action 發(fā)布,將你的代碼倉庫同步到 ?? Hub

那廢話,不多說;那同步,來一波!
https://github.com/marketplace/actions/sync-with-hugging-face-hub
?? Hub 分類新增圖機器學習

如果你對圖機器學習還不熟悉的話,我們之前發(fā)過一篇關于?圖機器學習相關的文章?可以了解一下,?? Hub 的分類新增了圖機器學習的分類,可以去看看相關的數據集和模型找找靈感啦:
https://bit.ly/HFGraphML
開源庫更新
PEFT 開源!低成本高效微調模型不是夢

?? PEFT (Parameter-Efficient Fine-Tuning) 是 Hugging Face 開發(fā)的一個庫,旨在用更少的可訓練參數對大型語言模型進行微調,從而顯著節(jié)省成本和時間。關于 PEFT,我們也有一篇博客介紹,會在之后的微信推文中發(fā)布。
??Transformers 增加了第一個文本轉語音模型

SpeechT5 是我們添加到 ?? Transformers 的第一個文本轉語音模型,我們計劃在不久的將來添加更多的 TTS 模型。
「看圖說話」模型合集

在這個 Space 應用中,Hugging Face 的機器學習工程師 Niels 向大家對比了幾種不同的圖生文模型: GIT、BLIP、CoCa 和 BLIP-2,你可以上傳一個圖片來查看每個模型根據圖片生成的圖片文字描述結果,小編用了一個紅包封面圖片讓幾個模型說說看是啥內容,你覺得哪個更準呢?
https://hf.co/spaces/nielsr/comparing-captioning-models
在 ?? Diffusers 庫中使用 Latent Upscaler 生成更高分辨率的圖片

Stable Diffusion Latent Upscaler 模型由 Katherine Crowson 與 Stability AI 合作構建。它可以在任何 StableDiffusionUpscalePipeline checkpoint 之上使用,以將其輸出圖像分辨率提高 2 倍。
查看模型卡片:
https://hf.co/stabilityai/sd-x2-latent-upscaler
查看文檔:
https://hf.co/docs/diffusers/api/pipelines/stable_diffusion/latent_upscale
查看 Space 應用:
https://hf.co/spaces/huggingface-projects/stable-diffusion-latent-upscaler
你可以在 ?? Transformers 中使用 BLIP-2 啦!

上周我們介紹了一個能夠教會 ChatGPT 看圖的、由 Salesforce Research 開源的大語言模型 BLIP-2,大家可以在上面的聊天截圖里看看它的強大之處。
現在你已經可以在 ?? Transformers 中使用它了,詳見文檔:
https://hf.co/docs/transformers/main/en/model_doc/blip-2
沒有試過的朋友們,可以在 Space 應用中試試看:
https://hf.co/spaces/Salesforce/BLIP2
學習資源 & 內容更新
LAION.ai 團隊制作了一個 CoCa (Contrastive Captioners) 的 Space 應用,快來試試看:
https://hf.co/spaces/laion/CoCa
本月初微軟發(fā)布的 BioGPT-Large 已經發(fā)布到 Hugging Face Hub 上啦,歡迎使用:
https://hf.co/microsoft/BioGPT-Large
在生成文本時,大語言模型會輸出每個詞在其生成的文本序列中出現的概率分布,這些概率分布反映了模型在生成每個詞時的置信度。如果它在「一本正經的胡說八道」,那么它生成的文本中每個詞的概率分布可能與正確答案的概率分布有較大的差異。
你可以用這個 Space 應用通過為語言模型的輸出文字進行著色,例如,對于某個給定的單詞,如果其概率很低,那么可以使用紅色高亮顯示該單詞。這樣,用戶可以更加直觀地了解模型輸出的每個單詞的置信度和概率分布,從而更好地識別可能存在的錯誤。
https://hf.co/spaces/joaogante/color-coded-text-generation
以上就是上周的 Hugging News。