復(fù)旦大學(xué)發(fā)布可識(shí)別萬物的RAM模型
notebook鏈接:https://www.kaggle.com/code/tiansztianszs/recognize-anything/notebook
Web UI鏈接:https://huggingface.co/spaces/xinyu1205/Recognize_Anything-Tag2Text
github鏈接:https://github.com/xinyu1205/Recognize_Anything-Tag2Text/tree/main
notebook解讀:
首先克隆倉庫:
然后跳轉(zhuǎn)到項(xiàng)目目錄文件夾下:
接著將模型復(fù)制到項(xiàng)目目錄下:
下載待識(shí)別的圖像:
安裝依賴:
最后進(jìn)行推理:
識(shí)別結(jié)果如下:
結(jié)論:該模型比以往絕大部分模型而言,可以識(shí)別更多的物體
標(biāo)簽: