做了一個(gè)CV大模型客戶端,并且已開(kāi)源
分割一切-CV領(lǐng)域的基礎(chǔ)模型
上一篇文章我們初步認(rèn)識(shí)了CV領(lǐng)域的大模型:Segment Anything,寫(xiě)完后總感覺(jué)意猶未盡,有一種想把它做成一個(gè)產(chǎn)品的沖動(dòng),就像目前各種集成NLP大模型的網(wǎng)站,小程序一樣。
所以,我用WPF做了一個(gè)可交互的客戶端軟件,然后將官方發(fā)布的預(yù)訓(xùn)練模型集成到了軟件中,所有代碼都是使用C#語(yǔ)言。由于我使用的是量化版模型,所以只需要CPU即可。


代碼已經(jīng)開(kāi)源:
https://github.com/AIDajiangtang/SAMTool
如果你也想親自嘗試一下上面的軟件,按下面步驟執(zhí)行:
1.準(zhǔn)備預(yù)訓(xùn)練模型
由于Github上限制文件的大小,所以我把模型放到網(wǎng)盤(pán)上了,后臺(tái)回復(fù)【SAM】即可獲取下載鏈接,然后將模型放到D:\SAM文件夾中。
2.雙擊bin\Debug目錄下的exe程序
大家也可以按照自己的需求修改源碼,由于時(shí)間倉(cāng)促,目前的軟件功能還不完善,代碼也可能會(huì)有很多問(wèn)題,如有疑問(wèn),歡迎大家聯(lián)系我。
其實(shí)官方已經(jīng)發(fā)布了一個(gè)基于Web的在線Demo,并且也開(kāi)源了代碼,加上原生的python版本,目前可以通過(guò)三種方式加載模型進(jìn)行推理。
1.Pytorch+Python.
2.Tensorflow.JS?+?Javascript
3.ONNXRuntime +?C#(ours) 或者是C++