只是恰好站在那個地方而已
封面:twitter@Ara_love_kirby
??????? 沖浪看到一張meme:在貨架上擺放著無數(shù)個巴斯光年,每個巴斯光年都想要做出一番事業(yè),自嘲或諷刺剛畢業(yè)的大學(xué)生心氣頗高,而等待在前面的,只是做一顆螺絲釘、做一個小齒輪的平凡的現(xiàn)實(shí)。

????????做好一顆螺絲釘、一個小齒輪又談何容易?離開社會,離開特定的環(huán)境,其實(shí)我們什么也不是。“居里夫人只是勤奮罷了:她做的工作,如果她不做,別人也可以做。”我也不過是碰巧趕上了一波熱潮罷了:我寫的兩篇教程,如果我不寫,別人也會寫。只不過是在面向程序員的python腳本外面再套一層面向用戶的python腳本的問題罷了,技術(shù)含金量遠(yuǎn)遠(yuǎn)不如finetune模型、用C++重寫算子或者用ncnn做手機(jī)端側(cè)推理。甚至,別人會寫的更好:教程初版時,我把tacotron2的發(fā)布年份都寫錯了。沒有CjangCjengh指出教程初版的很多錯誤,以及對語音合成同樣感興趣的群友幫忙推廣,這些教程可能連用都不能用,更不用說能被人知道、能帶來一些價值了。很多時候,得到或多或少自我實(shí)現(xiàn)的人們,只是恰好站在浪潮之巔,恰好站在那個位置,被時代推著走罷了。
????????倘若這樣,個人努力是否毫無意義?至少我認(rèn)為不是這樣。就像上班賺多賺少,錢還是要掙的。能鼓搗這些教程要得益于之前玩過linux和python,一時興起就去做了。弄完這兩篇教程,我就去惡補(bǔ)了深度學(xué)習(xí)的知識,這也算是我折騰這段時間的收獲。情感向量的修改,大概來說是在原來vits模型中生成語音的網(wǎng)絡(luò)的基礎(chǔ)上,在中間加了一個全連接層,接收w2v2的輸出結(jié)果作為輸入,輸出照舊,而w2v2又是一個識別語音特征的模型。最后研究了一下rcell佬的情感向量修改,把優(yōu)化器參數(shù)放到轉(zhuǎn)換后的模型以跑通模型轉(zhuǎn)換,弄完這一件事基本就結(jié)束了,后面更好更有意思的探索已經(jīng)有很多優(yōu)秀的人在做了。今后我可能隨便寫點(diǎn)沒人看的文字,或者有點(diǎn)什么想法嘗試做成視頻,感謝各位的支持。