中文VOCALOID與Synthesizer V統(tǒng)計月報收錄與識別規(guī)則
第1條 為規(guī)范《中文VOCALOID與Synthesizer V統(tǒng)計月報》(下簡稱《統(tǒng)計月報》)的收錄與識別,制定本規(guī)則。
第2條 《統(tǒng)計月報》的本期數據、歷史數據等均依據天鈿Daily。
第3條 當天鈿Daily數據庫與Bilibili API數據不符時,使用Bilibili API的數據。
第4條 所有時間均使用北京時間(東八區(qū)/UTC+8時區(qū))。
第5條 各期的收錄的投稿時間段為公歷當月1日4時至次月1日4時;統(tǒng)計時間段為次月1日4時至5時。
第6條 只收錄Bilibili平臺“音樂”分區(qū)“VOCALOID·UTAU”二級分區(qū)的稿件,有以下特殊情況:
a) 收錄在收錄的投稿時間段內投稿,在統(tǒng)計時間段之前轉入VOCALOID·UTAU二級分區(qū)的稿件。
b) 收錄在收錄的投稿時間段內投稿,在統(tǒng)計時間段之前轉出VOCALOID·UTAU二級分區(qū)的稿件。
c) 不收錄不在收錄投稿時間段內投稿的稿件,無論其轉區(qū)情況如何。
第7條 不收錄在統(tǒng)計時間段結束之前處于“刪稿”等異常狀態(tài)的稿件。
第8條 依據虛擬歌手(軟件歌手)的名稱進行自動識別、收錄:
a) 要求名稱出現在稿件視頻的標題(title)、標簽(tags)、簡介(desc)等至少一處。
b) 優(yōu)先依據標題進行虛擬歌手的識別,如果標題沒有虛擬歌手的名稱,則依據標簽、簡介進行識別。
c) 如果標題中有“COVER”(不區(qū)分大小寫)、“翻唱”或“翻調”等字樣,則只對這些字樣前的標題內容進行識別。
第9條 只對擁有漢語(中文)VOCALOID或Synthesizer V聲庫的虛擬歌手進行自動識別,并且不考慮聲庫是否公開發(fā)售。
第10條 虛擬歌手的名稱僅指官方命名,例如“洛天依”“言和”等,有以下特殊情況:
a) “初音未來”“初音ミク”均會被識別。
b) “星塵Minus”(不區(qū)分大小寫)、“Minus”(不區(qū)分大小寫)均會被識別。
第11條 如果使用無漢語VOCALOID或Synthesizer V的聲庫創(chuàng)作漢語歌曲,則不會被自動識別、收錄。
第12條 主要收錄漢語歌曲(中文曲);標題含有日語平假名、片假名的不會被自動收錄;其它語言,諸如英語、俄語、自造語等,會可能會被收錄。
第13條 不收錄轉載、搬運等稿件。
第14條 不收錄“推薦歌曲”“環(huán)繞聲”“中文字幕”等形式的稿件。
第15條 將會對虛擬歌手的團組進行統(tǒng)計,如無官方明文修改,《統(tǒng)計月報》認為“Vsinger”包括洛天依、言和、樂正綾、樂正龍牙、徵羽摩柯與墨清弦;“五維介質”包括星塵、海伊、蒼穹、赤羽、詩岸與星塵Minus。
第16條 在《統(tǒng)計月報》當期發(fā)布前,對于一些不能被程序自動識別但符合要求的特殊稿件,將會進行手動識別和收錄,這些特殊稿件包括:
a) Bilibili拜年紀(拜年祭)等不能標識虛擬歌手名稱而具有相當影響力的。
b) 無漢語VOCALOID或Synthesizer V的聲庫創(chuàng)作的漢語歌曲,并在統(tǒng)計時間段之前達到1萬播放量的。
c) 標題含有平假名、片假名而實際上是漢語歌曲,并在統(tǒng)計時間段之前達到1萬播放量的。
d) 因天鈿Daily數據庫異常,不能正確表示標題、標簽或簡介的。
第17條 在《統(tǒng)計月報》當期發(fā)布后,收到來自評論區(qū)、私信等方式進行提醒的“漏收”特殊稿件,提醒人數在3人及以上時,將會進行手動識別和收錄,并在《統(tǒng)計月報》下期發(fā)布之前修改當期內容。
第18條 本規(guī)則自2021年5月《統(tǒng)計月報》起開始實施。