Ai工匠學堂WeNet語音識別實戰(zhàn)(第3期)
2023-08-08 16:10 作者:bili_93891819972 | 我要投稿
char data[4]; // "data"
unsigned int data_size;
};
這里存在的一個風險是,如果WavHeader中存放的元信息有誤,則會影響到語音數(shù)據(jù)的正確讀入。
2)特征提取
WeNet使用的特征是fbank,通過FeaturePipelineConfig結(jié)構體進行特征設置。默認幀長為25ms,幀移為10ms,采樣率和fbank維數(shù)則由用戶輸入。
用于特征提取的類是FeaturePipeline。為了同時支持流式與非流式語音識別,F(xiàn)eaturePipeline類中設置了input_finished_屬性來標志輸入是否結(jié)束,并通過
標簽: