Python
端点检测 标签描述

语音激活检测(VoiceActivity Detection,VAD):也称为端点检测,目的就是要找到音频信号的开始和结束位置。 时域方法: 音量:只用音量来进行端点检测,是最简单的方法,但是会对清音造成误判。 音量和过零率:以音量为主,过零率为辅,可以对清音进行较准确的检测。 这里介绍第二种方法,结合音量和过零率的语音激活检测方法:  以高阈值tu为标准,决定端点,作为初始端点; 将端点前后延伸到低阈值tl处(如下图N1、N2点); 再将端点前后延伸到过零率(tzc)处,以包含语音中的清音部分。 图中tl的范围是完全包含了tu的范围。为什么还需要第一步,因为仅...