Энергия может служить хорошей мерой отличия вокализованных и невокализованных участков речи. Энергия невокализованных участков речи намного меньше, чем вокализованных.

Иной способ обнаружения вокализованных и невокализованных участков речи основан на измерении среднего числа переходов через нольречевого сигнала. Это измерение является грубой оценкой частотного состава речевого сигнала. Известно, что энергия вокализованных звуков концентрируется в диапазоне ниже кГц, тогда как энергия фрикативных звуков сосредоточена, в основном, на частотах выше кГц. Поэтому, если среднее число переходов через ноль велико, то это свидетельствует о невокализованном характере речи, и наоборот.

Важной задачей анализа речевых сигналов во временной области является оценивание периода основного тона. Период основного тона может быть определен как временной интервал между соответствующими пиками вокализованного участка речевого сигнала. Однако главная трудность здесь состоит в том, что даже на коротких интервалах времени речевой сигнал не имеет строгой периодической структуры.

Иной способ определения периода основного тона во временной области основан на вычислении функции кратковременной автокорреляции:

, ,(2)

где – максимальная задержка сигнала.

При выявлении периода основного тона по автокорреляционной функции необходимо учитывать условие . Для вокализованных участков речи на графике прослеживаются пики с интервалом, равным периоду основного тона.

С целью обострения пиков на графике сигнал клиппируют. Суть этой нелинейной операции показана на рис. 1,а. На рис. 1,б представлена автокорреляционная функция клиппированного сигнала.

 

а) б)