
78
гих вариантов на некоторую пороговую величину
Θ
. Затем этот вариант посту-
пает на вход следующей ступени преобразования, где последовательность таких
признаков образует пространство описания Х2.
На втором уровне происходит распознавание фонем Х2. С этой целью
классификатор D2 использует информацию на участке типа открытого слога,
границы которого определяются сегментатором С2. Для сокращения чиста воз-
можных вариантов некоторой фонемы используется информация, содержащаяся
в описании Х2, а затем, если необходимо, и информация из M2 о структуре по-
следовательности фонем. С этой целью блоком Н2 формируются последователь-
ности наиболее вероятных вариантов фонем и, с учетом всех этих априорных и
апостериорных сведений, выбираемся наиболее вероятная последовательность.
Если разность вероятности этой избранной последовательности и любой другой
превышает некоторый порог
Θ
, то фонемный код слога передаётся на вход сле-
дующего блока. В противном случае категорического решения не принимается, и
запоминаются коды фонем XI нескольких (наиболее вероятных) слогов. Если же
этих вариантов слишком много, то можно повторить процедуру, вызвав по линии
Ql – Q2 на вход блока другой вариант признаков Х2.
Для распознавания слов из словаря Х0 пространство Х3, кроме кодов фо-
нем, должно содержать информацию и об ударениях. Сегментатор С3 осуще-
ствляет членение речевого потока на участки, от ударения до ударения. В двух
таких соседних участках содержится, так минимум, одно слово словаря Х0. По-
иск нужного слова и одновременное определение его границ может осуще-
ствляться с помощью алгоритма Лисенко [10]. Па этом этапе, как и раньше при
выборе решения могут использоваться дополнительные априорные сведения из
М3 об элементах словаря (блок Н3) и, если окажется необходимым, осуще-
ствляется вызов (по линии Q2 – Q3) на вход Х3 других вариантов фонемных по-
следовательностей.
В отличие от этого в схеме с параллельно работающими блоками (рис 3.4)
на вход второго уровня передаётся одновременно несколько наиболее вероятных
вариантов признаков X1. В каждой из
α
ветвей классификатор D2
α
устанавливает
принадлежность вектора X2
α
одной из фонем алфавита Х2.
Наиболее вероятные гипотезы передаются супервайзерами q2
α
на вход су-
первайзера Q2, который функционирует так же, как и Q2 в последовательном ва-
рианте. Аналогичны особенности работы и параллельно работающих блоков
третьего уровня распознавания.
Эти схемы не противоречат известным в настоящее время фактам о вос-
приятии речи человека. Вместе с тем ясно, что дальнейшее развитие исследова-
ний в этой области приведёт как к конкретизации этих схем, так возможно, и к
необходимости их существенного изменения.
Ближайшие задачи, по нашему мнению, состоят с одной стороны, в даль-
нейшем исследовании структуры способов функционирования и взаимодействия
человеческих прототипов тех блоков, которые входят в приведённые выше схе-