|
Тема |
корекция [re: Pixel] |
|
Автор |
b33 () |
|
Публикувано | 19.03.01 21:18 |
|
|
Първо, съществено е какво преобразувание ще се използва. Линейните преобразувания по различен начин свиват или разтягат или проектират пространството по някои координати, или го завъртят около началото. По този начин се деформира областта (под-множеството) в което попада отделна фонема (или feature). Ясно е защо преобразуванията са важни.
След това, граматиката и контекста, може да е в областта на искуствения интелект, но вече е реалност. Дори в Speech SDK на Microsoft има компилатор на контекстно-свободна граматика.
Системите за разпознаване на говор са реалност. Когато става дума за прости команди, има вградени системи вече и в компютрите на автомобилите. Все пак, още не е достигнато съвършенство, и тук именно може да помогне математиката. Главно, в днешно време компютрите се снабдиха с бързи процесори и много памет; може да се направи нещо повече по въпроса. Човешкото ухо едва ли е по съвършенно от аналогичните технически средства. На човека му помага семантиката (разбиране на ситуацията и разговора), че да може по-добре да разпознава говор; в никакъв случай човешкото ухо не е по съвършенно от техническите средства.
|
| |
|
|
|