Виды компьютерных систем автоматического порождения письменного текста

Все существующие сегодня системы автоматического порождения текстов условно можно разделить на две большие группы. 1- системы, работающие на основе шаблонных технологий. Они строят будущий текст, манипулируя готовыми предложениями и словосочетаниями как строительными блоками. Эти системы достаточно просты и надежны и находят широкое промышленное применение. Содержание порождаемого текста представлено в виде фрагментов текстов, созданных ранее людьми. Поэтому синтезированные тексты выглядят абсолютно естественными. Однако надо отметить, что системы первой группы работают с очень жесткими типами текстов, например, текстами деловой прозы (различными документами - характеристиками, отчетами, договорами и т. д.). 2 - компьютерные системы, работающие, на основе лингвистически мотивированных технологий. В этом случае для создания текста системе необходимы знания структуры содержания генерируемого текста, а также сложные лингвистические знания, которые позволяют выразить это содержание языковыми средствами. Для создания таких систем необходимо изучить жанровые и коммуникативные характеристики текстов, приемы организации содержания текста, языковые средства выражения связности текста, формализацию грамматики и лексических описаний. В настоящее время поэтому лингвистически мотивированные технологии находятся на стадии исследования.

 

24. Автоматическое распознавание устной речи

Если компьютер сможет распознавать и понимать речевое сообщение, звучащее на каком-то естественном языке, если он сможет говорить на том или ином языке так, как это делает человек, его возможности значительно расширятся. Он сможет: 1 - поддерживать голосовой ввод информации в различные приложения; 2 - обучать иностранным языкам; 3 - определять по голосу личность человека 4 -определять объективно эмоциональное состояние человека (летчика, диспетчера и т. д.); 5 - переводить устную речь; 6 - поддерживать обращение голосом к различным информационно-справочным системам , базам данных по телефону или через интернет; 7 - поддерживать голосовое управление различными компьютерными системами; 8 - вести в электронном виде протоколы различных заседаний, результаты медицинских обследований и т. д.

Распознавание речи компьютером - распознавание, которое подобно восприятию речи человеком в любых условиях и при общении с любым коммуникантом. Общение при помощи устной речи является самым надежным и универсальным средством коммуникации. Автоматическое распознавание речи является самым надежным и универсальным средством коммуникации. Его следует считать одной из наиболее сложных проблем технической кибернетики и искусственного интеллекта, и она в полном объеме вряд ли может быть решена в ближайшие 50 лет.

Решению этой проблемы мешают следующие факторы: 1) не существует ни теоретических представлений, ни экспериментальных данных, которые описывали бы весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов; слитно произнесенная речь обладает следующими свойствами: границы в слитной речи четко не определены; в слитной речи соседние звуки влияют друг на друга и изменяют звуковые характеристики; знаменательные слова (существительные, прилагательные, глаголы и т. д.) в основном произносятся отчетливо, в то время как функциональные слова (предлоги, союзы, частицы и т. д.) могут выговариваться не четко и даже исчезать; в голосе говорящего человека всегда присутствует экстралингвистическая информация, свидетельствующая о его особом эмоциональном, психофизиологическом состоянии, указывающая на его возраст, пол, национальность, состояние здоровья (простуженный голос) и т. д. Иногда экстралингвистическая информация может даже отрицать смысл произнесенных слов. В процессе речевого общения кроме используемых слов большое значение имеют паралингвистические средства коммуникации: фонация (характеристики голоса человека), кинесика (мимика, жесты, позы коммуникантов), проксемика (расстояние между ними), коммуникативно значимое молчание (молчание не как физиологическое состояние человека).

Исходя из вышеизложенного, сегодня автоматическое распознавание речи может осуществляться только при наложении определенных ограничений на процесс распознавания: например распознавание изолированно произносимых слов, распознавание речи с предварительной настройкой на голос конкретного пользователя, распознавание речи с опорой на небольшой заранее определенный словарь и т. д.

Промышленно реализованные системы распознавания устной речи условно можно разделить на четыре следующие группы. 1-Средства речевого управления (компьютером, его периферийными устройствами, работой различных приложений; работой бытовых приборов и т. д.); 2- Средства диктовки, позволяющие голосом вводить текстовую информацию в любые приложения (при этом введенная информация отображается на экране дисплея ); 3- Информационно-справочные системы, работающие в диалоговом режиме в качестве автоответчика (отвечают на вопросы пользователей о движении железнодорожного, морского, автотранспорта и т. д.); 4- Средства идентификации человека по образцу речи (голосовые пароли и т. д.)