Автоматический анализ текста

Проблема автоматического анализа текста не входит в число сугубо психолингвистических, однако, она не может быть решена без учёта тех знаний, которые накоплены в психолингвистике. Не рассматривая эту проблему в целом, отметим лишь следующее.

В конце XX в. количество электронных текстов и документов, существующих только в компьютерном виде, возросло многократно и потребовало развития технологий, связанных с обработкой данных. Обработка документов, созданных на естественном языке (по стечению обстоятельств аббревиатура тоже NLP — natural language processing) — это новые технологии, которые помогают нам использовать тексты и легко находить и обрабатывать документы.

К примеру, такая процедура, как резюмирование текста позволяет уменьшать его объём и сделать возможным его показ на дисплее мобильного телефона. Упрощение текста может помочь детям, пожилым людям, иностранцам легче понять текст. Для того, чтобы осуществить компрессию (сжатие) текста, необходимо применять такие процедуры перефразирования, которые учитывали бы длину, читабельность и стиль текста, не позволяя при этом исказить его смысл. Автоматический перифраз — это своего рода машинный перевод в рамках одного языка. К тому же способность к перефразированию тесно связана со способностью понимать речь (вспомните задание из учебников по родному и иностранному языку: «Перескажите текст своими словами»).

Считается, что если может быть создана система, способная излагать текст иными словами, то можно утверждать, что такого рода система «понимает» текст, что, в свою очередь, очень важно для решения проблемы искусственного интеллекта (artificial intelligence). Одним из самых известных примеров подобной системы является программа «Элиза», общение с которой моделирует общение с психотерапевтом. Одна из модификаций этой программы PC Friend ECC Eliza (V 3.65) может представляться (36), повторять вопросы, требуя уточнений (37-39), просит сменить тему, если она не может её продолжить (40), задаёт ироничные вопросы(41), чем очень напоминает поведение человека.

Многие подобные разработки связаны с проблемой распознавания речи и перевода её, допустим, из устной в графическую форму. Применение подобных разработок имеет большие перспективы для создания интерактивных систем взаимодействия человека и машины (к примеру, для создания электронных секретарей, компьютерных психотерапевтов и пр.). В целом данная тема настолько широка, что мы отсылаем208


 

(36) / am your computer psychologist. Type in your problem, please. Я ваш компьютерный психолог. Расскажите, пожалуйста, о своих проблемах.
(37) Hey, I need more information then that. Мне нужно больше информации об этом.
(38) Can you say more about this subject? Не могли бы Вы сказать ещё что-нибудь по этому поводу?
(39) What do you mean when you say ...?■ Что Вы имеете в виду, когда говорите ...?
(40) Let us change the subject. Давайте сменим тему беседы.
(41) Are you saying «no» just to be negative? Вы говорите *нет* только для того, чтобы проявить свой негативизм?

читателей к специальным работам, многие из которых имеют исключительно прикладной характер.