Аннотация доклада (Хачукаев Э.М., Рыбин С.Ю) семинара ПИИ 12 октября 2011

Эдуард Хачукаев, Сергей Рыбин

«ОБ ОДНОЙ ТЕХНОЛОГИИ ЭВРИСТИКО-СМЫСЛОВОЙ ОБРАБОТКИ ЕСТЕСТВЕННОЯЗЫЧНЫХ ТЕКСТОВ»

Научно-Производственная Компания «ДИАЛИНГ»

cybersophy@yandex.ru

Аннотация

В докладе обсуждаются вопросы, относящиеся к тематике МОТ (Машинной Обработки Текстов), в частности, рассматривается задача анализа естественноязычных документов электронного формата (ДЭФ) компьютерными средствами и способами. Известно, что свою солидную лепту в дело покорения этой, как выяснилось впоследствии, весьма трудной вершины внесли и представители советской и российской научной школы кибернетической лингвистики (Поспелов, Мельчук, Апресян, Осипов и другие), которыми за эти годы было создано достаточно большое количество различных методологий и инструментов, предназначенных для облегчения в той или иной степени умственного труда по анализу текстов на естественных языках (ТЕЯ).

Актуализируется, что главным непреодолимым препятствием на пути разработчиков неизменно вставала проблема извлечения смысла из ТЕЯ подобно тому, как это делает человеческий разум, поскольку никакие известные средства и способы из области лингвистики, кибернетики и других научно-цисциплинарных направлений, включая даже современную нейробионику, не позволяли этого сделать. Основная трудность здесь заключалась в том, чтобы формализовать смысл, закладываемый индивидуумом в вербальное или эпистолярное изложение своих мыслеформ, до вида и уровня, необходимого и достаточного для эффективного оперирования компьютером.

Постулируется, что с целью преодоления проблемы формализации смысла и знаний авторы разработали специальный аналитический инструмент, основанный на Биквадратной Логике, и попытались применить его для обработки стандартных ДЭФ, как ТЕЯ. Результаты апробации показали, что на выходе после процедурных действий получаются выражения, весьма точно моделирующие смысл и знания, заключенные в анализируемых текстах. Данный способ «осмысления» и инструмент для его реализации зарегистрирован и депонирован в Российском Авторском Обществе за №12018 от 18 июня 2007 года.

Описывается, что на основе предложенной методики и средства для её осуществления построена Технология Эвристико-Смысловой Обработки Текста (ТЭСОТ), призванная извлекать смысл из ТЕЯ в формализованном виде и находить искомые знания по запросу на естественном языке.

Для показа потенциальных возможностей ТЭСОТ авторами изготовлена специальная демонстрационная версия компьютерной программы, названная ДУМБОТ (от ДУМающий роБОТ), способная вести диалог со своим собеседником на русском языке.

 

Дополнительная информация