Искать реферат        
Рефераты на 5 с плюсом
С нашим сайтом написать реферат проще простого

Морфологический анализ

Категория: Лингвистика     версия для печати   

Страница: [1] [2] [3] [4] [5]

Предположим, что весь процесс анализа при автоматического перевода разделяется на два основных этапа: морфологический анализ и синтаксический анализ.

Под морфологическим анализом понимают полную обработку взятых отдельно (без всякого н ’связи с контекстом) словоформ. В результате такой обработки каждая словоформа заменяетсятак называемой информацией — цепочкой символов, определяющих все те свойства данной словоформы, которые необходимы для дальнейшего анализа (и последующего перевода). Информации до словоформ используются на втором этапе анализа — при синтаксического анализа, в результате которого устанавливаются связи между всеми словоформами текста и между частями сложныхпредложений.

Морфологический анализ — основной инструмент морфологических процессоров. Создание полнофункционального морфологического процессора невозможно без детального понимания принципов морфологического анализа.

За годы существования автоматического перевода были созданы алгоритмы морфологического анализа для многих языков. Естественно, что эти алгоритмы имеютмного общего. Однако имеют место также и значительные различия, обусловленные свойствами строения соответствующих языков, а также разными подходами.

Возникает естественное желание обобщить опыт, что накоплен в этой области. В частности, желательно ответить на такой вопрос: нельзя ли выделить в алгоритмах морфологического анализа стандартные части, повторяющиесяво многих алгоритмах? Нельзя ли на базе стандартных частей, выделено, разработать для алгоритма морфологического анализа такую ??совместную форму, чтобы она подходила (без существенных изменений) для многих языков? Нельзя ли, наконец, установить связь между свойствами конкретных языков и деталями алгоритмов морфологического анализа таким образом, чтобы общую формуалгоритма можно было приспособить к какой конкретной языка согласно правилам, что указано заранее (эти правила могут быть примерно такими: "По определенного свойства языка из общей формы нужно (не нужно) взять определенный элемент и т.д. .«)?< br>
Ниже делается попытка дать положительный ответ на эти вопросы.

Общая форма морфологического анализатекстов

Некоторые ограничения

Общая форма морфологического анализа, о которой идет речь, не является абсолютно всеобщей. Ее «всеобщность» ограничено определенным кругом музыка и определенным типом алгоритмов.

Ограничения относительно языков заключается в том, что общая форма морфологического анализа предназначена только для суффиксально-аффиксальных языков (индоевропейских, финно-угорских,тюркских и т.д.).. Исключаются языка с развитой внутренней флексией (семитские) и инфиксации (вроде ряда индонезийских).

Кроме того, для языков, в которых словоформы вообще не делятся на морфемы (так называемые «изолирующие» — вроде в вьетнамской ), морфологический анализ полностью сводится к поиску в словаре, а остальные операции, предусмотренныев общей схеме алгоритма морфологического анализа, для «изолирующих» языков не нужны.

Ограничения относительно типа алгоритмов заключается в том, что общая форма морфологического анализа охватывает лишь такие алгоритмы, в основе которых заключается разбиения словоформ на морфемы от начала до конца (для языков с латинским и кириллической графикой — слева направо). Возможендругой подход, при котором разбиение словоформ начинается с конца. Лучшим решения связью, очевидно, было бы обобщение и гибкое сочетание обоих подходов.

Терминология

Страница: [1] [2] [3] [4] [5]

версия для печати

Читайте также:
Архитектура Львова
Методы обучения в системе формирования профессиональных качеств молодого руководителя школы
Охота
Путь к социальной работе
Пути выхода из экологического кризиса