Искать реферат        
Рефераты на 5 с плюсом
С нашим сайтом написать реферат проще простого

Морфологический анализ

Категория: Лингвистика     версия для печати   

Страница: [1] [2] [3] [4] [5]

Прежде чем перейти к описанию общей схемы, остановимся на некоторых терминах, которыми нам придется пользоваться в дальнейшем.

Как уже говорилось, морфологический анализ — это обработка взятых отдельно словоформ. Морфологический анализ заключается в следующем: словоформа разбивается на морфемы (при условии, если такое разбиение возможно) путем поиска морфем в специальных списках,где каждой морфеме соответствует определенная информация; потом с информаций до морфем строится общая информация к словоформе.

В данном описании морфема не определяется: это объект отдельного исследования. Морфемы подаются списком. В алгоритме морфологического анализа, описывается, как морфемы взят практически те же элементы, которые считают морфемами влингвистике. Однако следует иметь в виду основные отличия двух типов:

Поскольку мы имеем дело с письменным текстом, а большинство серьезных работ — с устной речью, то деление на морфемы, которая осуществляется для алгоритма морфологического анализа, иногда не совпадает с тем , что принятый в лингвистике.

Расхождение между написанием и произношением (и,в частности, отсутствие ударения в письменном тексте) отражается также на внешнем (графическом или звуковом) стороне морфем. Морфемы, отличающиеся графически, могут иметь одинаковое звучание:-ом (ор. отл. Единственного числа) и-ам (дав. отл. Множества) в таких словоформах, как лаком — лакам или стеной — стеной. Кроме того, морфемы, имеющих разное звучание, могутсовпадать графически:-и (род.. единственного числа) и-и (наз.-знах. отл. множества) в таких словоформах, как сказки — сказки.

Алгоритм работает только с графическими формами морфем.

Поскольку во многих лингвистических трудах при делении словоформ на морфемы не всегда последовательно различают синхронический и диахронический аспекты, принятый разделение, оправданв ряде отношений, может оказаться неудобным с точки зрения автоматического анализа и перевода. В таких случаях приходится отступать от принятого деления. Например, словоформа отношение обычно делится на от-нош-Энн-я, а для алгоритма, который описывается — на отношение-я.

Мы не будем специально выкладывать здесь тех соображений, по которым принимаетсяопределенное разделение той или иной конкретной словоформы. Предложенный алгоритм морфологического анализа (в общей форме) совершенно не зависит от того, какие конкретные элементы избран как морфемы. Если принять другое деление на морфемы, это изменит лишь состав списков морфем, но не сам алгоритм. А потому временно можно считать, что, не умея точно определятьморфемы, мы ограничиваемся их эмпирическим подбором (основываясь на интуиции и требованиях перевода) и подаем их простым перечислением.

Среди морфем розризнятимемо основы и аффиксы.

Термины «основа» и «аффикс» употребляются здесь не в своем традиционном смысле. Принятое в лингвистике различение корней, основ, корневых основ и т.д.. длянаших целей является несущественным, и все это сказывается общим термином «основание». Определение этого срока мы не даем; мы подаем основы списком. Однако, можно указать такие свойства оснований:

Любая словоформа содержит хотя бы одну основу (может быть и больше).

Основы составляют подавляющее большинство морфем и многочисленны. В общелитературногоязыке количество основ достигает сотен тысяч; в текстах из специальных областей знания она уменьшается до нескольких тысяч (или десятков тысяч).

Одна и та же основа встречается в сравнительно небольшом количестве различных словоформ — от одной до нескольких десятков. < br>
От основы к общей информации до словоформы поступают значения большинства признаков,составляющих эту информацию.

Морфемы, не являющихся основаниями, называются аффиксами (т.е. не проводится традиционной разницы между аффиксами и флексиями). Аффиксы, встречающиеся перед основами, называются префиксами; аффиксы, встречающиеся позади основ, называются суффиксами. Таким образом, суффиксами считаются не только морфемы словообразования, нотакже и так называемые «тематические гласные», «с соединительные звуки» (а точнее — «буквы»), флексии и т.д.

Свойства аффиксов определенным образом противоположны свойствам основ:

аффиксы встречаются не у всех словоформах.

Аффиксы всегда составляют меньшинство морфем, их общее количество невелико: от нескольких десятков до нескольких сотен (в зависимостиот языка).

Один и тот же аффикс обычно встречается в сравнительно большом количестве различных словоформ — от нескольких десятков до нескольких тысяч и даже десятков тысяч, но никогда не меньше, чем в двух словоформах (основа может встречаться и в одной словоформе, совпадая с ней).

От аффикса к общей информации до словоформы поступаютзначение меньшинства признаков, составляющих эту информацию.

В данном описании аффиксы также подаются списком.

В процессе разработки алгоритмов, а именно — при составлении словаря, удобно задавать только аффиксы (поскольку в языках , которые мы рассматриваем, их количество относительно невелико) и, исходя из принятого списка аффиксов, выделять основания (из представленныхв тексте словоформ) посредством определенных правил.

Часть словоформы, которая остается после отбрасывания других морфем изначально словоформы, называется остатком. При анализе остаток постоянно уменьшается по мере последовательного отсечение морфем — до полного исчезновения, что означает конец анализа для данной словоформы. Например, при анализесловоформы перекомпилировать после отсечение префикса пере-остатком будет-компилировать, после отсечение основы компил-остается-юват, после отсечение суффикса-ЮВА-остаток будет-ти, и наконец, после отсечение суффикса-ти остаток исчезает и анализ заканчивается.
< br> Две морфемы, содержащие различную информацию, могут графически совпадать (полностьюили частично) друг с другом. Мы же рассмотрим лишь такие случаи совпадения, когда по крайней мере одна из морфем полностью входит в состав другой. Остальные случаи совпадения не влияют на правильность морфологического анализа и поэтому нас не интересуют.

Качестве примера полной вложенности одной морфемы в другую можно привести суффикс-ами (ор. отл. Мн.), Что полностьювкладывается в основу бус-слова ожерелье, что приводит к неправильному расписания н-ами-ст-о

Особенно важны два частных случая совпадения морфем.

а) Две морфемы полностью совпадают. Такие морфемы называются омонимическими.

Б) Одна из морфем входит в состав другой, и при этом существует некоторая единица, которая начинается с меньшейморфемы, но позволяет вложения и большей (той, что включает) морфемы. Тогда мы говорим, что эти морфемы сопряженные друг с другом.

Вложения одних морфем в другие, и, в частности омонимия и сопряженность морфем создают определенные трудности морфологического анализа.

Основные моменты

Страница: [1] [2] [3] [4] [5]

версия для печати

Читайте также:
Изменения в украинском правописании в наше время
Внутренний аудит затрат предприятия общественного питания
Управления природопользованием и охраной природы и их планированием
Туптало Даниил Саввич (Димитрий Ростовский) 1651-1709 святой; писатель, церковный и культурный деятель
Педагогические идеи Януша Корчака