На сайте 100500 рефератов в 150 категориях	Искать реферат
Рефераты на 5 с плюсом С нашим сайтом написать реферат проще простого

Исследователи автоматического перевода В. Ингве, Д. М. Йейтс, М. Мастерман

Категория: Компьютерные науки

версия для печати

Страница: [1] [2] [3] [4] [5] [6]

Национальный университет "Киево-Могилянская Академия"

Реферат

на тему:

"Исследователи автоматического перевода В. Ингве, Д. М. Йейтс, М. Мастерман, Е. фон Глазерсфельд: их труда и вклад в развитие автоматического перевода"

Выполнила

студентка ДКТ-5

Фиялко Светлана

Киев-1999

Содержание:

TOC "zag1; 1" Вычислительные машины и перевод. В. Ингве PAGEREF _Toc467148765 h 3

Модель синтаксической структуры российской фразы и алгоритм синтеза английского при автоматическом переводе. Д. М. Йейтс. PAGEREF _Toc467148766 h 7

"Мультистор" - система корреляционного анализа для английского языка. Э. фон Глаузерсфельд PAGEREF _Toc467148767 h 12

Полуавтоматический перевод с английского на французский язык: система "Человек - машинный тезаурус". М. Мастерман PAGEREF _Toc467148768 h 17

Вычислительные машины и перевод. В. Ингве

Нимецикий исследователь автоматического перевода Виктор Ингве считал, что для преодоления трудностей при переводе нужно тщательно изучать морфологию и синтаксис соответствующих языков, а также разрабатывать полный перечень элементарных единиц каждого языка.

Описание языка должен быть статичным, а программа для вычислительной машины - динамичной. Поэтому В. Ингве предлагал, чтобы данные о языковых фактах вводились в машину в виде перечней или таблиц - отдельно от программы, которая ориентирована на обработку этих данных. Такое распределение является удачным потому, что уже существуют созданные лингвистами описания различных языков.

В своей работе по генерации английских предложений, он использовал традиционные методы описания языка. В частности для описаний синтаксиса была применена модель непосредственно составляющих (предложения последовательно делится на все меньшие части: сначала выделяется группа подлежащего и сказуемого, каждая из которых, в свою очередь, состоит из двух или более частей; деления продолжается пока не дойдем до слов или морфем) .

В данной работе описание языка подается в четырех таблицах и ориентирован на порождение английских фраз с помощью универсальной вычислительной машины. Машина порождает фразу, двигаясь от узла к узлу. На каждом шагу есть рабочий узел, который определяет следующий шаг. Если рабочий узел изображен в виде круга, то это означает наличие нескольких равноправных альтернатив, и машина делает выбор с помощью таблицы случайных чисел. Если рабочий узел изображен в виде ромба, то следующий шаг определяется однозначно. Если рабочий узел представленный в виде квадрата, то за следующий рабочий узел выбирается узел, расположенный слева под ним, а тот, что справа - запоминается. Если рабочий узел - треугольник, то принцип действия тот же, что и с квадратом, но узел, запоминающийся используется в более поздних преобразованиях. Каждое слово в прямоугольнике - это слово фразы; после размещения этого слова в тексте выираеться новый рабочий узел.

Многие фразы, которые порождаются этой программе бессмысленны, поскольку данная программа порождает только грамматически, а не семантически правильные фразы. Однако она является удобным средством для проверки точности лингвистического описания языка. Если некоторые порожденные фразы - грамматически неверные, таблицы можно изменять и исправлять. Если бы эта программа была приспособлена для перевода, то выбор слов зависел бы от переводимого текста.

С помощью этой программы можно получать фразы любой длины. Это возможно потому, что выбор узла может осуществляться рекурсивно.

Начиная порождать какую-нибудь двучленного конструкцию, программа должна запоминать один узел, чтобы после порождения первого члена конструкции, породить также и печати. При этом могут быть получены фразы большой длины, и возникают значительные требования к оперативной памяти компьютера.

Существуют две структуры порождения запомненных узлов. При регрессивной структуре машина идет вниз по дереву, разворачивая узлы, например 1, 2, 3, 4 и запоминая определенное количество узлов, затем она должна вернуться, чтобы развернуть запомненные узлы. Глубина регрессивной структуры равно количеству запомненных узлов. При прогрессивной структуре машина идет вниз по дереву, не возвращаясь назад и записывая на каждом шагу в оперативную память только один узел. Машина обрабатывает узел на основной ветке дерева, затем принимается за запомненных узел, а затем вновь возвращается к основной ветви. Следовательно, рост глубины регрессивной структуры приводит к необходимости использования большего объема памяти, тогда как прогрессивная структура может иметь произвольный размер и не требовать при этом увеличение объема памяти.

Существует два решения по преодолению проблемы нехватки оперативной памяти. Первое - оснастить программу соответствующим сигнализатором, который будет сообщать о заполнении оперативной памяти. В это время должен быть ограничен выбор следующего узла таким образом, чтобы узлы, которые нужно запоминать, не появлялись до тех пор, пока не освободится память. Другая возможность - сделать грамматику таким образом, чтобы она могла порождать прогрессивные структуры произвольного размера, а регрессивные структуры - определенной длины. Однако такие ограничения неудобны, поскольку могут очень усложнить грамматику.

Для определения правильного решения были еще раз тщательно рассмотрены конструкции английского языка, и был сделан вывод, что многие свойства языка направлены на то, чтобы ограничить глубину фраз примерно до 7. С этого В. Ингве выдвинул гипотезу, что все языки имеют морфологические и синтаксические механизмы, служащие для ограничения глубины синтаксических конструкций. Кроме того, психологами установлено, что объем оперативной памяти человека также равен 7 единиц. Человек не может запомнить сразу, а затем воспроизвести более 7 случайных цифр или слов.

Одним из способов ограничения глубины конструкций в английском языке есть бинарный разделение предложения. Например, предложение делится на группу подлежащего и группу сказуемого, а уже группа сказуемого на глагол и, например, приложение. Если разделить предложение сразу на три части, то нужно запоминать не один, а два узла. Вообще лингвисты отмечают, что речь предпочитает бинарным конструкциям.

Другим способом ограничения глубины конструкций более свойственен агглютинативный языкам, является аффиксация, с помощью которой можно объединить различные элементы в одно длинное слово.

Вместе со средствами ограничения глубины конструкций английский язык имеет механизмы, позволяющие сохранять выразительность, несмотря на жесткое ограничение глубины. Таким механизмом является, например, перестановка членов предложения. Кроме того для оказания выразительности, предложения строятся так, чтобы сложную структуру перенести на конец, где она будет нуждаться запоминания на один узел меньше. Это объясняет, почему определительные придаточные предложения идут по своим существительными.

Пример порождения фразы.

START -> 103 (Simple sentense)

бьем оперативной памяти человека также равен 7 единиц. Человек не может запомнить сразу, а затем воспроизвести более 7 случайных цифр или слов.

Одним из способов ограничения глубины конструкций в английском языке есть бинарный разделение предложения. Например, предложение делится на группу подлежащего и группу сказуемого, а уже группа сказуемого на глагол и, например, приложение. Если разделить предложение сразу на три части, то нужно запоминать не один, а два узла. Вообще лингвисты отмечают, что речь предпочитает бинарным конструкциям.

Другим способом ограничения глубины конструкций более свойственен агглютинативный языкам, является аффиксация, с помощью которой можно объединить различные элементы в одно длинное слово.

Вместе со средствами ограничения глубины конструкций английский язык имеет механизмы, позволяющие сохранять выразительность, несмотря на жесткое ограничение глубины. Таким механизмом является, например, перестановка членов предложения. Кроме того для оказания выразительности, предложения строятся так, чтобы сложную структуру перенести на конец, где она будет нуждаться запоминания на один узел меньше. Это объясняет, почему определительные придаточные предложения идут по своим существительными.

Пример порождения фразы.

START -> 103 (Simple sentense)

Страница: [1] [2] [3] [4] [5] [6]

версия для печати