LINUX.ORG.RU

Вышла версия 0.4.0 переводчика


0

0

Выходит в свет очередная версия переводчика "Правда". Новая версия очень сильно (можно сказать революционно) отличается от предыдущей. Во-первых, теперь человек может значительно больше вмешиваться в процесс перевода, во-вторых программа во время работы становится умнее, приспосабливаясь к тематике текста. В-третьих теперь сохраняется логическая структура текста (заголовочки параграфы и т.п.) Наша программа срывает покров мистики с машинного перевода и делает его обычной задачей (как какой-нибудь текстовый редактор).

>>> Подробности



Проверено: Shaman007 ()
Ответ на: комментарий от han

Вышла версия 0.4.0 переводчика "Правда"

Контекстное значение слов. Никогда невозможно подобрать слово, которое имеет точно такое же значение как в исходном языке. Все время переводчик вынужден либо расширять, либо сужать значение переводимых слов. Например, в языке Эсперанто нет слова "карандаш". Есть слово "skribillo". Но "skribillo" - это орудие для письма, то, чем пишут, это может быть и ручка и карандаш и даже малярная кисть. При переводе с Эсперанто можно сказать по- русски "писало". Это будет абсолютно точный перевод, но это слово очень непривычное для русского языка. Читатель будет спотыкаться на этом слове. При переводе на Эсперанто (если нужно сказать именно про "карандаш" а не про "ручку" нужно как-то уточнить значение, например сказать "грифельное скрибилло".

Это будет правильно... но только если человек имел в виду именно орудие для письма, а не маленькую деревянную палочку, которую можно использовать для разжигания костра, забивания в отверстие в качастве пробки, или электрическое сопротивление графитного сердечника.

Эээ... цветной карандаш - это карандаш или нет? А фломастер? А штуковина с металлическим корпусом и графитовым грифелем?

Нуу... не знаю, я какой язык отражает все эти ньюансы...

Вот по-этому в версии 0.4.0 появился контекстный словарь. То есть словарь, в котором переводчик (человек) может задавать как в этом конкретном тексте переводить то или иное слово. А логлан и подобные ему подходы в 100 раз тяжелее по трудозатратам. При этих подходах каждому слову надо задать все его смыслы - "вода" это и "море" и "химическое вещество" и "теплоноситель" и "то что можно пить" и "то, чем можно пожар тушить", и "то, что красиво сверкает в водопаде". Может быть через сто лет такие подходы и сыграют...

Beria
() автор топика
Ответ на: комментарий от Beria

> языков, которые участвуют в переводе. Я знаю, что есть логлан, но он
> мне "не нравится". Во-первых он сложный. Намного сложнее Эсперанто.
> Во-вторых (это субьективно) я не люблю позиционных языков.

Во-первых, имеет смысл говорить все же о ложбане, как о дальнейшем
развитии логлана.

Во-вторых, в грамматике эсперанто просто делается немало "очевидных" для
европейцев допущений. Грамматика ложбана может восприниматься как более
сложная просто по причине своей строго формализованной однозначности.

> знаю, что в логлане пустые позиции заполняются, но все равно "не
> нравится". В-третьих, я не понял, является ли он надьязыком или это
> очередная вариация на тему "давайте сочиним еще один английский"?

Ни то, ни другое. Просто строгий язык, не допускающий таких
вольностей, как синонимы, неоднозначные грамматические конструкции
etc. Как следствие - язык, который имеет строгое формальное
описание, и который легко парсить =)

> Ну и в-четвертых (и самое главное) Помогает ли логлан от
> многозначности слов естественного языка?

Да, помогает. Имхо это как раз основная проблема, которую он решает.

int19h ★★★★
()
Ответ на: Вышла версия 0.4.0 переводчика "Правда" от Beria

С одной стороны, Вы правы, действительно, использование промежуточного языка задача гораздо более сложная. И возможно даже, именно с разработки такого языка, и нужно начинать при подобном подходе если адекватного ещё ничего нет.

С другой стороны, сейчас Вы работаете над словарём английский->русский и эсперанто->русский (не знаю, двунаправленные у вас словари или нет), труд адский, но что самое обидное, когда у Вас уже будет хорошая система русский<->английский и русский<->эсперанто добавить к этой системе французский будет ни чуть не легче. Если же нужна система перевода из любого языка в любой, то объём и сложность работы с каждым новым языком будет только возрастать, а как её параллелить толком не понятно. Да и возможность помощи от нероссийской части сообщества не ясна.

Кажется, что разработка сообществом системы с промежуточным языком, и возможно самого языка, была бы наиболее ценна. К тому же, это позволило бы вовлечь в проект не только российских участников.

Впрочем, я уже углубился в рассуждения далеко за пределы "Правды"...

han
()
Ответ на: комментарий от han

С точки зрения "Правды" логлан и ложбан такие же языки как и любые другие. Можно попробовать перевод в две стадии (текст в текст). Английский(или любой другой язык)->ложбан и ложбан->русский. Делать это пока вручную (переключая направление через меню). Если результат будет хороший, можно эти две стадии "спрятать" от пользователя. Для этого нужно то же самое, что и для любого другого направления перевода - словарь и грамматика. Не обязательно делать большой словарь - достаточно двух тысяч слов. Кто возьмется? Я не возьмусь - так как считаю это направление менее перспективным :-) Готов поставить ссылку на этот проект.

Таки расскажите как ложбан борется с многозначостью слов? А то у меня даже при переводе с Эсперанто получается "сьезд торчащих эсперантистов". Ах! не "торчащих", а "выдающихся" :-)

А я бы в качастве промежуточного языка взял усовершенствованный Эсперанто. Его любой программист за три месяца изучить может. Проверенно лично.

Beria
() автор топика
Ответ на: комментарий от Beria

> Таки расскажите как ложбан борется с многозначостью слов?

Не поверишь: их отсутствием =)

> А я бы в качастве промежуточного языка взял усовершенствованный
> Эсперанто. Его любой программист за три месяца изучить может.
> Проверенно лично.

Ложбан программист может изучить за пару недель. Если знаком с Прологом
- вдвое быстрее.

int19h ★★★★
()
Ответ на: комментарий от int19h

Вышла версия0.4.0 переводчика "Правда"

> Ложбан программист может изучить за пару недель. Если знаком с Прологом - вдвое быстрее.

Это что, вместе со словами? Потому что фундаменто Эсперанто вообще на одном листочке А4 помещается. Но это только грамматика.

Beria
() автор топика
Ответ на: комментарий от Beria

>С точки зрения "Правды" логлан и ложбан такие же языки как и любые другие. Можно попробовать перевод в две стадии (текст в текст).

Вообще да, тоже вариант, однако, процессы перевода на над-язык и с над-языка могут и отличаться. Так, что возможно, там словари надо будет несколько иные, чем между обычными языками.

Неуверен, что логлан и ложбан подойдут на роль над-языка, перевод с этих языков будет проще, чем с естественных, что Вы сами отмечаете с эсперанто, чему способствует структура и отсутствие многозначности. Но сумеет ли он (логлан, ложбан, эсперанто) уместить в себе смысл, заложенный в любом другом языке? А это очень серьёзный вопрос для определения пригодности к данному применению. Возможно, что такой язык ещё предстоит разработать. С другой стороны, для такого языка, например, совершенно не важна фонетика.

>Кто возьмется? Я не возьмусь - так как считаю это направление менее перспективным

Я тоже не возьмусь, т.к. мои языковые познания для этого явно не достаточны.

han
()
Ответ на: Вышла версия0.4.0 переводчика "Правда" от Beria

> Это что, вместе со словами? Потому что фундаменто Эсперанто вообще на
> одном листочке А4 помещается. Но это только грамматика.

Смотря сколько слов нужно, очевидно. Однако определенно дольше, чем
эсперанто, т.к. в последнем много знакомых для европейцев корней.

int19h ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.