LINUX.ORG.RU

OmegaT: сегментирование перевода


0

1

Кто-нибудь пользовался этой программой? Можно ли сделать сегментацию не по предложениям, а по отдельным словам, по фразам?

Читал руководство, но страницу по сегментации включить забыли. Буду очень признателен, если дадите хороший ман с примерами использования программы, то руководство, которое идет с пакетом, мне кажется недостаточно полным.

Deleted

Давно не пользовался, но насколько помню руководство, там вроде упоминалось, что сегментирует оно только по предложениям. На самом деле это не сильно мешает жить, так как в настройках можно указать степень приблизительности предлагаемых совпадений. При достаточно свободных настройках предлагаются варианты, где совпадают отдельные фразы. А сегментация по словам не нужна, для слов там подключается глоссарий. Вроде на сайте были ещё и дополнения, добавляющие удобства пользования всем этим непотребством.

massimus ★★★
()
Ответ на: комментарий от massimus

А сегментация по словам не нужна, для слов там подключается глоссарий.

Ага, то есть сегментация - это просто разбиение текста для удобства перевода, а занесение шаблонов перевода происходит в глоссарий?

Deleted
()
Ответ на: комментарий от Deleted

Сегментация — это разбиение на единицы, которые сравнивает программа. Соответствия сегментов хранятся в памяти переводов (её можно объединять, наращивать, подключать к новым проектам).
А глоссарии просто помогают не переводить по-разному одни и те же слова. Если у тебя, например, в проекте «chest» — всегда «сундук» и никогда «грудь», то такие вещи добавляются в глоссарий и в дальнейшем программа их предлагает для подстановки.
Вообще там не бог весть какая наука, проще всего начать что-то делать и на практике разобраться.

massimus ★★★
()
Ответ на: комментарий от massimus

У меня в переводе встречаются фразы, которые можно перевести по шаблону, но повторения целых предложений встречаются редко. Имеет ли вообще смысл использовать эту программу? Сейчас у меня перевод ускоряется в OpenOffice при помощи автозамены (например, по первым буквам фразы: ":at" => «according to», ":code" = «the Civil Code of the Russian Federation»)

Deleted
()
Ответ на: комментарий от Deleted

В отдельном переводе вообще редко имеет смысл использовать CAT (хотя в юридических с кучей однотипных оборотов — может быть). Такие вещи помогают, когда много однотипных проектов.
На отдельных проектах проще обходиться автозаменой и автодополнением в том же ООо и других редакторах.

massimus ★★★
()
Ответ на: комментарий от massimus

так он вроде «опыт переводов» других текстов позволяет подключать?

даже утилита есть генерящая «опыт» из оригинального текста и его перевода.

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

^ http://www.linux.org.ru/jump-message.jsp?msgid=5634358&cid=5634464

Соответствия сегментов хранятся в памяти переводов (её можно объединять, наращивать, подключать к новым проектам).


Да, я это уже упоминал. А в чём вопрос? Это не меняет того, что память переводов не помогает на одиночных небольших проектах.

massimus ★★★
()
Ответ на: комментарий от massimus

А в чём вопрос?

Просто не разобрался, как сделать так, чтобы отдельные куски текста переводились автоматически.

Deleted
()
Ответ на: комментарий от massimus

Ну не знаю... по моему скромному мнению если можно перегнать перевод профи и пользоваться его словарем и фразами, по моему это прекрасно облегчает работу над текстом любого размера.

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Дело не в размере, дело в тематике. При одиночном заказе, скажем, медицинской тематики память юридической тематики ничем не поможет, будь она сколь угодно огромной. Все CAT полезны только на большом объёме однотипного материала, желательно сильно формализованного или стандартизированного.

если можно перегнать перевод профи и пользоваться его словарем и фразами


А вот чужой базой переводов я вообще стал бы пользоваться только в том случае, если её предоставляет заказчик (и то постарался бы отбрыкаться, слишком часто напарывался на неприятные дилеммы: либо переводить хорошо, либо в соответствии с предыдущими корявыми переводами).

перевод профи


Вообще программы типа OmegaT для непрофи не очень-то нужны. Это не промт и не словари, это инструмент полуавтоматизации при переводе больших объёмов похожих текстов.

massimus ★★★
()
Ответ на: комментарий от massimus

> Вообще программы типа OmegaT для непрофи не очень-то нужны. Это не промт и не словари, это инструмент полуавтоматизации при переводе больших объёмов похожих текстов.

Ну не знаю, я свободно понимаю три иностранных, но _переводить_ (а не говорить) с родного на них вообще не рискую здоровьем (ну и нужда не заставляет :).

А «с них на родной»: В словари в общем, переводя «с ихнего на наш», я не заглядываю совсем.

Но вот о таком «тезаурусе» (даже не знаю как его назвать :) просто жалею что не знал раньше.

Понимание чужого языка (с любыми нюансами смысла) совершенно параллельны в моем случае умению перелопачивать конструкции одного языка в конструкции другого языка.

И да меня интересует перевод технических текстов... Художественное я читаю просто так _без_перевода_ (как не парадоксально :)

PS Административные бумаги (перевод «с бюрократического на бюрократический») наверное без такой штуки вообще неподъемные даже если язык знаешь как родной :(

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

>Но вот о таком «тезаурусе»

Ну не тезаурус это. Просто тупая подставлялка похожих предложений из прежних переводов.

интересует перевод технических текстов


«Интересует» или «приходится переводить большие объёмы»? Omega поможет только во втором. Если просто читать, то это скорее словари плюс гугл в запутанных случаях.

PS Административные бумаги ... наверное без такой штуки вообще неподъемные ...


Да, для таких задач CAT незаменимы.

massimus ★★★
()
Ответ на: комментарий от massimus

> Если просто читать, то это скорее словари плюс гугл в запутанных случаях.

Надо мне подналечь на родной язык :) еще раз попробую: я читаю свободно (словари не нужны), вот перевожу с трудностями (пытаюсь смысл передать при переводе наверное :).

Перевожу я «незаденьги», перевожу большие документы. Счел бы за большую помощь если такая программа найдет все похожие по структуре предложения и покажет. Если при этом в эту систему удастся утоптать удачный чужой перевод аналогичной книги, и использовать как помощь в переводе, вижу большой профит.

Насколько тупо там подбирается аналог предложения которое надо перевести я пока не знаю. Если плохо --- печально.

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

>я читаю свободно (словари не нужны)

Под словарями я подразумевал специализированные по теме перевода, а не иностранно-русские.

Надо мне подналечь на родной язык :)


Мне, кажется, тоже :)

перевожу большие документы


Да, скорее всего поможет.

Если при этом в эту систему удастся утоптать удачный чужой перевод аналогичной книги


Если таковой существует, то да. На сайте были какие-то рецепты быстрой перегонки готовых переводов (то ли скрипты-автоматы, то ли программы для ручного выравнивания параллельных текстов), плюс формат этой памяти, насколько я помню — несложный xml, можно приспособиться.

Насколько тупо там подбирается аналог предложения которое надо перевести я пока не знаю. Если плохо --- печально.


Оно сравнивает процент совпадений слов в предложении. Если текст сильно стандартизированный (договор, лицензия, техпаспорт и т. д.) — имеет смысл настраивать на более жёсткое соответствие. Если текст более вольный (книга, статья) — лучше для предлагаемых соответствий выставлять процент пониже, чтобы отдалённо похожие выдавались тоже, а то разница в построении фраз может лишить нужной подсказки.

Только надо иметь в виду, что в отличие от гуглотранслейтов, промтов и прочих систем автоматического перевода CAT не пытается анализировать скормленный ей текст, не проводит разбор предложений, а тупо сравнивает количество совпадающих слов. Это инструмент человека-переводчика, а не его заменитель.

P. S. Сам Омегу больше года не использовал, в каком состоянии программа сейчас — не знаю. Если где соврал, простите :)

massimus ★★★
()
Ответ на: комментарий от psv1967

(пытаюсь смысл передать при переводе наверное :).

Вообще-то перевод и есть передача смысла высказывания на одном языке на другой язык.

перевожу большие документы. Счел бы за большую помощь если такая программа найдет все похожие по структуре предложения и покажет.

Именно для таких ситуаций и предназначены программы, работающие с накопителями переводов, одной из коих является OmegaT.

Если при этом в эту систему удастся утоптать удачный чужой перевод аналогичной книги

Для этого нужно иметь оригинал этой самой книги, этот самый чужой перевод и провести с ними так называемое «выравнивание» (по-английски — «alignment»). Сама OmegaT функции выравнивания не имеет, но существует валом выравнивателей, в том числе бесплатных и свободных, ищи [1].

OmegaT позволяет использовать машинный перевод через гуглопереводчик, Apertium и Белазар (последний — для пары белорусский-русский), а также подключать словари StarDict или DSL.

В общем, успехов!

[1] Начинай с этой страницы Марка Прайора: http://linuxfortranslators.org/align.html

gabix
()
Ответ на: комментарий от gabix

> Вообще-то перевод и есть передача смысла высказывания на одном языке на другой язык.

да да :)

Начинай с этой страницы Марка Прайора: http://linuxfortranslators.org/align.html

спасибо

psv1967 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.