LINUX.ORG.RU

Выпуск tl 1.0.6

 ,

Выпуск tl 1.0.6

3

4

tl — кроссплатформенное веб-приложение с открытым кодом (GitLab) для переводчиков художественной литературы. Приложение бьёт загружаемые тексты на фрагменты по символу новой строки и располагает их в две колонки (оригинал и перевод).

Основные изменения:

  • Плагины времени компиляции для поиска слов и словосочетаний в словарях;
  • Пометки в переводе;
  • Общая статистика по переводу;
  • Статистика сегодняшней (и вчерашней) работы;
  • В фильтре по содержимому теперь можно использовать регулярные выражения (RE2);
  • Если нажат Ctrl при создании варианта перевода, оригинал копируется в перевод;
  • Экспорт на notabenoid (и его клоны), импорт с него, обновление, сравнение;
  • Ссылки на следующую и предыдущую книгу в режиме перевода;
  • Фильтр по названию на главной;
  • Поиск и замена с предварительным просмотром изменений;
  • Плагин для поиска по уже переведённому (по всем книгам);
  • И другое.

>>> Подробности



Проверено: jollheef ()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от anonymous

А вообще, я не уверен что подобные програмки конкруентноспособны, уместны сейчас. С переводом текстов онлайн-переводчики от Гугла/Яндекса/DeepL справятся всяко намного лучше, чем любой десктопный.

anonymous
()
Ответ на: комментарий от anonymous

Человек пока справляется лучше любых автоматических переводчиков. Приложение и предназначено для человека.

opennota
() автор топика
Ответ на: комментарий от opennota

К чему эта философия - не ясно

anonymous
()
Ответ на: комментарий от anonymous

Боюсь, за такие скриншоты последует бан IRL

Deleted
()

Подозрительно рулейт напоминает...

KAEf_SAGA
()
Ответ на: комментарий от opennota

Человек пока справляется лучше любых автоматических переводчиков.

У меня есть коллега, систематически переводящая «vital records» («записи актов гражданского состояния») как «жизненно важные записи». Еще в каком-то переводе «to apply stamps» превратилось в «применять марки». Переводчиков, не утруждающих себя проверкой контекста, терминологии, сочетаемостью слов, не пытающихся понять собственный перевод на осмысленность, удручающе много. Результат местами сильно напоминает rule-based MP, и редактировать его приходится больше, чем перевод на основе статистики и нейросетей.

Кроме того, errare humanum est: люди пропускают слова, словосочетания, неправильно определяют синтаксические зависимости, путают терминологию и отдаленно похожие слова вроде emerge и immerse. Google Translate ничего не пропускает, почти всегда правильно разбирает синтаксис оригинала и отдает такое же правильное синтаксическое дерево, иногда - с потрясающе удачными трансформациями. Да, плохо подбирает слова, но смысл редко уродует полностью. В итоге отредактированный машинный перевод в среднем содержит меньше ошибок, чем полностью человеческая работа.

Bagrov ★★★★★
()
Ответ на: комментарий от Bagrov

«to apply stamps» превратилось в «применять марки»

if (to_apply_stamps == true) {
    to_apply_stamps [translate()]=> "применять марки"
}
anonymous
()

Статистика сегодняшней (и вчерашней) работы;

Экспорт на notabenoid (и его клоны), импорт с него, обновление, сравнение;

Итого, всего два преимущества над OmegaT.

Сегментации по предложениям нет. А ведь большинство художественных текстов по предложениям переводить удобнее. К слову, если она в конкретном проекте все-таки не нужна, в OmegaT ее можно отключить.

Подключения движков машинного перевода нет. Иногда они идеально справляются, и копипаста МП в этих случаях сильно экономит время. Иногда из МП можно вычленить удачную трансформацию, которая переводчику/переводчице не пришла на ум. Еще бывает полезно поглядывать в МП, чтобы убедиться, что ничего не потеряно и не пропущено.

Глоссария тоже нет. Я сейчас в свободное время перевожу Kings and Queens of England. В глоссарий добавляю имена людей и географические названия, чтобы контролировать постоянство их написания.

Где память переводов? Поэзия часто изобилует повторами. Реплики «We did it!» и «Are you OK?» кочуют из фильма в фильм. Есть фразы, которые герои South Park произносят из серии в серию. В фильме «Шоссе в никуда» диалоги написаны в намеренно избыточной манере, где ответная реплика практически полностью повторяет предыдущую.

Исходный формат - только plain text. А если нужны DOCX, RTF, ODT, LaTeX, EPUB, FB2, HTML, SRT?

В общем, пока не запилят полноценную CAT-функциональность, перед нами эталонное ненужно, которое годится разве что в качестве дипломного проекта.

Bagrov ★★★★★
()
Ответ на: комментарий от Bagrov

А ведь большинство художественных текстов по предложениям переводить удобнее.

Emphatically no.

перед нами эталонное ненужно

Мне нужно. Чините свой эталон.

opennota
() автор топика
Ответ на: комментарий от anonymous

А вообще, я не уверен что подобные програмки конкруентноспособны, уместны сейчас. С переводом текстов онлайн-переводчики от Гугла/Яндекса/DeepL справятся всяко намного лучше, чем любой десктопный.

Насколько я понимаю, это не переводчик, а TM-система, инструмент для переводчиков-людей. Это совсем разные вещи. К тому же классу программ относится упомянутая выше OmegaT.

hobbit ★★★★★
()
Последнее исправление: hobbit (всего исправлений: 1)
Ответ на: комментарий от hobbit

TM-система

Скорее, CAT - Computer-Assisted Translation. В OmegaT, конечно, фич больше, но не всем столько нужно. И вообще, не хочу обидеть разработчиков, но OmegaT сделана, по впечатлению, для роботов. Я уж не говорю про вырвиглазные шрифты, после которых хочется вымыть глаза с мылом (пять лет прошло, а воз и ныне там). А мне хотелось переводить по-человечески. Ну и вот. Сорт-оф TM у меня есть (плагин для поиска по всей базе), что-то более автоматическое в силу отсутствия сегментации по предложениям (чему, по моему глубокому убеждению, в художке не место) сделать затруднительно (не говорю, что невозможно).

opennota
() автор топика
Ответ на: комментарий от Bagrov

Подключения движков машинного перевода нет. Иногда они идеально справляются

Хотелось бы пример чуть посложнее, чем дважды два.

Еще бывает полезно поглядывать в МП, чтобы убедиться, что ничего не потеряно и не пропущено.

Это решается сверкой по готовности.

Глоссария тоже нет. Я сейчас в свободное время перевожу Kings and Queens of England. В глоссарий добавляю имена людей и географические названия, чтобы контролировать постоянство их написания.

Было бы полезно, хотя память обычно решает. А если не помнишь, можно подглядеть - хотя времени, да, уйдёт чуть больше.

Но у меня чувство, что глоссарии сильно переоценены.

anonymous
()

Есть ли возможности для регистрации пользователей и коллективной работы над переводом?

Когда-то был удобный сервис translated.by, сейчас заброшенный авторами. Давно ищу что-то подобное ему с открытым кодом, но ничего подходящего пока не обнаружил.

ivanov17
()
Ответ на: комментарий от anonymous

Но у меня чувство, что глоссарии сильно переоценены.

Судя по тому, что при отсутствии средств автоматизации их почти всегда приходится вести вручную — нет, не переоценены.

hobbit ★★★★★
()
Последнее исправление: hobbit (всего исправлений: 1)
Ответ на: комментарий от anonymous

Нет и не будет.

А смысл тогда в веб-приложении? Кроме коллективной работы, во всём остальном было бы удобнее десктопное.

hobbit ★★★★★
()
Ответ на: комментарий от hobbit

Так сложилось. И потом, ведь есть ещё мобильные платформы. Да и не назвал бы я ту же OmegaT удобной (хотя кому как, наверное).

anonymous
()
Ответ на: комментарий от anonymous

Не-а. В глоссарий ты слово один раз осознанно поместил, и дальше посматриваешь уже известно куда. Автоматический же поиск придётся делать каждый раз, когда возникает вопрос, и это сильно похоже на забивание гвоздей микроскопом.

hobbit ★★★★★
()
Ответ на: комментарий от anonymous

Да и не назвал бы я ту же OmegaT удобной

Я не настоящий сварщик, но если не ошибаюсь, под линуксом особых альтернатив-то и нет...

hobbit ★★★★★
()
Ответ на: комментарий от hobbit

Несколько лишних нажатий на кнопки - не мешки ворочать. И не перерывать сотни уже написанных бумажных страниц в поисках. Но упростить можно и нужно, согласен.

anonymous
()
Ответ на: комментарий от anonymous

Подключения движков машинного перевода нет. Иногда они идеально справляются

Хотелось бы пример чуть посложнее, чем дважды два.

Скорми Гуглу любую политику конфиденциальности. Подойдет такой пример, или нужен именно художественный текст?

Еще бывает полезно поглядывать в МП, чтобы убедиться, что ничего не потеряно и не пропущено.

Это решается сверкой по готовности.

Пожалуй, решается на уровне, достаточном для художественного перевода. Но зачем убирать контроль, который заодно экономит время?

Было бы полезно, хотя память обычно решает. А если не помнишь, можно подглядеть - хотя времени, да, уйдёт чуть больше.

Времени часто не хватает. Внимание тоже не безгранично.

Но у меня чувство, что глоссарии сильно переоценены.

В техническом, юридическом, научном переводе они незаменимы, потому что нет-нет да запляшет терминология, особенно если предметная область для переводчика нова. В некоторых околохудожественных жанрах (копирайтинг, маркетинг, научпоп) - крайне полезна. В чисто художественном - слегка облегчают работу за счет автодополнения.

Bagrov ★★★★★
()
Ответ на: комментарий от hobbit

OmegaT весьма и весьма функциональна. Особенно если скачивать с сайта проекта. Особенно если запускать на Java-машине от Oracle. Особенно бета-версия.

К слову, для совместной работы OmegaT умеет в git, но для этого проект-менеджер тоже должен уметь в git, что случается редко.

Раз пошла такая пляска, выпишу альтернативы.

  • Браузерные:
    • Matecat (LGPL, бесплатные планы на официальном сервере)
    • Google Translator Toolkit (проприетарный, бесплатный)
    • Smartcat (проприетарщина, бесплатные планы)
    • Memsource (проприетарщина, есть бесплатный план)
  • Локальные:
    • Wordfast (проприетарщина, платная десктопная версия, бесплатная веб-версия)
    • Heartsome (GPL)

Из всего этого Matecat и Smartcat, на первый взгляд, выглядят самыми жизнеспособными. А второго взгляда у меня пока нет.

Bagrov ★★★★★
()
Ответ на: комментарий от Bagrov

Скорми Гуглу любую политику конфиденциальности.

Язык законников косноязычием не испортишь, даже наоборот.

anonymous
()
Ответ на: комментарий от t184256

Тем же, чем обычный горный велосипед лучше навороченного, обвешенного всем, чем только можно, вплоть до кофеварки и щипчиков для ногтей, но с лысой резиной, неотрегулированными переключателями, с нуждающимися в доработке напильником слегонца кривыми колёсами и передвигающегося вследствие всей этой навешенной на него фигни тяжеловато качаясь и чутка вприпрыжку.

Когда базовые функции оставляют желать, зато опции торчат во все стороны, как инструменты из швейцарского ножа, дайте мне что-нибудь попроще. Мне ехать надо, а не шашечки.

Посмотрел на matecat, не впечатлён. Почему нельзя сделать удобными элементарные, базовые вещи?

opennota
() автор топика
Ответ на: комментарий от Bagrov

Раньше было нормально, сейчас когда слышу слово «нейросеть» мне представляется какой-то хайпожер с умными словечками.

baist ★★
()
Ответ на: комментарий от baist

Это не только хайповое словечко, но и вполне себе работоспособная технология, решающая нестандартные задачи. Впрочем, ты, скорее всего, это знаешь.

А так, конечно, все уши прожужжали: облако, облако, облачные вычисления, нейросеть, машинное обучение, скрам, аджайл, вотерфолл, генерируем ценность, we empower your business, большие данные, leverage тут, leverage там...

Как компания генерирует ценность и empowers clients? А вот и объяснение: мы помогаем вам leverage облако, leverage нейросеть, leverage ваши большие данные...

Bagrov ★★★★★
()
11 октября 2019 г.

Глоссарии в master появились, посмотрим на их полезность.

opennota
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.