LINUX.ORG.RU

Pet проект - перевод манги с английского на русский

 , ,


0

1

Всем привет! Пожалуй начну с фразы: «Дело было вечером - делать было нечего». И я решил начать свой пет проект, т.к. я любитель манги, мне захотелось показать свою любовь японского «исскуства» и у меня появилась идея. А почему бы не сделать ИИ перевод манги чтобы порой не сидеть в ожидании с чипсами и банкой колы в руках перевода новой главы манги… И вот я со своим помощником в лице Claude от Anthropic(мне показалось что их новая модель Sonnet справляется с вопросами по коду лучше чем ChatGPT и остальные) сели и написали(не без багов конечно) скрипт который использует API roboflow с кастомными ИИ моделями для любых нужд и перевод от Google Translator, скрипт полностью заменяет изначальный текст на изображении на перевод(в ручную или автоматически). Еще я придумал забавную фишку с парсингом страниц выходящих глав с одного англоязычного сайта(работает с костылями). Результат нашего труда можете найти на гитхабе - https://github.com/oskaridze/Manga_translation. P.S. Хотелось бы предупредить, что данный проект еще стал практическим обучением работы с git и коммитами, по этому имейте ввиду что все может быть слегка корявенько)


Был уже такой проект, одну китайскую мангу вполне сносно переводил с китайского на английский, распознавая изображения. Только вот куда то всплыл

Основная беда это когда надо перевести с японского корейского или китайского. Как только это переводят на английский - всё, дальше дело считанных часов когда это переведут на «enter your language»

Было бы актуальнее всё же сделать не ИИ автомат перевода, а полуавтомат, где заинтересованный переводчик, наводит на области и получает перевод, корректируя его, иногда может схватиться ложный текст, или тот который не интересно переводить или не нужно даже

I-Love-Microsoft ★★★★★
()
Последнее исправление: I-Love-Microsoft (всего исправлений: 1)

Сразу скажу, я в мангах не разбираюсь. Но всё же, если уж всё равно ИИ использовать, то зачем испорченный телефон устраивать, а не сразу с японского на русский переводить? С английского обычно переводят потому что человеки-переводчики-любители знают только английский, но не знают японского, разве нет? Ну а если ИИ юзать всё равно, то может лучше делать перевод оригинала таки?

CrX ★★★★★
()

ぶっ殺す。И так всякие ридманги полны «творчества» школоты с гуглтранслейтом наперевес. Ладно ещё, если чисто для личного использования, хотя подучить английский было бы предпочтительнее.

anonymous
()
Ответ на: комментарий от CrX

Я таки это представляю, лол. Весь гуглтранслейт всё равно работает через английский, но так как в японском, например, местоимения практически не используются, и «кто на ком стоял» определяется контекстом, в перевод местоимения добавляются совершенно рандомно. Мясной анлейтер хотя бы с этим может справиться (хотя и не всегда).

anonymous
()
Ответ на: комментарий от CrX

Ну во первых, японский оригинал хрен где найдешь(за бесплатно), во вторых, я в японском в отличии от английского не шарю да и объективно у гугл переводчика такая же проблема, особенно в необычном контексте)

Oskar
() автор топика
Ответ на: комментарий от einhander

Хотелось бы все спихнуть на автоматический режим перевода т.к. есть функция полуавтоматического, а картинки оставил эти как пример самого функционала)

Oskar
() автор топика
Ответ на: комментарий от einhander

Pet проект - перевод манги с английского на русский (комментарий)

Вот в том то и дело, если нет удобного интерфейса ручной поправки и коррекции, то всё плохо будет. По мере разработки - реже, но будет. Чтобы избежать - надо интерфейс редактора

А если цветное корейское китайское в оригинале, буквы на фоне цветного изображения

I-Love-Microsoft ★★★★★
()

ТС-у респект за попытки, как минимум ему для наработки скилла проект полезен

Но именно поэтому я читаю мангу давно на английском и не жду перевода. Так я выучил уже миллиард слов по ходу дела

I-Love-Microsoft ★★★★★
()
Ответ на: комментарий от peregrine

У меня в планах подключить какую-то ии для нормального перевода с контекстом и ситуацией на изображении страницы(в идеале бесплатная), т.к. сейчас перевод кругов с текстом идет в случайном порядке и из-за этого страдает смысл и подтекст, да и ocr для распознавания текста работает коряво в 30-40% случаев, а вот с замазыванием проблем пока нет, круги замазываются без проблем, но вот уже отдельный текст(не в кругах) скрипт не может распознать и зарисовать, это уже надо вручную делать)

Oskar
() автор топика
Ответ на: комментарий от Oskar

Вот я и говорю про тот текст который не в кругах. Ещё сложнее с текстом который на вывесках, экранах смартфонов и т.д.. Зачастую японцы, китайцы и корейцы не изобретают языки эльфов а пишут на своих, иногда применяя свои старые/менее распространённые формы написания. Как если бы мы писали на церковнославянском. А в кругах ну такое если честно.

peregrine ★★★★★
()