LINUX.ORG.RU
ФорумTalks

Понять как работает гугл-перевод

 , , ,


0

2

Был такой фильм 73 года, «Выход дракона» с Брюсом Ли.

Ссылки в конце поста.

Если зайти на англ. Википедию, там, кроме названия на английском (Enter the Dragon), будет также приведено название на традиционном китайском: 龍爭虎鬥.

Для начала, вставим это название в гугл-перводчик (translate.google.com). Оно будет переведено как «Dragons fight». Апостроф правда забыли, т.е. должно быть «Dragon's», «Битва Дракона».

Потом переходим на китайскую Википедию. Методом копи-паста с англ. страницы (Ctrl-C, Ctrl-F, Ctrl-V), можно убедиться, что название, которое приводилось на английской странице (龍爭虎鬥) используется также и на китайской:

https://i.imgur.com/AjdLZJk.png

Теперь переводим всю эту страницу через тот же гугл-перевод, методом засовывания ссылки в его окошко. И видим, что откуда-то взялось слово tiger:

https://i.imgur.com/HhgdlkL.png

Но больше того, если попытаться перевести китайскую страницу через встроенный в хром переводчик, результат будет вообще такой:

https://i.imgur.com/bELsKSY.png

Т.е. где-то название перевелось как Enter the Dragon, на английский манер.

Почему оно так работает?

Ссылки:

Англ. страница: https://en.wikipedia.org/wiki/Enter_the_Dragon

Китайская: https://zh-yue.wikipedia.org/wiki/龍爭虎鬥_(電影)

Deleted

Последнее исправление: myLogin (всего исправлений: 3)

Если зайти на англ. Википедию... Потом переходим на китайскую Википедию... >Почему оно так работает?

Потому, что гуглонейросеть творит статистический контекстно зависимый перевод ©.
Фразеологическая статистика на разноязычных википедиях порожает разные наиболее вероятные варианты, которые нередко дословно не совпадают.

quickquest ★★★★★
()
Ответ на: комментарий от quickquest

Как бы я, по отдельности всё более-менее понимаю, из того что ты скзала, но в единую логику оно у меня не складывается.

Контекстно зависимый

Хм, но обрати внимание, называние было не в основном потоке текста. Оно расположено наверху страницы и в правом синем блоке. Там как бы контекст нулевой, я думаю, но перевод сильно разный.

https://imgur.com/a/ckKB2

Фразеологическая статистика на разноязычных википедиях порожает разные наиболее вероятные варианты, которые нередко дословно не совпадают

Так страница-то переводилась одна и та же, китайская.

Deleted
()
Ответ на: комментарий от Deleted

Так страница-то переводилась одна и та же, китайская.

Возможно, для гугла в контекст входит и имеет значение каким путём эта страница до него дошла.

quickquest ★★★★★
()
Ответ на: комментарий от quickquest

Возможно, для гугла в контекст входит и имеет значение каким путём эта страница до него дошла.

Окей, это может объяснить разницу между первой и второй картинкой в моем первом посте.

Но какого хрена при этом иероглифы в заголовке статьи и в правом блоке выглядят по-разному - не ясно. (Картинку я показывал тебе в предыдущем сообщении).

Deleted
()
Ответ на: комментарий от Deleted

Но какого хрена при этом иероглифы в заголовке статьи и в правом блоке выглядят по-разному - не ясно.

Ну, тут можно только гадать, например, гугл может анализировать какой тип шрифта используется... Пути гугла неисповедимы :)

quickquest ★★★★★
()

Seq2seq не очень стабильны. Плюс, никуда не денешься от того, что энкодер/декодер работают с внутренним «представлением» с какой-то долей ошибки.

Solace ★★
()

Не знаю как он сайчас работает, но расскажу одну байку. Когда гугл перевод только появился, нужно было его обучить, а для этого нужно было много пар английских и русских текстов. Наняли студентов переводить тексты, как всегда делали для других языков в других странах. Но наши студенты не будь дураки, показали небывалую производительность переводя всё небезызвестным ПРОМПТом. На этом и обучили переводчик, лол. Честно говоря, и сейчас создаётся такое впечатление.

slovazap ★★★★★
()
Ответ на: комментарий от slovazap

Так там и сейчас пёрлы бывают, явно добавленные кем-то ради лулзов. Там же есть кнопочка Suggest en edit. Сила и слабость систем а-ля Википедия, где каждый может вносить свой вклад.

Deleted
()
Ответ на: комментарий от Deleted

Не надо сравнивать это с википедией. Последняя структурирована и модерируется всеми кто её смотрит, а тут чёрный ящик в который через отверстие можно доложить как конфетку так и какашку.

slovazap ★★★★★
()

ты бы ещё спросил почему оно Famicom как NES переводит

n_play
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.