LINUX.ORG.RU

помогите расшифровать каракозябры

 


0

1

копирую из пдфки в буфер русский текст, а вставляется вот такая ахинея, помогите пожалуйста перевести: Ɉɞɧɨɣ ɢɡ ɝɥɚɜɧɵɯ ɡɚɝɚɞɨɤ ɦɵɲɥɟɧɢɹ ɹɜɥɹɟɬɫɹ ɬɨ, ɤɚɤ ɢɡ ɫɨɜɨɤɭɩɧɨɫɬɢ ɞɚɧɧɵɯ ɨɛ ɨɛɴɟɤɬɟ, ɩɨɹɜ- ɥɹɟɬɫɹ ɡɧɚɧɢɟ ɨ ɧɟɦ. Ⱦɨ ɧɟɞɚɜɧɟɝɨ ɜɪɟɦɟɧɢ ɧɚɢɛɨɥɶɲɢɦ ɞɨɫɬɢɠɟɧɢɟɦ ɜ ɨɛɥɚɫɬɢ ɢɫɤɭɫɫɬɜɟɧɧɨɝɨ ɢɧɬɟɥ- ɥɟɤɬɚ ɹɜɥɹɥɨɫɶ ɥɢɛɨ ɜɨɫɩɪɨɢɡɜɟɞɟɧɢɟ ɥɨɝɢɤɢ ɱɟɥɨɜɟɤɚ-ɷɤɫɩɟɪɬɚ (ɤɥɚɫɫɢɱɟɫɤɢɟ ɷɤɫɩɟɪɬɧɵɟ ɫɢɫɬɟɦɵ), ɥɢɛɨ ɩɨɫɬɪɨɟɧɢɟ ɪɟɝɪɟɫɫɢɨɧɧɵɯ ɡɚɜɢɫɢɦɨɫɬɟɣ ɢ ɨɩɪɟɞɟɥɟɧɢɟ ɫɬɟɩɟɧɢ ɡɚɜɢɫɢɦɨɫɬɢ ɨɞɧɢɯ ɩɚɪɚɦɟɬɪɨɜ ɨɬ ɞɪɭɝɢɯ. ɋ ɞɪɭɝɨɣ ɫɬɨɪɨɧɵ, ɨɞɧɢɦ ɢɡ ɨɫɧɨɜɧɵɯ ɧɟɞɨɫɬɚɬɤɨɜ ɧɟɣɪɨɧɧɵɯ ɫɟɬɟɣ, ɫ ɬɨɱɤɢ ɡɪɟɧɢɹ ɦɧɨɝɢɯ ɩɨɥɶɡɨɜɚɬɟɥɟɣ, ɹɜɥɹɟɬɫɹ ɬɨ, ɱɬɨ ɧɟɣɪɨɧɧɚɹ ɫɟɬɶ ɪɟɲɚɟɬ ɡɚɞɚɱɭ, ɧɨ ɧɟ ɦɨɠɟɬ ɪɚɫɫɤɚɡɚɬɶ ɤɚɤ. ɂɧɵɦɢ ɫɥɨ- ɜɚɦɢ ɢɡ ɨɛɭɱɟɧɧɨɣ ɧɟɣɪɨɧɧɨɣ ɫɟɬɢ ɧɟɥɶɡɹ ɢɡɜɥɟɱɶ ɚɥɝɨɪɢɬɦ ɪɟɲɟɧɢɹ ɡɚɞɚɱɢ. Ɍɚɤɢɦ ɨɛɪɚɡɨɦ ɧɟɣɪɨɧɧɵɟ ɫɟɬɢ ɩɨɡɜɨɥɹɸɬ ɩɨɥɭɱɚɬɶ ɧɟɹɜɧɵɟ ɡɧɚɧɢɹ ɢɡ ɞɚɧɧɵɯ.

Вполне возможно что там и есть такая ахинея, т.е. отсканировали изображение, распознали его, а затем из всего этого собрали PDF, отсканированное изображение положили фоном, а сверху текст.

Но, вообще, нужно получить исходный текст, а так вы его уже копируете преобразованным в другую кодировку.

kostik87 ★★★★★
()
Последнее исправление: kostik87 (всего исправлений: 1)
Ответ на: комментарий от smilessss

пробовал несколько всяких онлайн декодеров, лебедева тоже обломался или может я не так его готовлю

elf80lvl
() автор топика

Как показывает практика, проще и быстрее прогнать такие pdf через ocr, чем расшифровать кракозябры.

petrosyan ★★★★★
()
Ответ на: комментарий от petrosyan

пасиб за подсказку, нашел online ocr, все что нужно получил

elf80lvl
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.