LINUX.ORG.RU
ФорумTalks

как задєтєктить язык тєкста?

 , діскатєка


0

1

буква «Є» - это характерная буква только для украинского языка? можно ли использовать ее, чтобы детектить текст на украинском и вырезать/переводить его автоматически из/в страниц/ах?

Какие еще эффективные методы языкового фильтра можно придумать?

★★☆☆☆

Последнее исправление: shimon (всего исправлений: 6)
Ответ на: комментарий от luke

Так у меня уже две его более ранние цитаты сохранены, теперь третья будет. Уже начало цитатнику положено. :-)

DeVliegendeHollander ★★
()
Ответ на: комментарий от heilkitty

Чёрт, надо срочно реформировать русский язык.

Они там с 13 лет половую жизнь начинают и не парятся. При этом аккуратно действуют: статистика подростковых беременностей благополучная по сравнению с нашими краями.

Может, кто-то и ужаснется, но мне такой расклад по нраву. Разумный гедонизм и приятнее, и безопаснее. А невротические тормоза приводят к страданиям и когда работают, и когда слетают.

Bagrov ★★★★★
()

Я могу русский тєкст с є писать, что ты мнє сдєлаєшь? Алсо, в исконной кириллице она так закруглённой и писалась.

MiniRoboDancer ★☆
()
Ответ на: комментарий от Stahl

Не 5-6, а намного больше. ИСЧХ, все эти слова - западэнского происхождения, равно как и с монофтонгами [дж] и [дз]. Огерманенные же, чё ты хошь. А произношение тут - дело принципиальное; можно и вместо «ё» «е» говорить, но это не литературный язык.

MiniRoboDancer ★☆
()
Ответ на: комментарий от wakuwaku

Є читается как Е, Е, соответственно - как Э, И - как Ы, І - как И. Отака чудова українська мова. Потому пан Азірів годами не мог въехать и стал меметичным персонажем :) Кстати, в начале XX в. в украиноязычных книжках на авантитуле указывалось, как рашковчанам буквы читать.

MiniRoboDancer ★☆
()
Ответ на: комментарий от vurdalak

Вместо волнистой шляпки - выгнутая вниз горизонтальная дуга.

MiniRoboDancer ★☆
()
Ответ на: комментарий от Bagrov

У меня есть карманный атлас мира с харьковским правописанием, люто доставляет :3

MiniRoboDancer ★☆
()
Ответ на: комментарий от heilkitty

Чёрт, надо срочно реформировать русский язык.

Я уже альтернативный алфавит и пару новых звуков предложил /)^3^(\

MiniRoboDancer ★☆
()
Ответ на: комментарий от MiniRoboDancer

Кстати, в начале XX в. в украиноязычных книжках на авантитуле указывалось, как рашковчанам буквы читать.

В XIX еще веселее было. В украинских школьных учебниках пишут, что злой царь запретил украинский алфавит в пользу русского. Для украинского школьника, с первого класса учившего современное абецадло - ужас! ужас!! ужас!!! На самом деле, алфавитов тогда была куча: на Западе отказались от йотированных в пользу сочетаний: ja, jу, jе, в Малороссии тем или иным образом использовали русскую азбуку (ярыжку).

Ярыжек тоже было несколько. В одной из них слова писали почти по-русски, надписывая произношение сверху.

Котляревский писал с историческими ятями, которые произносятся как «i». Шевченко - без ятей, но тоже на ярыжке. Потом издатели набирали его на кулешовке - очень няшной, теплой ламповой азбуке.

Запрет, может быть, был и не нужен, но он делал малороссийскую культуру более понятной для великороссов. Тут еще надо учитывать идеологические мотивы. Потом - да, малороссийское книгоиздание полностью запретили, и это решение вряд ли можно поддерживать. Но немалая часть вины лежит на тех, кто использовал язык и алфавит как антиимперское идеологическое оружие.

Сам Пантелеймон Кулиш разработал свою азбуку исключительно в целях просвещения, себя считал русским, пусть и малороссом, и выступал против идеологизации его изобретения.

Bagrov ★★★★★
()
Ответ на: комментарий от MiniRoboDancer

Это ещё чего; я офигел, когда узнал, что «дочці» читается [доц:і].

Аналогично. Еще большим сюрпризом для меня стало, что «в» произносится близко к английскому «w», а «и» - никакое не «ы», а «i» в немецком «Bild» или английском «hit».

Bagrov ★★★★★
()
Ответ на: комментарий от templarrr

Что-то ты перепутал.

Обоснуй. Думаешь, я после двух лет натаскивания на практическую фонетику и с итоговыми 90 баллами не определю звук по его описанию?

Украинское «и» - это гласный переднего ряда (произносится передней частью спинки языка) верхнего подъема (язык поднимается высоко), звук средний между и [е].

Украинское «в» - или [v], или [w] в зависимости от позиции.

Bagrov ★★★★★
()
Ответ на: комментарий от templarrr

Аналогично. Я говорю о том, что преподносится как литературное произношение.

Bagrov ★★★★★
()
Ответ на: комментарий от Bagrov

что «в» произносится близко к английскому «w»

И звонким аналогом [ф] не является, что характерно.

MiniRoboDancer ★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.