LINUX.ORG.RU
ФорумTalks

Armin Ronacher: вы ничего не понимаете в Unicode

 , , все сломали


0

1

Ъ: Armin Ronacher уже довольно давно закидывает кака^w критикует процесс развития Python 3. Кроме работ по вентиляции он еще написал Flask,Jinia2,werkzaug и т.д. Таким образом это не просто автор статей, текстов и постов(с) и на сей раз он разразился НЕНАВИСТЬЮ к тому как Python 3 работает с текстом. Вот раньше были байты,кодеки и неюникодные строки, а потому и неюникодом можно было криво-косо, но хоть как-то работать, а теперь эти самые разрабы поддались на академизм и выпилили не Unicode строки, а это приводит к тому что старые костыли не работают, новые еще более костыльные,и вообще разрабы питон3 делают сферического коня в вакууме.Как я понял он хочет, чтобы вернули полноценную работу с байтами, пару encode и decode у строк, нормально разобрались с системой codecs,а не занимались ее массовым расстрелом. Кроме того он троллит разрабов языка тем, что количество пользователей у их Python3 как у этих наших линуксов, а они понимаешь сказочками just as planned занимаются и УМВРят. Вместо этого он им предлагает признать что мир побольше будет чем их собственные интерпретаторы Python и в нем, о ужас, встречается не то что ASCII,а и просто различная не Unicode нечисть, например, koi-8. Дискасс

★★★★★

Последнее исправление: cetjs2 (всего исправлений: 2)

чё-то такое помню, что питон3 не мог нормально например взад-вперёд ходить по уникодному файлу fseek'ом по-unicode-codepoint-но и всякая такая хрень. Как счас не знаю, тогда писали, что планируется.

Bad_ptr ★★★★★
()
Ответ на: комментарий от pylin

за пультом находилась FreeBSD)

Зачем вы приписываете мне непонятных диджеев с которыми я «не знаком»?

nerfur ★★★
()
Ответ на: комментарий от pylin

Кстати этим он и грозится, говорит, что мужички то уже обсуждают.

«The worst of all of this is that many of the features in Python 3 which are genuinely cool could just as well work on Python 2 as well. Things like yield from, nonlocal, SNI SSL support etc.)»

Вот реально - кучу полезных фишек можно без всяких проблем перенести же (extended unpacking опять же).

tailgunner ★★★★★
()

Тут неплохо бы накопипастить аургментов, а то как-то не очень понятно о чём, так сказать, срач то.

Deleted
()

Аттеншн-вхора.

Нормально работает юникод в питоне3. Никаких проблем с потерянными и якобы очень нужными decode/encode нет. Работа с перекодированием вполне прозрачная, только один путь сделать это и прочий PEP.

E ★★★
()

Проблема не в юникоде, а в том, что отсутствует bytes.format() и bytes.decode('gzip'). .format() прикрутить ничто не мешает, кроме ослоупорности некоторых разработчиков. А вот .decode() и .encode() из bytes в bytes убрали вполне резонно, хотя следовало взамен добавить эквивалентные методы типа .decode_bytes() и .encode_bytes() и сделать систему byte codecs.

Просто подавляющему большинству крестьянодевелоперов эти мелочи не нужны и не интересны. Как и юникод, собственно.

kot_otbelivatel
()

Не думал, что в питоне всё так плохо.

invy ★★★★★
()
Ответ на: комментарий от E

Он работает ровно до тех пор, пока тебе не надо взаимодействовать с внешним миром, и чтобы при этом у тебя с одной кодовой базой поддерживались оба питона — второй и третий. А тогда ты видишь, что имеешь дело с двумя жопами, одна из которых кривая, а другая — косая. В качестве альтернативы тебе предлагают сделать жопу с вертикально расположенными ягодицами.

shimon ★★★★★
()
Ответ на: комментарий от DELIRIUM

Ну не скажи. В перле до сих пор не разбери поймешь, где просто строка, а где строка с юникодом, а если у тебя еще куча модулей со срана, каждый из которых — со своей шизофренией...

shimon ★★★★★
()
Ответ на: комментарий от DELIRIUM

Вот это кстати да, прикол.

Только нету нормального ООП из коробки и куча разных скобочек и значков ))

Bad_ptr ★★★★★
()
Ответ на: Вот это кстати да, прикол. от Bad_ptr

их надо просто осилить) но ООП да, через попу. Но в Си тоже через попу, только через другую, что не мешало запилить GTK и кучу софта на нём.

DELIRIUM ☆☆☆☆☆
()

и в нем, о ужас, встречается не то что ASCII,а и просто различная не Unicode нечисть, например, koi-8.

Гореть в Аду, умирать в страшных муках, для пользователей неюникода уже достраивают новый круг

bender ★★★★★
()
Ответ на: комментарий от DELIRIUM

В питоне3 по дефолту, конечно, тоже ждут от программера понимания юникода, а не дают кнопку "сделать всё зашибись"

Тем временем в перле всё работает уже 100 лет как...

Интересно, сколько раз кидались этой ссылкой.

Да, всё работает.

x3al ★★★★★
()
Ответ на: комментарий от bender

Для японцев, у которых в юникоде разные геогр. места с разными названиями или фамилии одинаковыми codepoint'ами записываются, тоже место предусмотрели? Или юзерам TRONCODE исключение?

Если что, в венде они юзают костыли разной кривизны (TRONCODE — один из них), в вебе — картинки вместо текста. Спасибо разработчикам юникода за han unification и экономию кодпойнтов (которые всё равно не влезли в 2 байта).

x3al ★★★★★
()
Последнее исправление: x3al (всего исправлений: 1)
Ответ на: комментарий от x3al

Для японцев, у которых в юникоде разные геогр. места с разными названиями одинаковыми codepoint'ами записываются, тоже место предусмотрели?

Должны страдать.

tailgunner ★★★★★
()

А в тикле юникод чуть ли не с самого появления.

olibjerd ★★★★★
()
Ответ на: комментарий от Deleted

Да все же ясно как божий день! Деды пердят, что не умеют в юникод, на что хипсторы им советуют сосать и причмокивать. Дедушки возмутились и заявили, что их овер 9000, а хипсторы намекнули сколько им жить осталось и показали в сторону могильника.

der_looser ★★
()
Ответ на: комментарий от shimon

Это уже проблемы не питонов, а предметной области/обстоятельств, которые потребовали зачем-то наличия двух версий. Вполне возможно, что избавиться от второй не получается, не спорю, и у меня было, но винить кого попало тоже нехорошо.

E ★★★
()
Ответ на: комментарий от pylin

У него кои8, емнип, только потому, что в одном славном поделии для верстки с юникодом хуже чем у сабжа с неюникодом.

Tweaker ★★★★☆
()
Ответ на: комментарий от der_looser

чтоб ворчать и пердеть возраст и отсутствие внуков не помеха:)

Ну то есть эти дедушки не старше хипсторов, и при этом их больше. Так что это хипсторам лучше «сосать и причмокивать»...

tailgunner ★★★★★
()
Ответ на: комментарий от der_looser

Понимаешь, с Python3 испытывают проблемы разработчики расширений Python, прикладных проектов на нем, можно, конечно, сурово их обзывать дедами и т.д., но Python3 сам по себе без доп. проектов неинтересен.

pylin ★★★★★
() автор топика
Ответ на: комментарий от tailgunner

Ты хорошо знаешь питон и причины появления третьей ветки? Мне интересно какой фатальный недостаток они нашли в 2.7, что решили родить ни с чем не совместимую 3.х? Да еще и отказались фичи бэкпортировать (хотя это мне относительно понятно).

der_looser ★★
()
Ответ на: комментарий от pylin

Понимаю я все это. Просто жирно троллю. Слава богу все нужное мне на третьепитон уже портнули, чему я все не нарадуюсь.

der_looser ★★
()

Всё правильно набросил.

fenris ★★★★★
()
Ответ на: комментарий от der_looser

Ты хорошо знаешь питон и причины появления третьей ветки?

Я хорошо знаю Python, но не причины появления Python3.

ни с чем не совместимую 3.х

Там практически всё можно было сделать совместимым - кроме поддержки Unicode. Собственно, поэтому и ходят разговоры о 2.8

tailgunner ★★★★★
()
Ответ на: комментарий от x3al

Для японцев, у которых в юникоде разные геогр. места с разными названиями или фамилии одинаковыми codepoint'ами записываются, тоже место предусмотрели? Или юзерам TRONCODE исключение?

Так в unicode им дали комбинирующие символы для выбора вариантов. Но родная юката, конечно, ближе к туловищу.

d_a ★★★★★
()

написал Flask,Jinia2,werkzaug

Я бы психанул и переписал всё на расововерном хаскель.

commit ★★
()
Ответ на: комментарий от d_a

Какие, к чёрту, комбинирующие символы в кандзи? Они не комбинируются, это не хангыль.

JIS нельзя однозначно мапить в юникод. Юникод нельзя однозначно мапить в JIS. Тут немного по этой теме с высоты troncode и chokanji (закрытая/платная RTOS на интересной неposix-архитектуре, жаль, что эта архитектура почти умерла).

x3al ★★★★★
()
Последнее исправление: x3al (всего исправлений: 1)
Ответ на: комментарий от x3al

Какие, к чёрту, комбинирующие символы в кандзи? Они не комбинируются, это не хангыль.

Те которые unicode variant selector, в статье http://en.wikipedia.org/wiki/Han_unification они упомянуты как официальное решение консорциума.

d_a ★★★★★
()

Всё он правильно сказал.

aidaho ★★★★★
()

Да, Армин точно знает что такое третьепитоноболь. Ждем 2.8

baverman ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.