Шрифты не нужны. Они всё равно только распознаются. Кому важна форма букв, могут картинками рисовать. Уникод должен был появляться в процессе обработки непосредственно перед печатью-экраном. А злой жобс засунул его всем человекам в stdout, от того и проблемы.
Именно! Почему-то все вдруг забыли, что есть просто картинки. Почему нельзя было договориться использовать тот же SVG как стандарт для передачи весёлых какашек? Нужна поддержка для людей с ограниченными возможностями? Ну так можно описание в SVG вставить, стандартизировать там некий тег description, где бы было написано что на картинки разными языками.
Такое ощущение, что ты из всей статьи прочитал только заголовок и поспешил запостить. Какой-то чудак решил развернуть строку с юникодным символом стандартными средствами языка, будто это ascii-строка. Собственно, его уже после такого порыва можно гнать ссаными тряпками из любого порядочного места.
Это, на минуточку, один из авторов книги «Python Basics: A Practical Introduction to Python 3», а не просто какой-то рандомный чудак.
Да и разве в 3-ем Питоне не заточено всё под UTF-8? Там, на минуточку, даже бинарных пайпов из коробки нет. Потому, что пайпы текстом, а текст, без вариантов, в UTF-8, а в строку в UTF-8 далеко не всякую бинарную простыню можно загнать.
Там, на минуточку, даже бинарных пайпов из коробки нет. Потому, что пайпы текстом, а текст, без вариантов, в UTF-8, а в строку в UTF-8 далеко не всякую бинарную простыню можно загнать.
Тыц!
Ты, наверное, пыхтон по упомянутой книжке этого чудака учил.
В реальности не всем нужно решать задачу сжатого хранения текста. И вот те кому нужно пускай как хотят так её и решают. А запихивать эту "оптимизацию" прямо внуть кодировки это рукожопие.
Ну не. Юникод - это про унификацию, чтобы и в СМСках, и на лорчике можно было 🦓🐴🦄. А ты предлагаешь вытащить комбинирование символов на уровень приложения и наслаждаться тонной частичных реализаций и удивительных багов.
А какую кодировку нужно использовать, чтобы набрать, например, русско-японский
Зачем вообще в одну кодировку пихать все символы? Можно было бы сделать текст с множеством кодировок. некий формат бинарной разметки: следующие 128 байт это кодировка abc, другие 256 байт это кодировка xyz, и т.п. Большинство алфавитов влезают в один байт.
Можно было бы сделать текст с множеством кодировок. некий формат бинарной разметки: следующие 128 байт это кодировка abc, другие 256 байт это кодировка xyz, и т.п.
Работать с таким — ад (см. shift-jis). Если побьётся поток байтов, то восстанавливать — тоже ад. UTF-8 лучше.
А в эмодзях такого нет? Я как-то упустил про это дело... Как тогда их отображать? Тем более, в наше время нестандартных полов надо сделать все возможные комбинации любых половых признаков, т.к. стандартных символов «мэ» и «жэ» уже недостаточно.
Сколько весёлая какашка в SVG будет занимать? Несколько килобайт? И это надо каждый раз вместо какашки или значка гендера вставлять SVG вместо 4 байт (или сколько там?) на символ в юникоде.
Конечно, в эпоху современного шеба такая экономия это смешно, но всё-таки.
А что будет с юникодом, если туда поместить все варианты? Где какашка в виде радуги для единорогов? А для утончённых девочек в виде бабочек? Понос фонтаном?
Несколько килобайт?
Зато сейчас все эти КБ лежат на устройствах. Мне никто весёлую какашку не присылал, но она у меня лежит. Зачем?