LINUX.ORG.RU

Unicode 16.0

 , ,

Unicode 16.0

1

2

10 сентября состоялся выпуск 16.0 стандарта кодирования символов Unicode.

В этой версии добавлено 5185 новых символов, включая:

  • 3995 дополнительных символов египетских иероглифов;
  • семь новых письменностей (тулу, албанский Тодри, гарай (Сенегал), сунвар Джентича, гурунг, кират и ол-онал);
  • семь новых символов эмодзи: лицо с «мешками» под глазами, отпечаток пальца, безлистное дерево, корнеплод, арфа, лопата и брызги;
  • флаг острова Сарк;
  • более 700 символов устаревшей вычислительной техники.

На данный момент стандарт содержит 154998 символов, 168 письменностей и 3790 эмодзи.

>>> Подробности

★★★★★

Проверено: hobbit ()
Последнее исправление: dataman (всего исправлений: 3)

3995 дополнительных символов египетских иероглифов;

Наконец, а то с рептиланами надоело на транслите обсуждать низкое качество посадочных пирамид для кораблей.

steemandlinux ★★★★★
()
Последнее исправление: steemandlinux (всего исправлений: 1)

154998 символов

А редакторы https://ru.wikipedia.org/wiki/Юникод насчитали 155063, почему-то. :)


Пресс-релизы Юникода дают цифру на 65 меньше — не учитывают управляющие (00…1F, 7F…9F). Стоит признать, что категория этих символов поначалу несколько раз менялась. При дальнейшем обновлении данных: количество заявленных символов + 65.

dataman ★★★★★
() автор топика
Последнее исправление: dataman (всего исправлений: 1)
Ответ на: комментарий от dataman

Сбились, там ваще нужно спец ПО тупо чтобы не запутаться :D

LINUX-ORG-RU ★★★★★
()

На данный момент стандарт содержит 154998 символов, 168 письменностей и 3790 эмодзи.

Надеюсь, они, наконец, модернизировали символ (эмодзи – для косоглазых!) какашки. Это очень важно при диалоге с критиками, редакторами и политиками!

Old-Cat
()
Последнее исправление: Old-Cat (всего исправлений: 1)
Ответ на: комментарий от LINUX-ORG-RU

А есть шрифт, в котором есть всё.

Вроде бы нет. В GNU Unifont Glyphs меньше половины.
В Iosevka тоже что-то добавили из новой версии.

dataman ★★★★★
() автор топика
Ответ на: комментарий от duott

интересно звучит

Перевод на русский, это то, что я думаю:

Old-Cat
()
Ответ на: комментарий от Old-Cat

Это очень важно при диалоге с критиками, редакторами и политиками!

Кому как. Вон Фиркакс пофыркивает фейспалмами. :)

dataman ★★★★★
() автор топика
Ответ на: комментарий от dataman

Кому как. Вон Фиркакс пофыркивает фейспалмами. :)

Это другое! (с) чей-то. Фейспалм – оценка идеи и (или) посыла (месседжа для неруси). Какашка – глобальная оценка личности оппонента.

Old-Cat
()
Ответ на: комментарий от steemandlinux

Ну так само собой рептилоиды не понимают, о чём речь. Ведь всем образованным людям известно, что пирамиды построены гоаулдами.

Smacker ★★★★★
()
Последнее исправление: Smacker (всего исправлений: 1)

более 700 символов устаревшей вычислительной техники.

В оригинале:

and over 700 symbols from legacy computing environments

«Более 700 символов из устаревших вычислительных сред». Т.е., видимо, всякие там символы для APL и прочая порнография, а не символы «ZX Spectrum», «Commodore 64», «Microdrive», «Kempston Joystick» и т.п.

Smacker ★★★★★
()
Ответ на: комментарий от Smacker

а не символы «ZX Spectrum»

https://en.wikipedia.org/wiki/Symbols_for_Legacy_Computing

Symbols for Legacy Computing is a Unicode block containing graphic characters that were used for various home computers from the 1970s and 1980s and in Teletext broadcasting standards. It includes characters from the Amstrad CPC, MSX, Mattel Aquarius, RISC OS, MouseText, Atari ST, TRS-80 Color Computer, Oric, Texas Instruments TI-99/4A, TRS-80, Minitel, Teletext, ATASCII, PETSCII, ZX80, and ZX81 character sets. Semigraphics characters are also included in the form of new block-shaped characters, line-drawing characters, and 60 «sextant» characters (semigraphic character made up of six smaller blocks).

dataman ★★★★★
() автор топика
Ответ на: комментарий от AlexVR

Тю, ещё хуже. Спрайтов понапихали. В юникод. Вот нахуахуа? Спрайты — артефакт эпохи хардварной отрисовки анимации на экране. Что делать с глифом в виде спрайта из игры в современном шрифте? Использовать для пояснения в книгах про ретрогейминг и восьмибитные консоли, на манер того, как используют символы в виде клавиш ПК для иллюстрации горячих клавиш?

Smacker ★★★★★
()
Ответ на: комментарий от Smacker

Что делать с глифом в виде спрайта из игры в современном шрифте?

Выводить на экран в нужном месте через Вулкан?

AlexVR ★★★★★
()
Ответ на: комментарий от AlexVR

Зачем это? Опять нужно в два килобайта видеопамяти весь экран засунуть?

Smacker ★★★★★
()

ол-онал

Совсем комитет закапчевался. Пора распускать к херам, пока не поздно.

LamerOk ★★★★★
()

более 700 символов устаревшей вычислительной техники

Имитация бурной деятельности, чтобы не уволили. Небось сидит манагер и выдумывает что ещё в этом году запихнуть, чтобы обосновать премию. Пора разогнать этих комитетчиков.

ox55ff ★★★★★
()
Ответ на: комментарий от AlexVR

Они окончательно упоролись…

Предлагаю откатиться на коммит перед внедрением эмодзи и выборочно принимать только недостающие символы из живых языков.

А авторов последней версии на кол посадить. Да боюсь, что им понравится.

mogwai ★★★★★
()
Ответ на: комментарий от QsUPt7S

Это дискриминация. Срочно подать на них в суд.

mogwai ★★★★★
()

За эмодзи я бы разработчиков стандарта вообще придал бы костру, не от слова «огонь».

WatchCat ★★★★★
()

Давно заметил, что некоторые проекты, когда всё достигнуто и нужно просто остановиться - продолжают добавлять никому не нужные фичи.

Потому что кто-то им платит и требует отчёта. И вот, ради отчёта, чтобы и дальше получать финансирование «на развитие», они превращают законченный продукт в помойку из никому не нужного мусора.

jpegqs
()
Ответ на: комментарий от MoldAndLimeHoney

Ещё в 14-ой версии добавили беременных человека и мужчину: 🫄🫃

А🤰 в 9-ую.

С модификаторами цвета кожи: 🤰🏿🫄🏿🫃🏿

dataman ★★★★★
() автор топика
Ответ на: комментарий от ox55ff

Небось сидит манагер и выдумывает

Нет, это не так работает. Любой человек может дать запрос на добавление нового символа.

Много чего отклонили: https://unicode.org/emoji/emoji-proposals-status.html.
Чего там только нет!

dataman ★★★★★
() автор топика
Ответ на: комментарий от dataman

А хоть кто-нибудь делал статистику сколько реально эмодзи используется из того говна что они в стандарт напихали?

WatchCat ★★★★★
()

семь новых символов эмодзи;

не нужно

более 700 символов устаревшей вычислительной техники.

А вот тут интересно, теперь можно пакмена и гонки с «тетрис 1000 в 1» на unicode сделать

Kolins ★★★★
()
Последнее исправление: Kolins (всего исправлений: 1)
Ответ на: комментарий от unDEFER

Чё это вы pacman’а не нашли? 1CC70 разве не?

Это не Pacman. Символы U+1CC70-U+1CC77 - это как раз спрайты головы змейки. Конкретно U+1CC70 это «LEFT-FACING SNAKE HEAD WITH OPEN MOUTH».

QsUPt7S ★★
()
Ответ на: комментарий от WatchCat

А хоть кто-нибудь делал статистику сколько реально эмодзи используется

Какая-то статистика есть, да.
Например, https://symbolplanet.com/2023-united-states-emoji-trend-report/.
Или https://home.unicode.org/emoji/emoji-frequency/ от 2021 г.

dataman ★★★★★
() автор топика

Отлично, а теперь покажите шрифты, которые эти символы отрисовывают.

soomrack ★★★★★
()
Ответ на: комментарий от LINUX-ORG-RU

Про моноширинную iosevk’у уже сказали, но среди шрифтов общего назначения, скажем так, есть google noto fonts. В нём правда тоже, наверняка, есть не всё. Да и более того, часто выходит так, что в дистрибутивы он приходит в разных пакетах, когда в пакете с постфиксом -cjk, будут китайские иероглифы, иероглифы японских и корейских слоговых азбук.

На самом деле, если подумать, то можно понять, что иногда можно, во первых, использовать несколько шрифтов, а во вторых, что всякие графемы для изображения древних письменностей нужны не для локализации интерфейса, а чтобы лингвисты их расшифровывающие могли более успешно работать за компьютерами и писать свои статьи в winword.exe или XeLaTeX.

Artsi0m
()
Ответ на: комментарий от unDEFER

Хм.. Где это они видели змейку в таком стиле? И какой смысл этой головы без тела? Странные они…

Тело, вероятно, должно отрисовываться другими символами псевдографики. А конкретный стиль глифа символа отдаётся на откуп разработчикам шрифтов. Сам стандарт, насколько я понимаю, определяет лишь семантику символа и общие рекомендации, а не устанавливает жёсткие рамки возможных реализаций.

QsUPt7S ★★
()
Ответ на: комментарий от WatchCat

Но разработчики стандарта не придумывали эмодзи, они появились ещё в доюникодной Японии.

То что в них есть беременные мужчины, это проблема текущих культурных веяний, а не разработчиков, которые вынуждены в этой культуре существовать.

Artsi0m
()
Ответ на: комментарий от LINUX-ORG-RU

Вряд ли такой есть. Это очень мало кому нужно. Обычно шрифты покрывают конкретный язык или диапазон языков, и содержат всё, что для этого языка нужно, включая вариантные формы, лигатуры и прочее. А в костылях типа UniFont такой красоты нет — они нужны, чтобы показать хоть что-то.

alegz ★★★★
()
Ответ на: комментарий от dataman

Ну, как и ожидалось, весь топ заполнен колобками, а всратые человечки которых хрен разглядишь, нахрен никому не сдались. Ну кроме фейспалма, но это самое тупое что сделали разработчики, запихать фейспалм и пожатие плечами к человечкам.

WatchCat ★★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.