LOR takeout

Ответ на: комментарий от h578b1bde 13.06.15 13:08:20 UTC

А я думал что диалап-модемы уже повсюду кроме музеев выкинули

Диалап, может, и выкинули, а вот UMTS в некоторых государствах ещё нескоро распространится хотя бы по крупным городам (да и там, где есть, он сейчас дороговат, даже у яйцеголовых). А пока нет UMTS и залупливают ещё более конские цены за EVDO — жив жопорез, который хоть теоретически и быстрее диалапа, особенно с ежом, но по стабильности САСАЙТ. Кстати, с диалапом можно на халяву подрубиться к абоненту в другом конце города (или с GSM к абоненту того же оператора) и переслать ему файл, а через эти ваши интернеты так можно? Есть ХСВ, да, но попробуй найти ХСВ не за NAT, чтоб не надо было юзать костыли для P2P.

Кому не нужно?

Здравомыслящим людям, которые задумываются, прежде чем выделить int под счётчик от 0 до 10, дабы не охать потом от пожирания гигабайтов памяти своим говнокодом.

Легаси же.

Такое легаси, что для него аж удобный короткий синтаксис запилили вместо простынь, которые так и остались для остальных <meta>, ага.

Потому что человек не осьминог?

Создателей Space Kadet, пультов для микширования и управления АЭС это как-то не останавливало.

~~MiniRoboDancer~~ ★☆
(13.06.15 13:26:37 UTC) автор топика

Ответ на: комментарий от MiniRoboDancer 13.06.15 13:26:37 UTC

Диалап, может, и выкинули, а вот UMTS в некоторых государствах ещё нескоро распространится хотя бы по крупным городам (да и там, где есть, он сейчас дороговат, даже у яйцеголовых). А пока нет UMTS и залупливают ещё более конские цены за EVDO — жив жопорез, который хоть теоретически и быстрее диалапа, особенно с ежом, но по стабильности САСАЙТ.

Это не проблема ЛОРа. У этих пользователей САСАЙТ будет всё.

Кстати, с диалапом можно на халяву подрубиться к абоненту в другом конце города (или с GSM к абоненту того же оператора)

А World Wide Web тут притом, что…

и переслать ему файл

С флешкой сбегать быстрее будет.

Здравомыслящим людям

Здравомыслящие люди в этих ваших интернетах используют UTF-8 вместо всякой местечковой музейной маргинальщины.

дабы не охать потом от пожирания гигабайтов памяти своим говнокодом

Не увидел в твоём эксперименте выше гигабайтов. Говнокодить можно и на ANSII и на KOI в каком-нибудь 1C.

Такое легаси, что для него аж удобный короткий синтаксис запилили вместо простынь, которые так и остались для остальных <meta>, ага.

Эти наркоманы и не такую траву употребляют, поэтому я даже не удивлён.

это как-то не останавливало

Почему же, можно и клавиатуру сделать в виде пульта управления АЭС. Вот только удобство в её практическом использовании сомнительно.

~~h578b1bde~~ ★☆
(13.06.15 13:49:26 UTC)

Ответ на: комментарий от h578b1bde 13.06.15 13:49:26 UTC

У этих пользователей САСАЙТ будет всё

Практика показывает, что САСАЙТ лишь отдельные рукожопые поделия.

А World Wide Web тут притом, что…

А ни при чём. Дурная практика вообще всё пихать в сеть. Человечество захлестнула волна эксгибиционизма, которая уже начинает вылезать боком, а дальше будет только хуже — целое поколение без личной жизни и хоть капли своей мысли в голове.

С флешкой сбегать быстрее будет.

Это если время и возможность будет пешком пересекать город.

Здравомыслящие люди в этих ваших интернетах используют UTF-8 вместо всякой местечковой музейной маргинальщины.

Это всё равно что говорить, что здравомыслящие люди всё пишут на Java вместо всякой музейной маргинальщины. У каждой технологии есть своя ниша применения.

Не увидел в твоём эксперименте выше гигабайтов

60k запросов к глагне — вот и гигабайт наскрёбся. И это только к глагне.

Говнокодить можно и на ANSII и на KOI

Кодировки ни при чём, я привёл это как пример того, что бывает, если пихать одно и то же универсальное решение во все поля, проще говоря, не только забивать молотком гвозди, но и закручивать им шурупы, ощипывать куриц и использовать вместо рыболовного крючка.

Вот только удобство в её практическом использовании сомнительно.

Ну так и в чём состоит удобство использования переменнодлинной кодировки, выдающей два байта на русском тексте, когда хватит одного?

~~MiniRoboDancer~~ ★☆
(13.06.15 22:03:07 UTC) автор топика

Ответ на: комментарий от MiniRoboDancer 13.06.15 22:03:07 UTC

Практика показывает, что САСАЙТ лишь отдельные рукожопые поделия.

Ок. А юникод тут причём?

Дурная практика вообще всё пихать в сеть.

А кто тебя заставляет пихать всё „в сеть”? Подними локальный FTP/SFTP/SCP с авторизацией и заливай что хочешь.

Человечество захлестнула волна эксгибиционизма, которая уже начинает вылезать боком, а дальше будет только хуже — целое поколение без личной жизни и хоть капли своей мысли в голове.

А виной всему этому конечно же хрюникод.

У каждой технологии есть своя ниша применения.

Верно, и ниша КОИ8-Р сейчас находится в музее где-то рядом с палкой-копалкой.

Кодировки ни при чём, я привёл это как пример того, что бывает, если пихать одно и то же универсальное решение во все поля, проще говоря, не только забивать молотком гвозди

И вместо забивания гвоздей молотком ты предлагаешь делать это камнями. Можно, конечно, но не нужно.

Ну так и в чём состоит удобство

В отсутствии ущербных ограничений из прошлого века.

60k запросов к глагне — вот и гигабайт наскрёбся. И это только к глагне.
переменнодлинной кодировки, выдающей два байта на русском тексте

Не вижу реальной проблемы.

когда хватит одного

Так ведь не хватит. Или ты покажешь где в предлагаемой тобой кодировке находятся тире, многоточие и ёлки? Если дело только в этом — сразу мог бы предложить более адекватную и полную кодировку, например cp1251.

~~h578b1bde~~ ★☆
(14.06.15 00:16:36 UTC)

Ответ на: комментарий от MiniRoboDancer 13.06.15 13:26:37 UTC

прежде чем выделить int под счётчик от 0 до 10

Я вроде где-то слышал, что на некоторых (вполне возможно в том числе и x86) платформах наиболее быстро выполняются команды работы с переменными соответствующими разрядности процессора или кратные ей (например, на x86_64 такими будут 32-битные и 64-битные, а вот 16-битные и 8-битные инструкции будут тормозить, на x86 оптимальный размер переменной лишь один - 32 бита, на всяких ARM не знаю, но подозреваю, что тоже 32 бита). И уж точно быстрее выполняются обращения к выровненным данным. В свете этой информации int вполне может оказаться быстрее char, если у тебя не 8-битный процессор. А в оптимизации по скорости нет ничего зазорного на ПК, это только под микроконтроллеры компилируют с -Os.

Кстати, насчёт тормозов инструкций не той разрядности вполне есть пруф. Команды, работающие с 16-разрядными переменными на x86, кодируются с помощью специального префикса, а 32-разрядные - без него. Как следствие, процессор парсит команду дольше из-за этого самого лишнего байта префикса. И код получается жирнее из-за этих самых префиксов.

То есть сэкономив 2 байта и сделав 16-битную переменную вместо 32-битной на x86 ты потеряешь по байту на каждом обращении к ней (а обращаются к переменной как правило больше одного раза), а также немного скорости. Стоит ли игра свеч?

Зато стандарт более-менее гарантирует, что int будет иметь оптимальный размер для данной платформы (разве что на всяких восьмибитных микроконтроллерах int превышает размер машинного слова и поэтому char даст выигрыш), поэтому вполне разумно пихать его везде, где нет иных причин выбрать другой тип (для строки, а не одиночной переменной char уже даст очень заметный выигрыш в размере, поэтому стоит выбрать таки его, где-то int мало и надо long long).

KivApple ★★★★★
(14.06.15 00:23:32 UTC)
Последнее исправление: KivApple 14.06.15 00:32:47 UTC (всего исправлений: 8)

Ссылка

Ответ на: комментарий от MiniRoboDancer 13.06.15 22:03:07 UTC

60k запросов к глагне — вот и гигабайт наскрёбся. И это только к глагне.

jquery.min.js и TUX.svg каждый по отдельности дадут больше, даже несмотря на то что очень хорошо кешируются, а если ещё и аватарки включены - твоя оптимизация даже не спичкой окажется, а головкой от спички.

maloi ★★★★★
(14.06.15 12:04:45 UTC)

Ссылка

Ответ на: комментарий от h578b1bde 14.06.15 00:16:36 UTC

А юникод тут причём?

При том, что это одна из совокупных причин САСАЙТ. Потому что его пихают везде подряд, даже когда он не нужен. Равно как и JS-библиотеки, из которых всё неиспользуемое не выковыряно. (Если уж не выковыривать — то хотя бы подключать их с публичных CDN, чтобы вероятность закэшированности повысить, но многие даже этого не делают.)

Подними локальный FTP/SFTP/SCP с авторизацией и заливай что хочешь

Локалхост, торчащий в сеть — не сеть?

А виной всему этому конечно же хрюникод

Виной нежелание думать о последствиях.

Верно, и ниша КОИ8-Р сейчас находится в музее где-то рядом с палкой-копалкой

Палка-копалка — это ASCII-несовместимые кодировки. Но даже у них микрониши есть, когда строку можно паковать побитово или эмулируется невосьмибитная архитектура.

И вместо забивания гвоздей молотком ты предлагаешь делать это камнями

Не камнями, а маленьким молоточком-гвоздодёром. Ибо обычным молотком можно бить и куда большие вещи, а только для гвоздей его держать... Если даже что-то понадобится большое поколотить, то здоровый молоток можно одолжить у соседа.

В отсутствии ущербных ограничений из прошлого века

Где эти ограничения? Дали HTML-сущности — пользуйтесь; не, не хочу, хочу обмазываться UTF-8. Никто ж не заставляет, например, совмещать Y с У и заниматься прочими извращениями, которые были у первобытных кодировок.

Не вижу реальной проблемы

Проблема есть — перегруз ЛОРа. Из-за которого Макском не хочет показ тредов целиком впиливать, да ещё и старое отпиливает типа показа прямой выборкой комментариев пользователя и инфы в профиле. Такими темпами он тут скоро аякс отпилит, суточные ограничения на постинг введёт, галерею выпилит и вообще.

например cp1251

Как вариант, но по идеологическим причинам могут не принять. Хотя вроде, когда ЛОР был мультикодировочным, она была; надо проверить.

~~contra_sperm_spero~~
(17.08.15 23:06:16 UTC)

Ответ на: комментарий от contra_sperm_spero 17.08.15 23:06:16 UTC

При том, что это одна из совокупных причин САСАЙТ. Потому что его пихают везде подряд, даже когда он не нужен.

Когда UTF-8 не нужен он, внезапно, автоматически превращается в ASCII.

Локалхост, торчащий в сеть — не сеть?

man контекст.

Виной нежелание думать о последствиях.

Ок. А сабж тут причём?

Палка-копалка — это ASCII-несовместимые кодировки

Поэтому UTF-8 во все поля.

Где эти ограничения? Дали HTML-сущности — пользуйтесь; не, не хочу, хочу обмазываться UTF-8.

Дали костыли — пользуйтесь; не, не хочу, хочу нормально ходить на ногах.

Никто ж не заставляет, например, совмещать Y с У и заниматься прочими извращениями, которые были у первобытных кодировок.

Всё правильно, с появлением UTF-8 все эти первобытные извращения уже не нужны.

Проблема есть — перегруз ЛОРа. Из-за которого Макском не хочет показ тредов целиком впиливать, да ещё и старое отпиливает типа показа прямой выборкой комментариев пользователя и инфы в профиле. Такими темпами он тут скоро аякс отпилит, суточные ограничения на постинг введёт, галерею выпилит и вообще.

И ты конечно же уверен что проблема именно в юникоде а не в кривости движка или ущербности вычислительных ресурсов? Если Макском до сих пор не выпилил юникод — значит либо проблема не в нём либо она не настолько существенна.

~~h578b1bde~~ ★☆
(18.08.15 10:13:40 UTC)

Ответ на: комментарий от h578b1bde 18.08.15 10:13:40 UTC

Когда UTF-8 не нужен он, внезапно, автоматически превращается в ASCII

Грубейшее 4.2.

man контекст

Что контекст-то? Какая разница, гонять ли через интернеты на чужой сервак или на свой, если оно один хрен гоняется через интернеты и может быть посниффано и расшифровано?

А сабж тут причём?

А сабж тут ровно ни при чём, он уже бесполезен потому, что теперь-то мне дамп точно никто не даст.

Поэтому UTF-8 во все поля

UTF-8 — единственная ASCII-совместимая кодировка?

Дали костыли — пользуйтесь

Это не костыли, это одна из основных фич HTML.

Всё правильно, с появлением UTF-8 все эти первобытные извращения уже не нужны

В хрюникоде уже появились отдельные наборы символов для каждого национального алфавита, и нет проблем технически отличить, например, русский Ъ от болгарского Ъ? Рассказывайте мне тут сказки.

а не в кривости движка

Кривость движка — вещь совокупная. Тут есть хоть один здоровый ботлнек, из-за которого ЛОР еле дышит?

ущербности вычислительных ресурсов

Это данность. Люди, знаете ли, тоже не выбирают, на какой планете родиться. Да, теоретически можно куда-то свалить, но теоретически.

либо проблема не в нём либо она не настолько существенна

Либо он просто такой же UTF-8-фанатик.

~~contra_sperm_spero~~
(18.08.15 11:41:04 UTC)

Ответ на: комментарий от contra_sperm_spero 18.08.15 11:41:04 UTC

Грубейшее 4.2.

Обоснуй.

Что контекст-то? Какая разница, гонять ли через интернеты на чужой сервак или на свой, если оно один хрен гоняется через интернеты и может быть посниффано и расшифровано?

А через диалап не может?

UTF-8 — единственная ASCII-совместимая кодировка?

Единственная нормальная ASCII-совместимая кодировка, да.

В хрюникоде уже появились отдельные наборы символов для каждого национального алфавита

В других кодировках уже появились?

и нет проблем технически отличить, например, русский Ъ от болгарского Ъ?

Зачем это нужно?

Кривость движка — вещь совокупная.

Ты же сам проводил опыты по экономии спичек. Возможно стоит сосредоточиться на чём-то более существенном.

Тут есть хоть один здоровый ботлнек, из-за которого ЛОР еле дышит?

Я не разработчик лоровского движка, откуда мне знать. Полагаю что Макскому виднее.

Это данность. Люди, знаете ли, тоже не выбирают, на какой планете родиться. Да, теоретически можно куда-то свалить, но теоретически.

Иногда так бывает что ресурс становится слишком популярным и изначальных мощностей уже недостаточно, это нормально. Сделать апгрейд всё же реальнее чем свалить на другую планету.

~~h578b1bde~~ ★☆
(18.08.15 12:47:51 UTC)

Ответ на: комментарий от h578b1bde 18.08.15 12:47:51 UTC

Обоснуй

Что тут обосновывать? Что для ASCII нужно 7 бит, а в байте 8, что дополнительный бит можно также использовать под не входящие в ASCII символы и для многих юзкейсов этого будет вполне достаточно? На контрольные суммы восьмой бит тратить не обязательно, особенно когда проверка целостности реализована независимо.

А через диалап не может?

А что, телефонная сеть — не сеть?

Единственная нормальная ASCII-совместимая кодировка, да

И кто тут обоснуй?

В других кодировках уже появились?

Нет. Но в них хотя бы можно отличить от всего латиницу, в отличие от советских музейных палок-копалок.

Зачем это нужно?

Например, затем, чтобы отличать тексты на разных языках, или чтобы задавать для них разные начертания в шрифте. Например, у тех же болгар свои особенности в типографике (для примера можно глянуть букву «в» в шрифте Terminus).

Возможно стоит сосредоточиться на чём-то более существенном

Ну дак вон Макском сосредоточился на профайлинге и выпиливает/ограничивает функциональность в узких местах. Вместо того, чтобы эту функциональность улегковесить.

Сделать апгрейд всё же реальнее

Если ресурс коммерческий. Иначе это серьёзная проблема. Мало того, что ЛОР невыездной (т. е. будет и дальше прогибаться под крепчающий маразм рашкинского законодательства), так ещё и коммерческим должен стать? Уже предвкушаю проплаченные новости, как на швабрапомойке, и премиум-аккаунты для нацпола, редактирования сообщений и игнора.

~~contra_sperm_spero~~
(19.08.15 15:31:17 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 15:31:17 UTC

премиум-аккаунты для нацпола

Я б купил. Также согласен купить премиум-аккаунт, который позволяет называть модераторов тем чем они являются.

~~vurdalak~~ ★★★★★
(19.08.15 15:34:54 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 15:31:17 UTC

Что тут обосновывать? Что для ASCII нужно 7 бит, а в байте 8

ASCII, внезапно, понятие растяжимое. Бывает первоначальная ужатая ASCII, бывает и расширенная.

для многих юзкейсов этого будет вполне достаточно?

Нет, не для многих.

А что, телефонная сеть — не сеть?

Сеть, конечно, только непонятно зачем ты в ней занимаешься эксгибиционизмом и используешь другие дурные практики? Ходи с флешкой, думай ~~ногами~~ головой, будь Ъ.

И кто тут обоснуй?

https://ru.wikipedia.org/wiki/UTF-8

Одним из преимуществ является совместимость с ASCII

Что не так?

Но в них хотя бы можно отличить от всего латиницу

А отличить тире от дефиса или хотя бы ударение в нужном месте поставить там можно?

Например, затем, чтобы отличать тексты на разных языках

Для этого используются другие технологии.

или чтобы задавать для них разные начертания в шрифте

В этом случае достаточно определить тип письменности (например, латиница или кириллица), языковое разделение здесь избыточно.

для примера можно глянуть букву «в» в шрифте Terminus

Там используется какая-то другая буква „в”, отличная от остальной кириллицы?

так ещё и коммерческим должен стать?

Он и так коммерческий, как минимум в виде наличия рекламы.

~~h578b1bde~~ ★☆
(19.08.15 16:41:17 UTC)

Ответ на: комментарий от vurdalak 19.08.15 15:34:54 UTC

Напишите на почту Макскому, вдруг взлетит.

~~contra_sperm_spero~~
(19.08.15 20:30:25 UTC)

Ссылка

Ответ на: комментарий от MiniRoboDancer 13.06.15 13:26:37 UTC

чем выделить int под счётчик от 0 до 10, дабы не охать потом от пожирания гигабайтов памяти своим говнокодом.

На сим моменте позволю себе уточнение: данный счётчик должен быть инстанциирован мульёны раз, ибо банальный for (int i ...) на этих наших x86 (а как результат и на остальных, «подтягивающихся» платформах) будет работать быстрее, нежели for (char i ...). Да и скорее всего компилятор это заоптимизирует до int.

P.S. А ещё мой зад резко воспламеняет использование типа char для булевого аргумента в функциях.

KennyMinigun ★★★★★
(19.08.15 20:51:21 UTC)
Последнее исправление: KennyMinigun 19.08.15 20:51:46 UTC (всего исправлений: 1)

Ответ на: комментарий от contra_sperm_spero 19.08.15 15:31:17 UTC

contra_sperm_spero

Ты за что так с Ларисой Петровной?

KennyMinigun ★★★★★
(19.08.15 20:58:10 UTC)

Ответ на: комментарий от h578b1bde 19.08.15 16:41:17 UTC

бывает и расширенная

Ну так ASCII с расширенными наборами — это и есть восьмибитные кодировки. Юникод расширенным набором не является, он просто обратно совместим с ASCII в некотором роде.

не для многих

Мало одноязычных решений, что ли?

зачем ты в ней занимаешься

Я уже давно ничем в ней не занимаюсь, стационарный телефон отрезали год назад за неуплату. Да и ни диалап-, ни DSL-модема никогда не было.

https://ru.wikipedia.org/wiki/UTF-8
одна из общепринятых и стандартизированных кодировок текста

Вы свой фашизм Википедии-то не приписывайте.

отличить тире от дефиса или хотя бы ударение в нужном месте поставить

Если там есть тире и ударение, в противном случае можно использовать Unicode-экранирование.

языковое разделение здесь избыточно

Алфавиты разных языков, основанные на одном базовом алфавите, могут различаться в начертаниях гомологичных символов и письменных традициях. Казусы бывают разные. Например, в большинстве алфавитов на основе латиницы заглавную I принято писать без точки, а строчную i — с точкой. А у турков Iı и İi — разные буквы. Берём теперь, казалось бы, такую простую операцию, КАК АВТОИЗМЕНЕНИЕ РЕГИСТРА. Применяем общепринятые правила — оппача... Ладно, городим костыли, определяющие язык по окрестным символам. И тут внезапно в турецком тексте встречается английское слово (например, Microsoft Windows превратится в MİCROSOFT WİNDOWS). Снова фейл. И хрюникод тут никак не поможет.

Для этого используются другие технологии

То есть как HTML-сущности — так костыли, а как надо определить алфавит — так можно использовать другие технологии?

Там используется какая-то другая буква „в”, отличная от остальной кириллицы?

Она демонстрирует болгарскую типографику. И теперь пытаемся сделать шрифт, который русский текст показывает в традициях русской типографики, а болгарский — болгарской...

как минимум в виде наличия рекламы

Доход и окупаемость — это разные вещи. Второе весьма с натяжкой можно назвать коммерцией.

~~contra_sperm_spero~~
(19.08.15 20:59:22 UTC)

Ответ на: комментарий от KennyMinigun 19.08.15 20:51:21 UTC

использование типа char для булевого аргумента в функциях

То есть надо использовать int для буля? О_О Этот мир точно рехнулся. Почему вообще сразу не сделали операцию выставления флага по заданному биту регистра? это куда проще всяких сдвигов. В x86, кстати, что-то такое вроде есть, подробностей не помню, ибо находил один раз и мельком; вопрос в том ещё, как оно используется...

~~contra_sperm_spero~~
(19.08.15 21:03:29 UTC)

Ответ на: комментарий от KennyMinigun 19.08.15 20:58:10 UTC

За то, что лесбиянка и растлевает духовные скрепы, очевидно же!

//Кстати, спасибо, что напомнили, я же хотел ожерелье из скрепок сделать.

~~contra_sperm_spero~~
(19.08.15 21:04:27 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 21:03:29 UTC

То есть надо использовать int для буля? О_О

ЕМНИП, в x86 нет стековых операций (т.е. pop) для байта. По этому (казалось бы) байтовый аргумент на стеке апгрейдится аж до целого слова (int для x86). Хотя, стоит проверить, а под рукой компилятора нет.

Посмотри у себя выхлоп от gcc -O0 -S от такого кода:

void func(char flag) {
    char inner = flag; // чтоб посмотреть откуда возьмется значение
}

void main() { func(1); }

KennyMinigun ★★★★★
(19.08.15 21:26:33 UTC)
Последнее исправление: KennyMinigun 19.08.15 21:28:38 UTC (всего исправлений: 1)

Ответ на: комментарий от contra_sperm_spero 19.08.15 21:03:29 UTC

выставления флага по заданному биту регистра?
В x86, кстати, что-то такое вроде есть,

Ну, например test может выставить SF, ZF (как раз для булевых значений) и PF. Но это костыль, ящитаю. Юзабельно только если уж очень чешется поэкономить на спичках.

Можно ещё ввести свой calling convention и выставлять «булевые» биты в каком-либо регистре. Но тогда извне на твой код вряд ли кто сможет позвонить.

KennyMinigun ★★★★★
(19.08.15 21:35:17 UTC)
Последнее исправление: KennyMinigun 19.08.15 21:37:46 UTC (всего исправлений: 1)

Ответ на: комментарий от contra_sperm_spero 19.08.15 20:59:22 UTC

Единственная нормальная ASCII-совместимая кодировка, да.

Юникод расширенным набором не является, он просто обратно совместим с ASCII

Не вижу противоречий.

Мало одноязычных решений, что ли?

В современном мире мало, к тому же твои решения не могут охватить потребности носителей даже одного конкретного языка.

Вы свой фашизм Википедии-то не приписывайте.

Во-первых, фашистами являются фанатики кодировок, которые представляют символы лишь одного-двух языков, к тому же неполноценно. Во вторых, для поиска по тексту на странице в большинстве браузеров существует комбинация Ctrl+F, можешь проверить.

А у турков Iı и İi — разные буквы

Как Іі и Її в украинском? Здесь всё просто: разные символы соответствуют разным кодам в таблице символов, а как у турков эта проблема решается?

То есть как HTML-сущности — так костыли, а как надо определить алфавит — так можно использовать другие технологии?

Да, ибо определение начертания шрифта и определение алфавита разные задачи, соответственно для них имеются разные решения.

Она демонстрирует болгарскую типографику. И теперь пытаемся сделать шрифт, который русский текст показывает в традициях русской типографики, а болгарский — болгарской...

Чем именно традиции болгарской типографики отличаются от традиций русской?

~~h578b1bde~~ ★☆
(19.08.15 21:50:40 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 20:59:22 UTC

Юникод расширенным набором не является, он просто обратно совместим с ASCII

Не юникод, кстати, а UTF-8.

~~h578b1bde~~ ★☆
(19.08.15 21:53:32 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 21:04:27 UTC

За то, что лесбиянка и растлевает духовные скрепы, очевидно же!

Но ведь в духовно-скрепной это же нормально.

~~h578b1bde~~ ★☆
(19.08.15 21:58:42 UTC)

Ссылка

Ответ на: комментарий от KennyMinigun 19.08.15 21:26:33 UTC

func:
.LFB0:
	.cfi_startproc
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	movl	%edi, %eax
	movb	%al, -20(%rbp)
	movzbl	-20(%rbp), %eax
	movb	%al, -1(%rbp)
	popq	%rbp
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE0:
	.size	func, .-func
	.globl	main
	.type	main, @function
main:
.LFB1:
	.cfi_startproc
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	movl	$1, %edi
	call	func
	popq	%rbp
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE1:
	.size	main, .-main
	.ident	"GCC: (Debian 4.9.3-3) 4.9.3"
	.section	.note.GNU-stack,"",@progbits

Таки q, да. Что и неудивительно, ибо меньше ширины шины с памятью работать нельзя.

~~contra_sperm_spero~~
(19.08.15 22:56:43 UTC)

Ответ на: комментарий от KennyMinigun 19.08.15 21:35:17 UTC

Не, не test, я про операцию проверки бита по смещению.

~~contra_sperm_spero~~
(19.08.15 22:58:07 UTC)

Ссылка

Ответ на: комментарий от h578b1bde 19.08.15 21:50:40 UTC

Не вижу противоречий

Противоречие внутри первого утверждения.

В современном мире мало

Да ну? Скорее наоборот, всё катится в инглиш.

не могут охватить потребности носителей даже одного конкретного языка

Почему?

фашистами являются фанатики кодировок, которые представляют символы лишь одного-двух языков, к тому же неполноценно

То есть подбор подходящей для задачи технологии — фашизм и надо редактировать конфиги в Visual Studio?

существует комбинация Ctrl+F

Ctrl+F — это управляющий символ 6, то бишь PgDn, а проблему смешивания Cmd и Ctrl на некоторых рукожопых системах стоит рассмотреть отдельно.

Как Іі и Її в украинском?

Ясно, мусьё даже читать не умеет.

разные задачи, соответственно для них имеются разные решения

Вот только в шрифты эти задачи не входят. Нужна поддержка определения языка для текста, а её на уровне кодов глифов нет. И даже если ввести — надо городить ещё одну здоровенную таблицу символов, в которую перегонять уже из юникода. Нафиг это надо? Если эта таблица ещё будет рассматриваться как замена юникоду, то допустим.

Чем именно традиции болгарской типографики отличаются от традиций русской?

https://upload.wikimedia.org/wikipedia/commons/a/a6/Bolgaritsa.svg

~~contra_sperm_spero~~
(19.08.15 23:10:23 UTC)

Ответ на: комментарий от h578b1bde 19.08.15 21:53:32 UTC

А что, остальные юникодные кодировки обратно не совместимы? Через символ тоже можно читать, откройте произвольный бинарник для шин32 в ASCII-представлении и убедитесь.

~~contra_sperm_spero~~
(19.08.15 23:13:32 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 23:10:23 UTC

Противоречие внутри первого утверждения.

По-прежнему не вижу.

Почему?

Потому что в большинстве однобайтовых кодировок нету нормального тире, многоточия, ударения, типографских кавычек и других частоиспользуемых символов, например ₴ для Украины.

То есть подбор подходящей для задачи технологии — фашизм

Технология UTF-8 отлично подходит для этой задачи, можешь записывать меня в ряды своих воображаемых „фашистов”.

Ctrl+F — это управляющий символ 6, то бишь PgDn

В моей реальности Ctrl+F вызывает поиск в браузере, как там в параллельной мне не слишком интересно.

Ясно, мусьё даже читать не умеет.

В используемой тобой кодировке отсутствует знак вопроса?

И даже если ввести — надо городить ещё одну здоровенную таблицу символов, в которую перегонять уже из юникода. Нафиг это надо? Если эта таблица ещё будет рассматриваться как замена юникоду, то допустим.

Я тоже не понял нафиг это надо, учитывая что юникод ещё не закончился.

https://upload.wikimedia.org/wikipedia/commons/a/a6/Bolgaritsa.svg

«Болгарская кириллица» («болгарица», прямой курсив) — придание символам кириллических шрифтов и надписей черт, свойственных латинскому алфавиту. Может использоваться намеренно в качестве эксперимента с формой символов. Характерно для болгарской школы шрифтового дизайна (отсюда само выражение), а также непрофессионально выполненных кириллических шрифтов.

Ок, только непонятно зачем ради экспериментальных шрифтов от школьников городить определение языка.

~~h578b1bde~~ ★☆
(20.08.15 00:14:39 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 23:13:32 UTC

А что, остальные юникодные кодировки обратно не совместимы?

Представь себе.

Через символ тоже можно читать, откройте произвольный бинарник для шин32 в ASCII-представлении и убедитесь.

И с чего ты решил что там обязательно будет UTF-16BE?

~~h578b1bde~~ ★☆
(20.08.15 00:26:16 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 20:59:22 UTC

А у турков Iı и İi — разные буквы

Ты про это? Да, возможно это фейл создателей юникода, решить это можно вынеся пары Iı и İi в виде отдельных символов для последующего их использования в турецком. Но неясно как этот факт должен оправдывать использование однобайтовых кодировок, в которых проблем ещё больше.

~~h578b1bde~~ ★☆
(20.08.15 00:59:39 UTC)

Ответ на: комментарий от contra_sperm_spero 19.08.15 22:56:43 UTC

Таки q, да.

На самом деле l:

movl	$1, %edi ; передаем через 32-битный edi
; стек не используется
movl	%edi, %eax
movb	%al, -20(%rbp) ; присваивание inner = flag

KennyMinigun ★★★★★
(20.08.15 06:39:59 UTC)

Ответ на: комментарий от h578b1bde 20.08.15 00:14:39 UTC

По-прежнему не вижу

Положение «Единственная нормальная ASCII-совместимая кодировка» так же легко применяется к любой другой ASCII-совместимой кодировке. Соответственно, для опровержения своего мирдверьмячества Вам требуется доказать ненормальность каждой или доказать, что нормальной по всем показателям может быть только UTF-8.

₴
частоиспользуемых

Теллмимоар.

для Украины

Только при чём тут сайт, на котором не разрешён украинский язык?

Технология UTF-8 отлично подходит для этой задачи

Я уже упоминал, что она хуже аналогов подходит по объёму трафика и занимаемого базой данных дискового пространства. Именно для этой задачи, не для какого-то матлаба или сферичновакуумного инстаграма, на котором рядом сидят индусы и корейцы и обмазываются иконочками из четырёхбайтового хрюникода.

В моей реальности Ctrl+F вызывает поиск в браузере

Это не реальность, это куашматрица.

В используемой тобой кодировке отсутствует знак вопроса?

Я разработал в детстве пятибитную кодировку, в которой была только 31 буква кириллицы и пробел. Но не пользуюсь ею, так что нет.

Я тоже не понял нафиг это надо, учитывая что юникод ещё не закончился

На тот фиг, что забитые позиции перетасовывать уже никто не будет, и добавлять повторно уже забитые символы тоже вряд ли (хотя бы потому, что куча старых текстов в языконезависимых диапазонах символов никуда не денется, а сортировать с учётом возможной мешанины станет только сложнее).

экспериментальных шрифтов от школьников

Nu-nu, čto ž wy togda alfawitom ot etih že škol'nikow pol'zujeŧes'?

~~contra_sperm_spero~~
(14.11.15 01:22:40 UTC)

Ответ на: комментарий от h578b1bde 20.08.15 00:26:16 UTC

И с чего ты решил что там обязательно будет UTF-16BE?

С того, что в нём заголовки пакуются.

~~contra_sperm_spero~~
(14.11.15 01:25:01 UTC)

Ссылка

Ответ на: комментарий от h578b1bde 20.08.15 00:59:39 UTC

возможно это фейл создателей юникода

Это просто результат их подхода к наполнению таблицы.

как этот факт должен оправдывать использование однобайтовых кодировок

Ну та же КОИ8 эту проблему решает (вариаций наклепали под кучу кириллических письменностей).

~~contra_sperm_spero~~
(14.11.15 01:33:17 UTC)

Ответ на: комментарий от KennyMinigun 20.08.15 06:39:59 UTC

Но в стеке-то вообще один байт?

~~contra_sperm_spero~~
(14.11.15 02:01:28 UTC)

Ссылка

Ответ на: комментарий от contra_sperm_spero 14.11.15 01:33:17 UTC

Ну та же КОИ8 эту проблему решает

И где там турецкие Iı и İi?

вариаций наклепали под кучу кириллических письменностей

В итоге когда тебе присылают документ на кириллице — нужно поиграть в угадайку и попрыгать с бубном?

~~h578b1bde~~ ★☆
(14.11.15 11:21:13 UTC)

Ответ на: комментарий от contra_sperm_spero 14.11.15 01:22:40 UTC

Положение «Единственная нормальная ASCII-совместимая кодировка» так же легко применяется к любой другой ASCII-совместимой кодировке. Соответственно, для опровержения своего мирдверьмячества Вам требуется доказать ненормальность каждой или доказать, что нормальной по всем показателям может быть только UTF-8.

Неа, раз ты так ратуешь за однобайтные кодировки — для начала ты должен доказать преимущества любой другой ASCII-совместимой кодировки над UTF-8, из-за которых я должен всё бросить и срочно начать везде выпиливать её у себя.

Теллмимоар.

На каждой второй интернет-барахолке встречается.

Только при чём тут сайт, на котором не разрешён украинский язык?

А при чём тут турецкие буквы? BTW, замени ₴ на символ рубля если тебе так нужна привязка именно к этому сайту.

Я уже упоминал, что она хуже аналогов подходит по объёму трафика и занимаемого базой данных дискового пространства.

Только ты забыл упомянуть что твои аналоги по количеству проблем ещё хуже.

только 31 буква кириллицы

Фашист!

Nu-nu, čto ž wy togda alfawitom ot etih že škol'nikow pol'zujeŧes'?

Не, алфавит от других людей.

~~h578b1bde~~ ★☆
(14.11.15 11:31:56 UTC)

Ответ на: комментарий от h578b1bde 14.11.15 11:21:13 UTC

И где там турецкие Iı и İi?

К тому, что турецкий текст ею записать нельзя (разве что транслитизациями). Соответственно, выбранная/определённая кодировка однозначно задаёт особенности алфавита. Да, автоопределение можно применить и к юникодному тексту, но там теоретически может быть несколько языков вперемешку, а нужно такое на практике не всегда. Проблема настолько сурова, что во многих языках разметки (например, OpenDocument) блоки текста заворачиваются в контейнеры с пометкой языка. Никогда не боролись с байдой в статусбаре M$Word, показывающей, какого хрена вполне грамотный текст целиком подчёркнут красным?

нужно поиграть в угадайку

Нормальный софт уже лет 10-15 не имеет проблем с определением кодировок. Разные классы легко различаются по частоте использования старших тетрад, также просто отличается латиница с диакритикой от нелатиницы, среди класса уже — по словарю или характерным лексемам.

~~contra_sperm_spero~~
(16.01.16 22:30:14 UTC)

Ссылка

Ответ на: комментарий от h578b1bde 14.11.15 11:31:56 UTC

и срочно начать везде выпиливать

Не везде, а там, где это целесообразно. А преимущества я уже выше описал.

каждой второй интернет-барахолке

Каждой второй украинской?

замени ₴ на символ рубля

Его даже в курсотредах не сыщешь, какая «частоиспользуемость»? Ну и в чём проблема вставить символ HTML-сущностью, если умник с чармапом или дедкеем таки его принёс?

твои аналоги по количеству проблем ещё хуже

Приведите проблемные факторы, которые нивелируют оптимизацию трафика и объёма БД.

Фашист!

Морзянку тоже фашисты придумали? Ну туда позднее хотя бы знаки препинания, эррор и цифры засунули. И то не взлетело.

Не, алфавит от других людей.

Неужто Кирилл с Меѳодием — жиды?

~~contra_sperm_spero~~
(16.01.16 22:41:02 UTC)

Ссылка

Похожие темы