LINUX.ORG.RU
Ответ на: комментарий от MyTrooName

1. В plain-text они не нужны, а в латехе для них есть соответствующие заменители, так что мимо.

2. Мне шлют письма в цп1251, я в ответ шлю в вкои-8. У нас и почтовый сервер на кои8 (да и сервера основные на нем, ибо хрюникод там нафиг не впился). Зачем в почте или вебе хрюникод? Фамилии иносранцев с умляутами писать? Да и без умляутов сойдет!

3. Ты все исходники статей, мануалов и т.п. будешь зиповать? Латех на лету не умеет раззиповывать, да и смысл? Ну и вообще, уже выше говорили: не в размере счастье, а в удобстве. Мне удобно работать так, что 1 символ == 1 байт. И мне нахрен не нужно это «счастье» под названием хрюникод. Особенно когда я под мелкоконтроллерами что-то делаю, где даже printf свой городишь, потому как системный слишком жирный…

anonymous
()
Ответ на: комментарий от saahriktu

Не проще ли выбрать кодировку один раз в жизни?

утф8 хватит всем

тексты занимают меньше места на носителях

мои 2x3тбHDD смотрят на тебя с недоумением

и в оперативке

к HDD присоединяются 32гб рама.

быстрее обрабатываются;

ха.

Можно продолжать юзать <<main (int argc, char **argv)>>, strncpy, strncmp, printf,...

сомнительное преимущество

В ядерной консоли

в повседневной жизни как-то не очень нужно

извлекать преимущества KOI8-R

из кои8 ничего кроме трупных червей уже извлечь нельзя.

Deleted
()
Ответ на: комментарий от thunar

Возможность работы с символами как с байтами, если не нужно ничего за пределами ASCII.

я тебе открою секрет, в утф8 такая ж хрень, ибо ASCII==«первые 127 символов юникода». То есть если ничего кроме символов ascii не используется, то и утф8 будет однобайтовым.

Deleted
()
Ответ на: комментарий от anonymous

Будь тоньше.

И пню понятно, что хрюникод нужен только китайцам и составителям многоязычных талмудов. 99.9999% остального населения земного Шарика это говно нафиг не сдалось

не являюсь китайцем или составителем многоязычных талмудов, но мне без юникода причалько. ЧЯДНТ?

Deleted
()
Ответ на: комментарий от int13h

А я и не уходил. Деанонимироваться же не собираюсь. ЛОР уже давно не торт.

anonymous
()
Ответ на: комментарий от crutch_master

Если у тебя маны в кои

ССЗБ

а если огромная бд с полнотекстовым поиском,

но ведь такие бд и пускают обычно не на тостерах

Deleted
()
Ответ на: комментарий от Deleted

Выпендриваешься просто. Тебе хрюникод не нужен в консоли, будь уверен!

А в окнах иксовых приложений насрать что используется. Там, кстати, наоборот хрюникод нужен, иначе как, скажем, okular будет формулы отображать?

Исходникам, консоли и русскому вебу — КОИ8, иксам — хрюникод. Вот так правильно.

anonymous
()
Ответ на: комментарий от anonymous

Да и без умляутов сойдет!

Заведомо неправильное написание имя/фамилии собеседника - это как бы проявление неуважения к нему. (Если, конечно, вы не пили с ним на брудершафт)

А еще такая прохладная история: В Германии на картах можно найти как Münster так и Munster. И это нихера не один город.

Deleted
()
Ответ на: комментарий от Deleted

Насрать. Вообще, нет смысла фамилии с умляутами писать в оригинале: никому же в голову не приходит ускоглазых именовать на их языке — все равно кроме них никто этого не поймет.

А в КОИ8 все нормально можно на русском записать. Те же города: Мюнстер и Мунстер — вуаля!!!

anonymous
()
Ответ на: комментарий от Deleted

Вскрой ею себе горло. Потому что как раз принцип Оккама, напомню тебе, говорит, что нет нужды новые сущности плодить. Поэтому тащить хрюникод в консоль, где уже за долгие годы прижилась однобайтовая кодировка — идиотизм и содомия!

anonymous
()
Ответ на: комментарий от anonymous

Те же города: Мюнстер и Мунстер — вуаля!!!

угу, едешь в командировку, пишешь встречающей стороне «встречайте меня в Munster». А потом - уупс, не тот город.

Deleted
()
Ответ на: комментарий от Deleted

А я никак и не напишу из планшета букву ü. И уж тем паче не напишу название Киото на ниппонском. Естественно, напишу по-русски или латинницей.

Ты еще Фыкъеблагъэ вулкан германский на их родном языке напиши…

anonymous
()
Ответ на: комментарий от anonymous

Исходникам, консоли и русскому вебу — КОИ8

Батенька, вернитесь в своё фидо и не отсвечивайте.

Мне шлют письма в цп1251, я в ответ шлю в вкои-8.

...и нежно мурлыкает Зухель на 33600.

devl547 ★★★★★
()
Последнее исправление: devl547 (всего исправлений: 1)
Ответ на: комментарий от MyTrooName

где тут может понадобиться отрезать M non-ascii символов?

Разве это не очевидно?
MyTrooName ★★★★ (07.06.2017 11:29:00)
Ник, звёзды, дата. Вырезать текст поста из html.

crutch_master ★★★★★
()
Ответ на: комментарий от Deleted

но ведь такие бд и пускают обычно не на тостерах

То, что софт крутится не на тостерах не повод для говнокодерства. Если какая-нибудь однобайтовая кодировка даёт солидный прирост к производительности и многобайтовая никак не нужна, то выбор очевиден, я считаю.

crutch_master ★★★★★
()
Ответ на: комментарий от crutch_master

MyTrooName ★★★★ (07.06.2017 11:29:00)

дата

что мешает отрезать нужное количество байт в utf8?

Ник, звёзды,

увы, один фиг надо искать разделитель. что в кои8, что в utf8

Вырезать текст поста из html.

я не мсье, я бы просто xpath сделал. расскажи мне, какое константное число символов от начала документа перед постом? или тоже нужно искать?

MyTrooName ★★★★★
()
Последнее исправление: MyTrooName (всего исправлений: 1)
Ответ на: комментарий от MyTrooName

что мешает отрезать нужное количество байт в utf8?

Что гарантирует, что в utf8 число байт будет равно числу символов и завтра, не завезут ники с utf и пр?

я бы просто xpath сделал

Круто. А xpath бы что сделал?

увы, один фиг надо искать разделитель. что в кои8, что в utf8

Ну, например, надо собрать статистику по средней длинне поста в треде. Разделители нашли, если кодировка однобайтовая, то просто конец отнимаем от начала, а так придётся каждый символ чекать.

crutch_master ★★★★★
()
Ответ на: комментарий от crutch_master

не завезут ники с utf и пр?

ты в курсе, ники разной длины бывают.

Круто. А xpath бы что сделал?

с utf8 в точности то же самое, что и с koi8, только оперируя байтами, а не символами

Ну, например, надо собрать статистику по средней длинне поста в треде. Разделители нашли, если кодировка однобайтовая, то просто конец отнимаем от начала, а так придётся каждый символ чекать.

вот это подходящий пример, спасибо. хотя слишком специфичный, но подходящий

MyTrooName ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.