LINUX.ORG.RU
ФорумTalks

Нафига до сих пор используют однобайтовые кодировки?


1

1

Форум наш панорамный - с месяц уже лежит. Хостер смешанную базу цп1251/утф8 криво конвертнул. И дампы старые нифига не отдает.

А нахрена вообще нужно это убожество под название одобайтовые кодировки?

Насколько это убожество массовое?


Ответ на: комментарий от Kroz

Наша проблема в том, что каждый знает чего он не хочет, но мало кто знает чего хочет.

Не нужно говорить за других. Если вы не знаете, чего вы хотите, то это только ваша проблема.

Рекомендую тебе это выяснить - сбережешь много времени.

Оставьте свои рекомендации для себя - сбережете много времени.

andreyu ★★★★★
()
Ответ на: комментарий от Deleted

Мне от гугла письма приходят на русском, а внутрях koi8-r.

Можно перенастроить свой ящик в gmail и письма начнут приходить в UTF-8.

bbk123 ★★★★★
()
Ответ на: комментарий от bbk123

Можно перенастроить свой ящик в gmail и письма начнут приходить в UTF-8.

рецепт в студию :). в настройках есть возможность указать кодировку тобой создаваемых сообщений. быть может ты что-то путаешь? разве гугл будет заниматься таким мазахизмом как перекодирование контента?

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от Deleted

в настройках есть возможность указать кодировку тобой создаваемых сообщений.

Именно.

быть может ты что-то путаешь?

Быть может ты что-то путаешь? Ты получаешь письма от самого Гугла или кто-то тебе шлёт с gmail в koi-8r?

разве гугл будет заниматься таким мазахизмом как перекодирование контента?

В web-gui конечно будет, потому что там исключительно UTF-8.

bbk123 ★★★★★
()
Ответ на: комментарий от bbk123

Быть может ты что-то путаешь?

перечитай мой первый пост еще разок :)))). и да, от Самого Гугла :).

Deleted
()

Выводы:

Для высоконагруженных проектов с заранее четко продуманной архитектурой и стратегией развития - стоит жить на однобайтовых кодировках.

Для хоумпаг и форумов на 100 человек - неиспользование утф8 изначальное - идиотизм полнейший.

dk-
() автор топика

По-моему, так новый стандарт просто убил старые варианты, добавив сложности и толком ничего не решив. Вообще решать проблему многоязыковости на уровне байтовых потоков это чистой воды идиотизм. Чтобы сделать текст жирным, красным, зачеркнутым, субскриптом и т.п. мы используем теги (или другой способ параллельной разметки). В интерфейсе это ctrl-B и др. Переключение языков можно было сделать так же, собственно это уже alt-shift. Что-то сложнее, вроде мат.формулы, в простой текст вообще нельзя вставить. Пусть простые текстовые файлы тогда совсем не содержат информацию о кодировке и по умолчанию будет общесистемная, а лучше latin-1. А те форматы, кому надо, все равно и сейчас имеют признак кодировки — perl: «use utf8», python: -*-encoding-*-, в си и lua строки это просто байты (т.е. глупо юзать что-то кроме утф-8), vim и подобные редакторы имеют возможность прямо в файле указывать кодировку. И ворды без проблем могут хранить информацию о языке рядом с текстом. Да, да, щас может начнется: а тупой пользователь не знает, что за строчка -*-encoding-*-, и случайно сотрет ее. А давно вы видели тупого пользователя сидящего не в ворде?

С уникодом нихрена ничего не решилось. Усложнили легаси, добавили новые публичные проблемы (для примера: плавающая ширина буквы и сложный матчинг вариантов начертания). То есть все сложности свалили в кучу и сказали, что без этого никак. А я срать хотел на китай и прочие больные на голову системы письменности, мне надо, чтобы однобайтовые буквы романо-германской группы работали и все, а на других языковых тегах я скажу «извините, пока только европа, но вот моя почта». Простые инварианты, простая логика. Китайцы сами не дураки, у них и так все свое.

Надо было оставить кодировки, ибо все страны уже как-то решили проблему кодирования локальных букв, а кто еще не решил, тем и не надо, будьте добры потом зайдите в районный комитет. У нас аж целых несколько вариантов, причем все имели свой «геометрический смысл». Стандартизовать нужно было их переключение (имена всем выдать каноничные и все), и допридумать эти ваши математические, символьные и хоббитовские кодировки. И не нужен бы был iconv и всякие угадывалки, т.к. терминалы тоже бы научились переключать кодировки, так же, как они сейчас умеют всякие жирности и цвета. Откройте любой ман, да?

Вот тогда бы и SQL-база ваша сама контролировала чо в чом (строгий column charset), и кривые руки конвертальщика не дотянулись бы до ваших бесценных архивов.

arturpub ★★
()

Насколько это убожество массовое?

Начиная с VFS

TEX ★★★
()
Ответ на: комментарий от Debasher

Однобайтовая кодировка - самое верное и точное решение проблемы необходимости наличия двух языков.

с какой однобайтовой кодировкой я могу юзать немецкий и русский одновременно?

dikiy ★★☆☆☆
()
Ответ на: комментарий от dk-

однобайтовая кодировка - экономия на спичках.

КЦ же очень дорогое.

Ttt ☆☆☆☆☆
()
Ответ на: комментарий от quowah

зоопарк одних только двубайтовых

Я знаю только одну двухбайтовую кодировку - UCS2. И она уже давно отошла в мир иной.

invy ★★★★★
()
Последнее исправление: invy (всего исправлений: 1)
Ответ на: комментарий от Debasher

Форум не обязательно должен быть международным. Перестань уже этот бред писать, и демонстрировать свою ограниченность.

Форумы технической направленности (матан, физика, химия), где нужен греческий алфавит.
Форумы могут быть посвящены культурам других стран, туризму, где надо будет писать различные национальные названия, на трёх языках, да ещё и с транскрипцией. (русский, английский, язык страны, которой посвящено, символы транскрипции).

А ещё, есть страны, в которых несколько национальных языков (сюрприз, сюрприз).

invy ★★★★★
()
Последнее исправление: invy (всего исправлений: 1)
Ответ на: комментарий от zgen

В нее точно все китайцы влезут?

dk-
() автор топика
Ответ на: комментарий от arturpub

убил старые варианты

какие такие старые варианты?

и толком ничего не решив

какета не решив?

добавили новые публичные проблемы (для примера: плавающая ширина буквы и сложный матчинг вариантов начертания)

эти «публичные проблемы» в неюникоде никуда не пропадают, просто создается иллюзия их отсутствия. до момента, когда нужно добавить какой-нибудь экзотический язык

А я срать хотел на китай и прочие больные на голову системы письменности, мне надо, чтобы однобайтовые буквы романо-германской группы работали и все, а на других языковых тегах я скажу «извините, пока только европа, но вот моя почта»

И хорошо, что такие идиоты-потреб*тели не допущены к разработке стандартов. Людей с логикой «если проблема не моя, то она не проблема» нужно убивать.

derlafff ★★★★★
()
Ответ на: комментарий от zgen

Лучше UTF-64. И всяким клингонам места хватит и современным процессорам удобно - они в большинстве 64битные, так что будет машинное слово = 1 символ.

redgremlin ★★★★★
()
Ответ на: комментарий от redgremlin

А разруливать все это как? Кто будет решать, чем её наполнить?

quowah
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.