LINUX.ORG.RU

История изменений

Исправление token_polyak, (текущая версия) :

Даже китайцы на своей кодировке сидят

4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.

Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.

алсо, удачи обрабатывать в восьмибитной кодировке строки вроде

żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)

причем без костылей вроде Betacode.

Ах да, забыл заметить, что кодировки GB* - как и, например, Shift JIS - это такой хтонический ужас, что в сравнении с ними даже UTF-8 кажется логичным и хорошо спроектированым (потому что таким и является).

Исправление token_polyak, :

Даже китайцы на своей кодировке сидят

4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.

Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.

алсо, удачи обрабатывать в восьмибитной кодировке строки вроде

żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)
причем без костылей вроде Betacode.

Ах да, забыл заметить, что кодировки GB* - как и, например, Shift JIS - это такой хтонический ужас, что в сравнении с ними даже UTF-8 кажется логичным и хорошо спроектированым (потому что таким и является).

Исправление token_polyak, :

Даже китайцы на своей кодировке сидят

4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.

Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.

алсо, удачи обрабатывать в восьмибитной кодировке строки вроде

żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)
причем без костылей вроде Betacode.

Ах да, забыл заметить, что кодировки GB* - как и, например, Shift JIS - это такой хтонический ужас, что в сравнении с ними даже UTF-8 кажется логичным.

Исправление token_polyak, :

Даже китайцы на своей кодировке сидят

4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.

Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.

алсо, удачи обрабатывать в восьмибитной кодировке строки вроде

żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)
причем без костылей вроде Betacode.

Исходная версия token_polyak, :

Даже китайцы на своей кодировке сидят

4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.

Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.

алсо, удачи обрабатывать в восьмибитной кодировке строки вроде

żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)