История изменений
Исправление token_polyak, (текущая версия) :
Даже китайцы на своей кодировке сидят
4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.
Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.
алсо, удачи обрабатывать в восьмибитной кодировке строки вроде
żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)
причем без костылей вроде Betacode.
Ах да, забыл заметить, что кодировки GB* - как и, например, Shift JIS - это такой хтонический ужас, что в сравнении с ними даже UTF-8 кажется логичным и хорошо спроектированым (потому что таким и является).
Исправление token_polyak, :
Даже китайцы на своей кодировке сидят
4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.
Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.
алсо, удачи обрабатывать в восьмибитной кодировке строки вроде
żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)
Ах да, забыл заметить, что кодировки GB* - как и, например, Shift JIS - это такой хтонический ужас, что в сравнении с ними даже UTF-8 кажется логичным и хорошо спроектированым (потому что таким и является).
Исправление token_polyak, :
Даже китайцы на своей кодировке сидят
4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.
Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.
алсо, удачи обрабатывать в восьмибитной кодировке строки вроде
żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)
Ах да, забыл заметить, что кодировки GB* - как и, например, Shift JIS - это такой хтонический ужас, что в сравнении с ними даже UTF-8 кажется логичным.
Исправление token_polyak, :
Даже китайцы на своей кодировке сидят
4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.
Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.
алсо, удачи обрабатывать в восьмибитной кодировке строки вроде
żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)
Исходная версия token_polyak, :
Даже китайцы на своей кодировке сидят
4.2.
Жэньминь жибао - да, GB2312.
Их сайт про КПК - тоже.
И журнал Цюши.
Но сайты, на которые многие китайцы заходят каждый день - Байду, Сина, Чжиху, сайт агентства Синьхуа, всякие «BBS», а также комменты в коде (привет den73) и даже названия в файловой системе - всё в Уникоде.
алсо, удачи обрабатывать в восьмибитной кодировке строки вроде
żak - stgn. śrgn. sac (łać. saccus, gr. σάκκος)