LINUX.ORG.RU

История изменений

Исправление saahriktu, (текущая версия) :

Это _НЕ_ Unicode. Это wchar

«wide character» - это и есть «символ, который потенциально может весить больше чем 1 байт». То, что и привнесено юникодом.

на разных входных данных

Это одни и теже входные данные, только в разных кодировках. А я про то и говорил. Уже из за одного того, что в UTF-8 текст резко пухнет в байтах, _одну и туже последовательность символов_ становится дольше парсить в байтах. Тормоза by design. Вот если бы байт было бы столько же... Но, это возможно было бы только в том случае если бы юникод был однобайтным. Таким образом от преимуществ однобайтных кодировок никуда не деться.

Исправление saahriktu, :

Это _НЕ_ Unicode. Это wchar

«wide character» - это и есть «символ, который потенциально может весить больше чем 1 байт». То, что и привнесено юникодом.

на разных входных данных

Это одни и теже входные данные, только в разных кодировках. А я про то и говорил. Уже из за одного того, что в UTF-8 текст резко пухнет в байтах, _одни и туже последовательность символов_ становится дольше парсить в байтах. Тормоза by design. Вот если бы байт было бы столько же... Но, это возможно было бы только в том случае если бы юникод был однобайтным. Таким образом от преимуществ однобайтных кодировок никуда не деться.

Исходная версия saahriktu, :

Это _НЕ_ Unicode. Это wchar

«wide character» - это и есть «символ, который потенциально может весить больше чем 1 байт». То, что и привнесено юникодом.

на разных входных данных

Это одни и теже входные данные, только в разных кодировках. А я про то и говорил. Уже из за одного того, что то, что в UTF-8 текст резко пухнет в байтах, _одни и туже последовательность символов_ становится дольше парсить в байтах. Тормоза by design. Вот если бы байт было бы столько же... Но, это возможно было бы только в том случае если бы юникод был однобайтным. Таким образом от преимуществ однобайтных кодировок никуда не деться.