LINUX.ORG.RU

История изменений

Исправление saahriktu, (текущая версия) :

Так однобайтным функциям нужно скармливать строки в однобайтных кодировках, например KOI8-R. А это меньше байт чем в UTF-8.

Ещё раз повторяю, что я говорю про конкретные последовательности символов. Если мы одну и туже последовательность символов конвертируем и в KOI8-R и в UTF-8, то получается разное кол-во байт. _При текстах в KOI8-R меньше байт нужно парсить_. А _при тех же самых последовательностях символов в UTF-8 парсить больше_. И от этого никуда не деться.

Человек-то работает с конкретными последовательностями символов. И мне, например, не надо обрывка строки, который вмещается в выделенные N байт, а потому парсится с той же скоростью что и N символов в однобайтной кодировке. Строки нужно парсить полностью. А потому и сравнивать производительность нужно не по байтам, а по кол-ву символов. Независимо от кодировок.

Исходная версия saahriktu, :

Так однобайтным функциям нужно скармливать строки в однобайтных кодировках, например KOI8-R. А это меньше байт чем в UTF-8.

Ещё раз повторяю, что я говорю про конкретные последовательности символов. Если мы одну и туже последовательность символов конвертируем и в KOI8-R и в UTF-8, то получается разное кол-во байт. _При текстах в KOI8-R меньше байт нужно парсить_. А _при тех же самых последовательностях символов в UTF-8 парсить больше_. И от этого никуда не деться.

Человек-то работает с конкретными последовательностями символов. И мне, например, не надо обрывка строки, который вмешается в выделенные N байт, а потому парсится с той же скоростью что и N символов в однобайтной кодировке. Строки нужно парсить полностью. А потому и сравнивать производительность нужно не по байтам, а по кол-ву символов. Независимо от кодировок.