История изменений
Исправление sena, (текущая версия) :
Новых проблем по сравнению с UTF-* это не добавит. Зато можно будет убрать зависимость от локали, в Unicode некоторые символы отображаются по другому в зависимости от локали пользователя.
Да, там ещё с одной турецкой буквой был прикол, я смутно помню. Она в зависимости от локали по-разному сортируется. Если одна локаль то сортировка будет по-одному, а если другая локаль, то те же строки будут отсортированы по-другому. То есть вообще бред выходит.
Нужен именно маркер языка, чтобы знать, что за язык в строке, тогда будет понятно как его сортировать. И орфографию будет удобней проверять - будет точно понятно что за язык здесь, в каком словаре смотреть. Я вообще кучу преимуществ вижу, если мы знаем, какой язык здесь.
Например, одна и та же по-начертанию буква «с» есть во множестве языков, но тем не менее, влепили две буквы «с», одну кириллическую, другую латинскую. Спрашивается, зачем, если я всё равно не знаю, какой язык? Тогда бы уже сделали алфавит для каждого языка, чтобы их можно было отличать. Но нет - тут сэкономили… А с маркером языка это становится логично, упорядочено и удобно. Главное - компактно
Исправление sena, :
Новых проблем по сравнению с UTF-* это не добавит. Зато можно будет убрать зависимость от локали, в Unicode некоторые символы отображаются по другому в зависимости от локали пользователя.
Да, там ещё с одной турецкой буквой был прикол, я смутно помню. Она в зависимости от локали по-разному сортируется. Если одна локаль то сортировка будет по-одному, а если другая локаль, то те же строки будут отсортированы по-другому. То есть вообще бред выходит.
Нужен именно маркер языка, чтобы знать, что за язык в строке, тогда будет понятно как его сортировать. И орфографию будет удобней проверять - будет точно понятно что за язык здесь, в каком словаре смотреть. Я вообще кучу преимуществ вижу, если мы знаем, какой язык здесь.
Например, одна и та же по-начертанию буква «с» есть во множестве языков, но тем не менее, влепили две буквы «с», одну кириллическую, другую латинскую. Спрашивается, зачем, если я всё равно не знаю, какой язык? Тогда бы уже сделали алфавит для каждого языка, чтобы их можно было отличать. Но нет - тут сэкономили… А с маркером языка это становится логично, упорядочено и удобно.
Исправление sena, :
Новых проблем по сравнению с UTF-* это не добавит. Зато можно будет убрать зависимость от локали, в Unicode некоторые символы отображаются по другому в зависимости от локали пользователя.
Да, там ещё с одной турецкой буквой был прикол, я смутно помню. Она в зависимости от локали по-разному сортируется. Если одна локаль то сортировка будет по-одному, а если другая локаль, то те же строки будут отсортированы по-другому. То есть вообще бред выходит.
Нужен именно маркер языка, чтобы знать, что за язык в строке, тогда будет понятно как его сортировать. И орфографию будет удобней проверять - будет точно понятно что за язык здесь, в каком словаре смотреть. Я вообще кучу преимуществ вижу, если мы знаем, какой язык здесь.
Например, одна и та же по-начертанию буква «с» есть во множестве языков, но тем не менее, влепили две буквы «с», одну кириллическую, другую латинскую. Спрашивается, зачем, если я всё равно не знаю, какой язык? Тогда бы уже сделали алфавит для каждого языка, чтобы их можно было отличать. Но нет - тут сэкономили… А с маркером языка это становится логично.
Исходная версия sena, :
Новых проблем по сравнению с UTF-* это не добавит. Зато можно будет убрать зависимость от локали, в Unicode некоторые символы отображаются по другому в зависимости от локали пользователя.
Да, там ещё с одной турецкой буквой был прикол, я смутно помню. Она в зависимости от локали по-разному сортируется. Если одна локаль то сортировка будет по-одному, а если другая локаль, то те же строки будут отсортированы по-другому. То есть вообще бред выходит.
Нужен именно маркер языка, чтобы знать, что за язык в строке, тогда будет понятно как его сортировать. Ну и кодировка тоже, конечно пригодится, если у языка их несколько. И орфографию будет удобней проверять - будет точно понятно что за язык здесь, в каком словаре смотреть. Я вообще кучу преимуществ вижу, если мы знаем, какой язык здесь.
Например, одна и та же по-начертанию буква «с» есть во множестве языков, но тем не менее, влепили две буквы «с», одну кириллическую, другую латинскую. Спрашивается, зачем, если я всё равно не знаю, какой язык? Тогда бы уже сделали алфавит для каждого языка, чтобы их можно было отличать. Но нет - тут сэкономили… А с маркером языка это становится логично.