История изменений
Исправление makoven, (текущая версия) :
ïàðàìåòðû îòîáðàæåíèÿ êîíêðåòíîãî çíàêà ïî øàáëîíó
А так понимаю, что изначально был текст на cp1251, который открыли как Latin-1? Но то, что мы видим тут, это на самом деле не Latin-1, а юникод. То-есть какая-то програма (редактор, браузер) отыскала все эти Latin-1 символы (î, ò) в юниокдной таблице и вывела UTF-8 строку. И это нам еще повезло, все символы нашлись в таблице. Могли ведь и не найтись для другой кодировки?
И полученная юникодная строка на уровне байтов уже вовсе ни cp1251 ни Latin-1, а cp1251 => Latin-1 => Utf-8?
Далее непонятен смысл слов encode и decode. По-моему в таких названиях мало смысла. Почему не наоборот, например? Не проще было назвать их to_bytes и to_str?
Исправление makoven, :
ïàðàìåòðû îòîáðàæåíèÿ êîíêðåòíîãî çíàêà ïî øàáëîíó
А так понимаю, что изначально был текст на cp1251, который открыли как Latin-1? Но то, что мы видим тут, это на самом деле не Latin-1, а юникод. То-есть какая-то програма отыскала все эти Latin-1 символы (î, ò) в юниокдной таблице и вывела UTF-8 строку. И это нам еще повезло, все символы нашлись в таблице. Могли ведь и не найтись для другой кодировки?
И полученная юникодная строка на уровне байтов уже вовсе ни cp1251 ни Latin-1, а cp1251 => Latin-1 => Utf-8?
Далее непонятен смысл слов encode и decode. По-моему в таких названиях мало смысла. Почему не наоборот, например? Не проще было назвать их to_bytes и to_str?
Исходная версия makoven, :
ïàðàìåòðû îòîáðàæåíèÿ êîíêðåòíîãî çíàêà ïî øàáëîíó
А так понимаю, что изначально был текст на cp1251, который открыли как Latin-1? Но то, что мы видим тут, это на самом деле не Latin-1, а юникод. То-есть какая-то програма отыскала все эти Latin-1 символы (î, ò) в юниокдной таблице и вывела юникодную строку. И это нам еще повезло, все символы нашлись в таблице. Могли ведь и не найтись для другой кодировки?
И полученная юникодная строка на уровне байтов уже вовсе ни cp1251 ни Latin-1, а cp1251 => Latin-1 => Utf-8?
Далее непонятен смысл слов encode и decode. По-моему в таких названиях мало смысла. Почему не наоборот, например? Не проще было назвать их to_bytes и to_str?