Python 3. Имеется скрипт, который определяет кодировку файла, перекодирует в UTF-8 (при необходимости) и загружает текст. При попытке чтения некоторых файлов получаю ошибку:
File "/usr/local/bin/main.py", line 310, in load_array
array=f.read().splitlines()
File "/usr/lib/python3.1/codecs.py", line 300, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd0 in position 0: invalid continuation byte
utf-8 хранит русские буквы в хитром формате, где первый байт 0xd0.
Так может быть, этот байт как-то специально вставлять надо? Если так, то как это делается и как определяется, вставлен ли этот байт?