LINUX.ORG.RU
ФорумTalks

[breaking news] В питоне используются корни офтопика

 


0

1
#!/usr/bin/env python
#-*- coding:utf-8 -*-

import chardet
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
sting = 'абвгд' 

print 'Тест 1: ', chardet.detect(sting) # utf-8

print '\nТест 2:'

for l in sting:
    print l
    print chardet.detect(l) # windows-1252

Запускаем скрипт и убеждаемся сами. В первом тесте кодировка utf-8, во втором тесте кодировка офтопика.

★★★★★

Последнее исправление: Siado (всего исправлений: 3)

И вообще слишком уныло и толсто, даже далекие от питона это поймут. Будь я модератором, удалил, за разжигание, так сказать.

baverman ★★★
()

> ...detect(sting)...

Есть у Стинга пару песен нормальных, а так не... не фанат...

DrF
()

chardet это видимо charset а sting это string?

XoFfiCEr ★★☆☆
()
Ответ на: комментарий от Siado

Ты идиот? Суешь чардету байт (один байт!) и ожидаешь от него какой-то вменяемой кодировки, окромя дефолтной европейской?

baverman ★★★
()
Ответ на: комментарий от Siado

chr(225) в какой кодировке этот байт? Горе луковое.

baverman ★★★
()
Ответ на: комментарий от Siado

Очевидный фикс, твоему кривому коду, глупыш.

#!/usr/bin/env python
#-*- coding:utf-8 -*-

import chardet
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
sting = 'абвгд'

print 'Тест 1: ', chardet.detect(sting)

print '\nТест 2:'

for i in range(0, len(sting), 2):
    print sting[i:i+2]
    print chardet.detect(sting[i:i+2])
baverman ★★★
()
Ответ на: комментарий от baverman

Очевидно ты сможешь рассказать, почему выбрали виндовую кодировку 1252 для перекодировки, а не стандарт ISO?

Siado ★★★★★
() автор топика
Ответ на: комментарий от Siado

почему выбрали виндовую кодировку 1252 для перекодировки, а не стандарт ISO?

Сначала задай вопрос, кто выбрал, а потом тупи дальше.

baverman ★★★
()
Ответ на: комментарий от Andru

No module named chardet

Да, chardet не входит в стандартную библиотеку.

baverman ★★★
()

а по твоему он как детектит? Я думаю частотными таблицами. Какая подошла лучше ту и пихает....

demmsnt
()
Ответ на: комментарий от Siado

> SyntaxError: invalid syntax

Импорт не выполнил что ли?


Ага.

pevzi ★★★★★
()
Ответ на: комментарий от demmsnt

ТСу не нравится название офтопика в имени кодировки. Хотя причем тут питон — тайна великая есть.

baverman ★★★
()

потому что это клон библиотеки mozilla, а они те еще виндузятники

maxcom ★★★★★
()

1251 вообще-то хорошая, годная кодировка.

moscwich
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.