Капча с оттенками серого, всегда 6 цифр. Сложность в том, что на неё накладываются геометрические фигуры и цвета цифр в месте пересечения инвернтируются.
Примеры:
http://itmages.ru/image/view/5226734/1e172311 http://itmages.ru/image/view/5226733/b91e814f
У сервиса можно запрашивать капчу несколько раз и он будет возвращать одну и ту же! Но по-разному «зашумленную»! Это офигенно облегчает задачу.
Сейчас скармливаю её tesseract-ocr и из 10 вариантов одних и тех же цифр он только на двух-трех распознает по одному символу.
Можно дальше увеличивать число вариантов одних и тех же цифр (сервис исправно её отдает, а потом еще и принимает в форме), но думаю есть способы улучить распознаваемость.
Подскажите как это сделать, какие есть инструменты, технологии? Какой порядок действий Вы бы предприняли?
Написаный код (если получится) опубликую прямо тут.