LINUX.ORG.RU

опрос. результаты распознования

 ,


0

1
(("V(1)->V(5), used fragments: (1 2 3 4), recognized: М(0.7058823)")
 ("V(1)->V(3), used fragments: (1 2), recognized: h(0.77272725)"
  "V(3)->V(5), used fragments: (3 4), recognized: Л(0.7083334)")
 ("V(1)->V(3), used fragments: (1 2), recognized: h(0.77272725)"
  "V(3)->V(4), used fragments: (3), recognized: f(0.7692308)"
  "V(4)->V(5), used fragments: (4), recognized: J(0.7692308)")
 ("V(1)->V(2), used fragments: (1), recognized: t(1.0)"))

Выше приведены результаты распознавания области содержащей несколько символов или один символ. В этой области содержится 4 фрагмента(они могли сами по себе быть разделены или с помощью алгоритма сегментации). Каждый подсписок (...) содержит ветви графа перехода, участвующие в распознавании, каждая ветвь содержит объединение фрагментов области и результат их распознавания. Если в списке несколько ветвей, то это означает последовательность распознанных символов. К примеру, 2ой список - «hЛ». Всего в области 4 фрагмента. Они соответствуют по индексам вершинам графа. Кроме 5ой, которая является вершиной конца строки.

Какому результату вы больше верите и почему?

Картинку нормальную (как все нормальные люди изображают графы) вместо скобочек-подсписков нарисовать было не судьба?

Manhunt ★★★★★
()
Последнее исправление: Manhunt (всего исправлений: 1)
Ответ на: комментарий от Manhunt

Граф тут нужен чтобы объяснить откуда взялось 4 варианта распознавания. Он не играет ключевой роли.

pseudo-cat ★★★
() автор топика
Ответ на: комментарий от pseudo-cat

Если он точно ни для чего не нужен, то не надо было его упоминать.
Если он все-таки какую-то роль в твоих объяснениях может играть и ты решил его упомянуть, то следовало сделать это по-человечески.

А ты вместо этого вывалил невнятное нагромождение символов.

Manhunt ★★★★★
()
Последнее исправление: Manhunt (всего исправлений: 2)

ветви графа перехода

Что такое «граф перехода»? Как ребра графа соотностся с фрагментами?

Manhunt ★★★★★
()

я ничего не понял. какое отношение вопрос имеет к процитированному тексту?

jtootf ★★★★★
()
Ответ на: комментарий от pseudo-cat

Он не играет ключевой роли.

В тексте, которым ты сопроводил свою скобчатую мудянку, содержится 8 фраз (не считая вопроса). В 4 фразах из этих 8 (то есть в 50% фраз) содержатся слова «граф», «ветвь», «вершина». Теперь ты говоришь, что всё это не играет ключевой роли и не важно. Что за бред?!

Manhunt ★★★★★
()
Последнее исправление: Manhunt (всего исправлений: 2)
Ответ на: комментарий от Manhunt

всё это нужно чтобы понять откуда появился результат. А вопрос заключается в том чему ты больше доверяешь из приведённых результатов и почему. Не думал что настолько не очевидно, но приведу вылизанные результаты -

Слово A1: 
    Фрагменты с индексами 1 2 3 4, результат распознавания: М, коэффициент распознавания: 0.7058823
Слово A2:
    Фрагменты с индексами 1 2, результат распознавания: h, коэффициент распознавания: 0.77272725
    Фрагменты с индексами 3 4, результат распознавания: Л, коэффициент распознавания: 0.7083334
Слово A3:
    Фрагменты с индексами 1 2, результат распознавания: h, коэффициент распознавания: 0.77272725
    Фрагменты с индексами 3, результат распознавания: f, коэффициент распознавания: 0.7692308
    Фрагменты с индексами 4, результат распознавания: J, коэффициент распознавания: 0.7692308
Слово A4: 
    Фрагменты с индексами 1, результат распознавания: t, коэффициент распознавания: 1.0 
В A1, А2, А3 участвуют все фрагменты, в А4 только один фрагмент. Также можно было отдельно рассмотреть результаты с фрагментами 2, 3, 4 и их сочетаниями, но для упрощения я не стал их включать.

pseudo-cat ★★★
() автор топика
Ответ на: комментарий от pseudo-cat

Пытаться гадать на втором после запятой знаке непонятных магических коэффициентов распознавания — занятие сомнительное. Нужен какой-то независимый от распознавателя источник оценок. Или лучше несколько *независимых* друг от друга источников. Я бы рассмотрел каждую букву совместно с ее соседями (например, в контексте строки или страницы):

  1. Когда распознаватель букву распознал, он в результате должен был уточнить её расположение в сегменте и размеры. Если он этого не сделал, нужно сделать это самостоятельно, то есть найти best fit модели буквы на конкретные растровые данные. Далее:
    • Геометрические размеры каждой буквы. Обычно в текстах используется несколько типовых размеров, а всё что в них не вписывается — фуфло. Разве что, для первой буквы в абзаце можно исключение делать.
    • Кернинг и всё такое. Если буква расположена относительно других букв абсолютно невменяемым образом, то ну её нафиг.
    • Типовой вид конкретной буквы в конкретном тексте. Если буква «h» уже встречалась в этом тексте 10 раз, то можно составить растровую модель (хотя бы построить частотное распределение яркости каждого пикселя), как обычно буква «h» именно в этом тексте выглядит. Слишком уж атипичные буквы — фуфло.
  2. Людишки из своих никчемных букв обычно составляют какие-то осмысленные тексты, а не просто пишут какие попало буквы в абы каком порядке. Отсюда:
    • Обычно русские и английские буквы разделены пробелами, знаками препинания, или хотя бы числами. Поэтому слово A2 — фуфло.
    • Обычно слова словарные, а если в словаре слова нет, то оно хотя бы слоговую структуру имеет (гласные-согласные чередуются в соответствии с частотными данными для конкретного человеческого языка). За исключением формул, конечно. Поэтому слово A3 — какое-то подозрительное.

Поскольку оценка каждой буквы завит от интерпретации всех остальных букв, то, видимо, для всей страницы придётся сделать несколько итераций (пока суммарная оценка достоверности распознавания всех букв на странице не стабилизируется).

чему ты больше доверяешь из приведённых результатов и почему

Без дополнительных сведений варианты A1, A3 и A4 выглядят равноправными. Для варианта A4 нужно как-то оценить правдоподобность предположения, что в сегментах 2, 3 и 4 ничего не написано.

Manhunt ★★★★★
()
Последнее исправление: Manhunt (всего исправлений: 3)
Ответ на: комментарий от Manhunt

ок, критерии одного участника понятны. Вот, кстати, варианты распознавания твоего ника -

"Маnhunt" 
"МаnhuГзt" 
"МаГзhunt" 
"МаГзhuГзt" 
"МаnhLjnt" 
"МаnhLjГзt" 
"МаГзhLjnt" 
"МаГзhLjГзt" 
"Маnhunиt" 
"МаnhuГзиt" 
"МаГзhunиt" 
"МаГзhuГзиt" 
"МаnhLjnиt" 
"МаnhLjГзиt" 
"МаГзhLjnиt" 
"МаГзhLjГзиt" 
"МаnYзunt" 
"МаnYзuГзt" 
"МаГзYзunt" 
"МаГзYзuГзt" 
"МаnYзLjnt" 
"МаnYзLjГзt" 
"МаГзYзLjnt" 
"МаГзYзLjГзt" 
"МаnYзunиt" 
"МаnYзuГзиt" 
"МаГзYзunиt" 
"МаГзYзuГзиt" 
"МаnYзLjnиt" 
"МаnYзLjГзиt" 
"МаГзYзLjnиt" 
"МаГзYзLjГзиt" 
"hИаnhunt" 
"hИаnhuГзt" 
"hИаГзhunt" 
"hИаГзhuГзt" 
"hИаnhLjnt" 
"hИаnhLjГзt" 
"hИаГзhLjnt" 
"hИаГзhLjГзt" 
"hИаnhunиt" 
"hИаnhuГзиt" 
"hИаГзhunиt" 
"hИаГзhuГзиt" 
"hИаnhLjnиt" 
"hИаnhLjГзиt" 
"hИаГзhLjnиt" 
"hИаГзhLjГзиt" 
"hИаnYзunt" 
"hИаnYзuГзt" 
"hИаГзYзunt" 
"hИаГзYзuГзt" 
"hИаnYзLjnt" 
"hИаnYзLjГзt" 
"hИаГзYзLjnt" 
"hИаГзYзLjГзt" 
"hИаnYзunиt" 
"hИаnYзuГзиt" 
"hИаГзYзunиt" 
"hИаГзYзuГзиt" 
"hИаnYзLjnиt" 
"hИаnYзLjГзиt" 
"hИаГзYзLjnиt" 
"hИаГзYзLjГзиt" 
"Иаnhunt" 
"ИаnhuГзt" 
"ИаГзhunt" 
"ИаГзhuГзt" 
"ИаnhLjnt" 
"ИаnhLjГзt" 
"ИаГзhLjnt" 
"ИаГзhLjГзt" 
"Иаnhunиt" 
"ИаnhuГзиt" 
"ИаГзhunиt" 
"ИаГзhuГзиt" 
"ИаnhLjnиt" 
"ИаnhLjГзиt" 
"ИаГзhLjnиt" 
"ИаГзhLjГзиt" 
"ИаnYзunt" 
"ИаnYзuГзt" 
"ИаГзYзunt" 
"ИаГзYзuГзt" 
"ИаnYзLjnt" 
"ИаnYзLjГзt" 
"ИаГзYзLjnt" 
"ИаГзYзLjГзt" 
"ИаnYзunиt" 
"ИаnYзuГзиt" 
"ИаГзYзunиt" 
"ИаГзYзuГзиt" 
"ИаnYзLjnиt" 
"ИаnYзLjГзиt" 
"ИаГзYзLjnиt" 
"ИаГзYзLjГзиt" 
"аnhunt" 
"аnhuГзt" 
"аГзhunt" 
"аГзhuГзt" 
"аnhLjnt" 
"аnhLjГзt" 
"аГзhLjnt" 
"аГзhLjГзt" 
"аnhunиt" 
"аnhuГзиt" 
"аГзhunиt" 
"аГзhuГзиt" 
"аnhLjnиt" 
"аnhLjГзиt" 
"аГзhLjnиt" 
"аГзhLjГзиt" 
"аnYзunt" 
"аnYзuГзt" 
"аГзYзunt" 
"аГзYзuГзt" 
"аnYзLjnt" 
"аnYзLjГзt" 
"аГзYзLjnt" 
"аГзYзLjГзt" 
"аnYзunиt" 
"аnYзuГзиt" 
"аГзYзunиt" 
"аГзYзuГзиt" 
"аnYзLjnиt" 
"аnYзLjГзиt" 
"аГзYзLjnиt" 
"аГзYзLjГзиt" 
"аnзunt" 
"аnзuГзt" 
"аГззunt" 
"аГззuГзt" 
"аnзLjnt" 
"аnзLjГзt" 
"аГззLjnt" 
"аГззLjГзt" 
"аnзunиt" 
"аnзuГзиt" 
"аГззunиt" 
"аГззuГзиt" 
"аnзLjnиt" 
"аnзLjГзиt" 
"аГззLjnиt" 
"аГззLjГзиt" 
"аnunt" 
"аnuГзt" 
"аГзunt" 
"аГзuГзt" 
"аnLjnt" 
"аnLjГзt" 
"аГзLjnt" 
"аГзLjГзt" 
"аnunиt" 
"аnuГзиt" 
"аГзunиt" 
"аГзuГзиt" 
"аnLjnиt" 
"аnLjГзиt" 
"аГзLjnиt" 
"аГзLjГзиt" 
"аnunt" 
"аnuГзt" 
"аГзunt" 
"аГзuГзt" 
"аnLjnt" 
"аnLjГзt" 
"аГзLjnt" 
"аГзLjГзt" 
"аnun" 
"аnuГз" 
"аГзun" 
"аГзuГз" 
"аnLjn" 
"аnLjГз" 
"аГзLjn" 
"аГзLjГз" 
"аnjn" 
"аnjГз" 
"аГзjn" 
"аГзjГз" 
"аnn" 
"аnГз" 
"аГзn" 
"аГзГз" 
"nn" 
"nГз" 
"Гзn" 
"ГзГз" 
"зn" 
"зГз" 
"n" 
"Гз" 
"з" 

pseudo-cat ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.