OCR для распознавания рукописного ввода в .NET

Мне нужно использовать компонент OCR в приложении .NET, который может распознавать почерк. Мы запустили компонент MODI из офиса MS, и он распознает печатный текст, но не рукописный ввод.

Я не против заплатить.

Есть ли у кого-нибудь рекомендации?

Большое спасибо Джим


person Community    schedule 26.02.2009    source источник
comment
Возможно, это не очень поможет, но я нашел вот это: ocrtools.com   -  person ryeguy    schedule 26.02.2009


Ответы (5)


Я рекомендую Pegasus Imaging, мы используем его каждый день, и это здорово. Для рукописного ввода у вас есть модуль ICR.

person Jedi Master Spooky    schedule 26.02.2009
comment
Компонент Pegasus OCR работает нормально и довольно быстро - person dance2die; 26.02.2009

В моем приложении нам нужно было распознать некоторые формы, которые были заполнены текстом, напечатанным вручную. Точность была хорошей, пока пользователи использовали правильно сформированные символы. SDK, который я использовал, называется Leadtools. Мое приложение использует MFC, но у них также есть классы .NET.

person Yaseen Abood    schedule 15.05.2012

Большинство наборов инструментов OCR нацелено на распознавание печатного текста, а не рукописного текста. Я бы порекомендовал инструментарий Atalasoft для гибкости в том, что вы можете встраивать различные движки OCR.

Распознать рукописный текст гораздо труднее и сложнее. Обычно он обозначается как Intelligent Character Recognition (ICR), и я не уверен, что Atalasoft, Pegasus или большинство коммерческих продуктов поддерживают ICR. Рукописному распознаванию помогает написание каждой буквы в ячейке сетки, как если бы вы указали свое имя в SAT. Вы говорите о произвольном тексте или о сетке?

person flipdoubt    schedule 26.02.2009
comment
Flipdoubt: запись на сетке в стиле формы OCR. У нас есть контроль над формой, поэтому, если есть определенный набор инструментов для создания форм OCR, который сотрудничает с компонентом .NET, все будет в порядке. - person ; 26.02.2009

Попробуйте tessnet, это движок .NET OCR с открытым исходным кодом, основанный на тессеракте.

person Mauricio Scheffer    schedule 11.06.2009
comment
В Tesseract четко указано, что он не поддерживает рукописный ввод. - person Gecko; 15.07.2016

Важно различать рукописный текст и рукописный шрифт. Термин ICR обычно используется для обозначения текста, напечатанного вручную.

Accusoft Pegasus предоставляет SDK SmartZone ICR .NET, который позволяет очень быстро распознавать текст. Точность становится все лучше и лучше по мере того, как вы получаете контроль над тем, как вводится текст, например, в форме и т. Д.

Также важно понимать, что сигналы, доступные для распознавания в реальном времени, например, на планшетном ПК, полностью отличаются от тех, которые доступны в отсканированном изображении. Вот почему распознавание курсива в реальном времени намного проще, чем постфактум (отсканированное изображение). Вы можете читать движения пера, и порядок штрихов очень помогает при распознавании.

person Community    schedule 16.06.2009