Патент недели: Как правильно распознать формулу

December 4, 2016

Несмотря на эволюцию систем оптического распознавания печатных документов, алгоритмы распознавания математических формул до сих пор оставляют желать лучшего. Каждый, кто сталкивался хотя бы с началами анализа, знает, какими сложными и многоуровневыми могут быть те же самые уравнения или функции. И их корректное воспроизведение в электронной версии печатного документа — проблема, над решением которой до сих пор бьются разработчики.

 

Решение российских программистов основано на принципиально новом алгоритме. Математическое выражение при его распознавании делится на блоки, каждый из которых распознается отдельно, а затем составляется в единую формулу. К изображению или фрагменту изображения, содержащему математическое выражение, попеременно и рекурсивно применяют горизонтальное и вертикальное разбиение до тех пор, пока полученные при разбиении блоки низшего уровня не будут соответствовать символам, распознаваемым способами распознавания символов. Анализ распознанных символов в виде графа обеспечивает основу для преобразования эквивалентного представления математического выражения, содержащегося на изображении или фрагменте изображения, в цифровую форму. Это позволяет выбрать наиболее оптимальный и точный вид компоновки результатов распознавания, который учитывает варианты распознавания каждого из символов.

 

Читать продолжение в источнике

 

 

 

 

Please reload

Please reload

© 2010-2020 ООО "Арзис Премиум"

  • Vkontakte Social Icon
  • Facebook Social Icon