В МГУ создали алгоритм для поиска ключевых слов в рукописных архивах
Метод рассматривает текст как последовательность отдельных штриховВ пресс-службе Московского государственного университета имени М. В. Ломоносова сообщили, что ученые факультета вычислительной математики и кибернетики разработали алгоритм для автоматического поиска ключевых слов в рукописных текстах. Разработка упростит работу с архивными документами, рукописями и историческими материалами, представленными в виде сканов и фотографий.
© Ferra.ru
Новый подход рассматривает рукописный текст как последовательность отдельных штрихов, формируемых движением пера. Алгоритм включает сегментацию изображения на штрихи, их нормализацию и классификацию с использованием математических описаний формы. Затем выполняется сопоставление последовательностей штрихов запроса и документа, что позволяет находить совпадения и оценивать их точность.
Такой метод обходит ограничения классического распознавания текста и работает напрямую с изображениями рукописей. Эксперименты с реальными рукописями подтвердили высокую точность обнаружения заданных элементов, отметили в пресс-службе.