ABBYY объявил о поддержке наиболее популярных восточных языков в системе ABBYY FineReader 9.0.
ABBYY представила расширенную версию системы оптического распознавания текста ABBYY FineReader 9.0 с поддержкой иврита, китайского (традиционного и упрощенного написания), японского и тайского языков. Признанная во всем мире система оптического распознавания теперь поддерживает 184 языка – европейских, азиатских, африканских и ближневосточных. Включение в ABBYY FineReader 9.0 дополнительных языков позволит расширить пользовательскую аудиторию системы на 2 миллиарда человек.
В документах на тайском языке слова пишутся слитно, без пробелов, а буквы и диакритические знаки могут располагаться в строке на четырeх различных уровнях. В иврите используется «обратное» направление письма (справа налево), но в тех случаях, когда в тексте попадаются слова на иностранных языках, они пишутся слева направо. Китайский язык имеет два варианта написания – упрощенное и традиционное, а сами иероглифы имеют несколько вариантов написания.
«ABBYY FineReader 9.0 распознает 10 тысяч иероглифов, при этом в работе над базой мы использовали несколько миллионов вариаций иероглифов. Благодаря тому, что мы совершенствуем собственные технологии распознавания, а не лицензируем сторонние разработки, это позволяет нам достигать высокого качества распознавания даже в работе с такими сложными языками как иврит, китайский, тайский и японский. Обновленный ABBYY FineReader 9.0. – это результат колоссальной, почти десятилетней работы большого коллектива. Это проект,в котором были помимо наших специалистов задействованы и носители соответствующих языков», – продолжает Сергей Попов.
В ходе сравнительных тестов новая версия ABBYY FineReader 9.0 продемонстрировала более высокое качество распознавания по сравнению с аналогичными системами других производителей. Так, качество распознавания китайского языка в ABBYY FineReader 9.0 превосходит показатели ближайших аналогов в среднем на 35-40% (упрощенное и традиционное написание соответственно), а иврита – на 60%.
Механизм интеллектуального определения языка распознавания позволяет ABBYY FineReader 9.0 успешно обрабатывать особо сложные документы, содержащие комбинацию буквенных и иероглифических языков, например, китайского и английского. Помимо распознавания дополнительных языков, в новой версии ABBYY FineReader 9.0 значительно увеличена скорость запуска приложения, а также добавлена возможность выбора китайского в качестве языка интерфейса.
Среди новых возможностей ABBYY FineReader 9.0 – распознавание текста с горизонтальной и вертикальной направленностью и возможность выбрать вариант распознавания иероглифа из списка гипотез.