Украинский электронный словарь объемом почти 200 000 слов выложили в открытый доступ

3499
1

В сети появился словарь для языковедов, компьютерных лингвистов, программистов и всех, кто работает с украинским языком. Он не является академическим, но уже используется для проверки орфографии в hunspell и Libreoffice.org, а также проверки грамматики в программе LanguageTool. В словаре 197 000 слов, из которых генерируются 3,4 млн словоформ с набором тегов для каждой (часть речи, морфологические признаки и дополнительные отметки).

Создатели словаря выложили его на GitHub, где любой желающий может его использовать и предлагать усовершенствования. Проще всего оставить отзыв или предложение на этой странице, на форуме или же по электронной почте.

В словарь постоянно пополняют: добавляют новые информативные теги, исправляют ошибки, вводят форматы вывода и т.д. Главная цель разработчиков — большой электронный словарь, который поможет создать программные средства, поддерживающие украинский язык или анализирующие тексты на украинском: автоматическая проверка орфографии, грамматики и стиля, классификация текстов, выявление именуемых сущностей, data mining и т.д.

Напомним, ранее киевский разработчик создал словарь львовского говора для iOS.

Оставить комментарий

Комментарии | 1

Поиск