|

Использование статистических методов для создания лингвистического обеспечения информационно-поисковой системы

Авторы: Смирнов Ю.М., Андреев А.М., Березкин Д.В., Брик А.В. Опубликовано: 04.09.2014
Опубликовано в выпуске: #2(43)/2001  
DOI:

 
Раздел: Информатика и вычислительная техника  
Ключевые слова:

Рассмотрены проблемы создания информационно-поисковой системы с естественно-языковым интерфейсом запросов, в частности, подготовка словарей и поискового индекса, учитывающего синтаксическую структуру предложений документа. Предложен метод автоматического построения морфологического словаря и словаря словосочетаний, использующий статистический анализ достаточно большого множества текстов. Рассмотрен двухступенчатый алгоритм синтаксического анализа текста (использующий на первом этапе простой формально-грамматический анализ, а на втором - уточнение результатов его работы статистическими методами), а также алгоритм текстового поиска на основе результатов его работы. Приведены экспериментальные оценки качества работы предложенных методов.