XIV Российская конференция с международным участием
"Распределенные информационные и вычислительные ресурсы" (DICR-2012)

№ гос. регистрации 0321300118
26 ноября - 30 ноября 2012, Новосибирск

Барахнин В.Б.   Забайкин А.В.  

Извлечение фактов из текста с использованием методов синтаксического анализа

Докладчик: Забайкин А.В.

В работе рассмотрен алгоритм извлечения фактографических данных из текстовых документов. Представлен способ построения дескриптора на основании  данных морфологического анализа лексем и дальнейшего обучения классификатора несколькими методами машинного обучения, при этом проведено сравнение эффективности методов. Произведённый таким образом синтаксический анализ показал хорошие результаты в задаче определения родственных отношений между  упоминаемыми в тексте персонами.


К списку докладов