Дягилев В.В.   Цхай А.А.   Бутаков С.В.  

Архитектура и алгоритмы сервиса обнаружения плагиата

Докладчик: Дягилев В.В.

В докладе описывается архитектура системы обнаружения плагиата, позволяющая определять в проверяемом документе наличие текстов,схожих с источниками, которые опубликованы в открытом доступе в сети Интернет. Акцент в работе делается на охране авторских прав в проверяемом материале. Данная задача решена путем того, что часть системы, выполняющая глобальный поиск  и предварительное сравнение возможных источников плагиата в сети Интернет, получает информацию, не позволяющую восстановить исходное содержимое проверяемого документа. При этом качество поиска документов в сети Интернет не ухудшается. Предлагаемая архитектура использует вычислительные мощности поисковых машин Интернета и уменьшает нагрузку на локальную информационную инфраструктуру пользователя. Кроме того, рассматриваются модификации алгоритмов сравнения схожих документов, которые позволяют перенести практически весь процесс построения хеша документов в СУБД. Тем самым, минимизируется объем оперативной памяти, используемой сервисом. Данный подход  позволяет также существенно снизить требования к вычислительной инфраструктуре пользователей сервиса.

Файл с полным текстом: Дягилев_статья.pdf
Файл презентации: Дягилев_през.pdf


К списку докладов