Извлечение терминов и аннотации документов
Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Текстовые описания семантического контекста экземпляров и сущностей, полученные на предыдущем этапе, ищутся в инвертированном индексе для извлечения и генерации аннотационной таблицы документов, содержащей объект онтологии, соответствующий документ и его вес (см. Таблицу 1).
Таблица 1. Иллюстрирует генерацию аннотационной таблицы документов
Оценка
Корреляция Пирсона и Спирмена использовалась для измерения согласия с человеческими суждениями. Корреляция Пирсона измеряет линейную корреляцию между двумя переменными, использует диапазоны, упорядочивает номера каждой группы субъектов и сравнивает эти диапазоны. Спирмен - это мера корреляции между двумя непрерывными случайными величинами.
DBpedia
DBpedia является универсальной, многоязычной по своей природе и всеобъемлющей
Зарегистрируйся, чтобы продолжить изучение работы
. По этой причине он был выбран для наших экспериментов. Английская версия содержит 685 классов и 2795 свойств; а база знаний составляет более 4 миллионов экземпляров.
DBpedia содержит несколько систем классификации, таких как YAGO, Категории Википедии и иерархический подграф онтологии DBpedia. Система категорий Википедии имеет самый высокий охват сущностей среди всех трех вариантов. Чтобы решить эти проблемы, используется иерархия категорий в Википедии Капанипати и др.
Наборы данных. LP50 - это наборы данных документов, составленные Ли и Уэлшем, которые использовались для наших экспериментов. LP50 состоит из 50 новостных документов общего назначения объемом от 50 до 126 слов.[9]
Lucene
Документы Lucene были проиндексированы, чтобы создать индекс документов, который включает список упоминаний и документов, в которых они появляются
50% курсовой работы недоступно для прочтения
Закажи написание курсовой работы по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!