Логотип Автор24реферат
Заказать работу
Курсовая работа на тему: Извлечение терминов и аннотации документов
100%
Уникальность
Аа
2774 символов
Категория
Информационные технологии
Курсовая работа

Извлечение терминов и аннотации документов

Извлечение терминов и аннотации документов .doc

Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод Эмоджи на новый заказ в Автор24. Это бесплатно.

Текстовые описания семантического контекста экземпляров и сущностей, полученные на предыдущем этапе, ищутся в инвертированном индексе для извлечения и генерации аннотационной таблицы документов, содержащей объект онтологии, соответствующий документ и его вес (см. Таблицу 1).
Таблица 1. Иллюстрирует генерацию аннотационной таблицы документов
Оценка
Корреляция Пирсона и Спирмена использовалась для измерения согласия с человеческими суждениями. Корреляция Пирсона измеряет линейную корреляцию между двумя переменными, использует диапазоны, упорядочивает номера каждой группы субъектов и сравнивает эти диапазоны. Спирмен - это мера корреляции между двумя непрерывными случайными величинами.
DBpedia
DBpedia является универсальной, многоязычной по своей природе и всеобъемлющей

Зарегистрируйся, чтобы продолжить изучение работы

. По этой причине он был выбран для наших экспериментов. Английская версия содержит 685 классов и 2795 свойств; а база знаний составляет более 4 миллионов экземпляров.
DBpedia содержит несколько систем классификации, таких как YAGO, Категории Википедии и иерархический подграф онтологии DBpedia. Система категорий Википедии имеет самый высокий охват сущностей среди всех трех вариантов. Чтобы решить эти проблемы, используется иерархия категорий в Википедии Капанипати и др.
Наборы данных. LP50 - это наборы данных документов, составленные Ли и Уэлшем, которые использовались для наших экспериментов. LP50 состоит из 50 новостных документов общего назначения объемом от 50 до 126 слов.[9]
Lucene
Документы Lucene были проиндексированы, чтобы создать индекс документов, который включает список упоминаний и документов, в которых они появляются

50% курсовой работы недоступно для прочтения

Закажи написание курсовой работы по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!

Промокод действует 7 дней 🔥
Оставляя свои контактные данные и нажимая «Заказать работу», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.
Больше курсовых работ по информационным технологиям:

Разработка АИС «Учет услуг в сфере электроники» на технологической платформе 1С: Предприятие 8

37532 символов
Информационные технологии
Курсовая работа
Уникальность

Разработка архитектуры CRM-системы для сети аптек

40586 символов
Информационные технологии
Курсовая работа
Уникальность

Разработка базы данных

18192 символов
Информационные технологии
Курсовая работа
Уникальность
Все Курсовые работы по информационным технологиям