Логотип Автор24реферат
Задать вопрос
Курсовая работа на тему: Извлечение терминов и аннотации документов
100%
Уникальность
Аа
2774 символов
Категория
Информационные технологии
Курсовая работа

Извлечение терминов и аннотации документов

Извлечение терминов и аннотации документов .doc

Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод Эмоджи на новый заказ в Автор24. Это бесплатно.

Текстовые описания семантического контекста экземпляров и сущностей, полученные на предыдущем этапе, ищутся в инвертированном индексе для извлечения и генерации аннотационной таблицы документов, содержащей объект онтологии, соответствующий документ и его вес (см. Таблицу 1).
Таблица 1. Иллюстрирует генерацию аннотационной таблицы документов
Оценка
Корреляция Пирсона и Спирмена использовалась для измерения согласия с человеческими суждениями. Корреляция Пирсона измеряет линейную корреляцию между двумя переменными, использует диапазоны, упорядочивает номера каждой группы субъектов и сравнивает эти диапазоны. Спирмен - это мера корреляции между двумя непрерывными случайными величинами.
DBpedia
DBpedia является универсальной, многоязычной по своей природе и всеобъемлющей

Зарегистрируйся, чтобы продолжить изучение работы

. По этой причине он был выбран для наших экспериментов. Английская версия содержит 685 классов и 2795 свойств; а база знаний составляет более 4 миллионов экземпляров.
DBpedia содержит несколько систем классификации, таких как YAGO, Категории Википедии и иерархический подграф онтологии DBpedia. Система категорий Википедии имеет самый высокий охват сущностей среди всех трех вариантов. Чтобы решить эти проблемы, используется иерархия категорий в Википедии Капанипати и др.
Наборы данных. LP50 - это наборы данных документов, составленные Ли и Уэлшем, которые использовались для наших экспериментов. LP50 состоит из 50 новостных документов общего назначения объемом от 50 до 126 слов.[9]
Lucene
Документы Lucene были проиндексированы, чтобы создать индекс документов, который включает список упоминаний и документов, в которых они появляются

50% курсовой работы недоступно для прочтения

Закажи написание курсовой работы по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!

Промокод действует 7 дней 🔥
Оставляя свои контактные данные и нажимая «Заказать работу», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.
Больше курсовых работ по информационным технологиям:

Разработка модели NGN сети

20166 символов
Информационные технологии
Курсовая работа
Уникальность

Применение облачных технологий для организации образовательной деятельности обучающихся

52530 символов
Информационные технологии
Курсовая работа
Уникальность

Иммитационное моделирование

48419 символов
Информационные технологии
Курсовая работа
Уникальность
Все Курсовые работы по информационным технологиям
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач