Основные концепции подходов к разработке семантических аннотаций
Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Онтология состоит из схемы и экземпляров. В онтологии классы, свойства, типы данных и экземпляры явно идентифицируются унифицированными идентификаторами ресурсов (URI). Кроме того, они представляют сущности в онтологии, которые характеризуются своим текстовым описанием, объявленным в свойстве rdfs: label.
Семантическая аннотация является фундаментальной для получения лучших результатов семантического поиска, поскольку документы представлены в концептуальном пространстве.
В методах семантической аннотации документ анализируется с целью выявления соответствующих терминов и определения важности каждого термина. Существуют инструменты для идентификации упоминаний, такие как TagMe и Spotlight.
Когда семантические аннотации сделаны без учета контекста, их термины или упоминания связаны с сущностями в онтологии без учета их значения. Это вызывает неоднозначные или ошибочные аннотации.
Наша исследовательская работа предлагает анализировать контекст аннотаций, чтобы определить их значение через сущности в онтологии и таким образом избежать двусмысленности. При извлечении контекста анализируются явные отношения каждой сущности в онтологии.
Семантический поиск включает в себя различные компоненты:
- предварительную обработку,
- транслятор семантических запросов,
- семантическую аннотацию и индексирование,
- поиск семантического контента,
- семантическое ранжирование.
В настоящее время существует несколько исследовательских работ с разным вкладом в области семантической сети. Несколько инструментов общего назначения были разработаны для поддержки процесса аннотации, а также исследовательскими группами были предложены онтологии конкретных предметных областей и базы знаний.[6]
Существует несколько доступных сервисов для аннотации именованных сущностей в документах, к которым можно получить доступ с помощью RESTful API, например, в случае OpenCalais.
Заметим, что в AlchemyAPI и OpenCalais используются статистические методы на основе контекста для устранения неоднозначности экземпляров-кандидатов для аннотирования термина
Зарегистрируйся, чтобы продолжить изучение работы
.
Эти инструменты используют проприетарные словари и онтологии, экземпляры которых связаны с DBpedia через отношение owl: sameAs. Однако OpenCalais предоставляет некоторую ограниченную связь с DBpedia. Кроме того, OpenCalais в основном ориентирован на организации.
У этого подхода есть два недостатка. Во-первых, он исследует только поверхность графа для каждого экземпляра DBpedia с учетом меток, аннотации, ссылок на страницы Wiki и синонимов. Во-вторых, этот подход аннотирует термин только одним экземпляром DBpedia.
Следовательно, этот подход не использует семантическую информацию, доступную в DBpedia, для устранения неоднозначности экземпляра, аннотирующего данный термин.
DBpedia Spotlight - это инструмент семантической аннотации для объектов данных в документе, основанный на DBpedia для аннотации. Кроме того, этот инструмент предоставляет интерфейсы для устранения неоднозначности, включая веб-API, который поддерживает форматы XML, JSON и RFD.
Gate - это инструмент для разработки текста, который помогает пользователям в процессе аннотации текста вручную. Этот инструмент обеспечивает базовые функции обработки, такие как распознавание названной сущности, разделители предложений, маркеры и ПР.
Ontea - инструмент для извлечения семантических метаданных из документов. Этот инструмент использует шаблоны регулярных выражений в качестве инструмента анализа текста и обнаруживает семантически эквивалентные элементы в соответствии с онтологией предметной области, определенной в инструменте. Этот инструмент создает новую индивидуальную онтологию из определенного класса и назначает обнаруженные элементы как свойства в классе онтологии
50% курсовой работы недоступно для прочтения
Закажи написание курсовой работы по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!