Недостатки и ограничения семантических хранилищ
Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Семантическая аннотация имеет некоторые преимущества, но при аннотации технических или медицинских текстов или других ресурсов также возникают некоторые проблемы. Вот некоторые из этих проблем:
- Устранение неоднозначности смысла слова: необходимо определить правильное значение слова, которое используется в предложении, когда слово имеет несколько значений.
- Выявление орфографических / грамматических ошибок: исправление орфографии или грамматики в биомедицинских текстах очень важно. Орфографические и грамматические ошибки вызывают неоднозначность в и без того разреженном тексте.
- Прерывистые объекты: объекты могут состоять из нескольких слов в прерывистом промежутке. Например, «устойчивость к засухе и засолению» означает «устойчивость к засухе и засолению», но в этом случае у нас может быть соответствие только «устойчивости к засолению».
- Устранение неоднозначности генов / белков: в биомедицинском контексте все белки имеют связанные гены, часто с одним и тем же именем, что затрудняет аннотирование текстов, касающихся генов и белков.
- Обнаружение вариантов названия
Зарегистрируйся, чтобы продолжить изучение работы
. Варианты наименования объектов могут принимать различные формы, что усложняет аннотации. Например, сокращения и стенографические тексты трудно нормализовать с помощью онтологических концепций.
Проблемы, с которыми сталкиваются в аннотации, можно решить двумя подходами, которые также можно комбинировать. Первый - это метод сопоставления терминов и понятий, который включает сопоставление некоторых частей предоставленного текста с базами данных структурированных знаний, словарями или словарями.
Однако сложно поддерживать исчерпывающий лексикон для аннотации. Второй подход - машинное обучение, которое включает создание аннотаторов для конкретных целей и использования вместо более общих [5].
Особо следует отметить, что третья проблема (прерывистые сущности) может быть решена путем создания алгоритмов, которые могут преобразовывать тексты с помощью таких союзов, как «и» или «или». Таким образом, в примере «устойчивость к засухе и засолению» алгоритм может преобразовать эту фразу в «устойчивость к засухе и засолению» до процесса аннотации.[18]
Хотя это хорошие решения для решения некоторых проблем, некоторые недостатки остаются
50% курсовой работы недоступно для прочтения
Закажи написание курсовой работы по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!