Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Аннотация: В статье рассматривается разработка голосового медицинского ассистента, распознающего ограниченный естественный язык. Проводится обзор существующих систем распознавания речи. На основе полученных данных проводится сравнительный анализ систем по наиболее значимым критерием.
Ключевые слова: распознавание естественного языка, машинное обучение, программное обеспечение, информационная система, алгоритм, анализ.
DEVELOPMENT OF VOICE MEDICAL ASSISTANT, RECOGNIZING A LIMITED NATURAL LANGUAGE
Abstract: The article discusses the development of a voice medical assistant that recognizes a limited natural language. A review of existing speech recognition systems is conducted. On the basis of the data obtained, a comparative analysis of the systems is carried out according to the most significant criterion.
Key words: natural language recognition, machine learning, software, information system, algorithm, analysis.
Соверменные информационные технологии очень тесно вошли в обыденную жизнь человека. Технологические возможности в области распознавания естественного языка лежат в основе голосовых помощников крупных компаний разработки программного обеспечения. Большинство из них не просто способно распознать естественный язык, но при помощи нейронных сетей искусственного интеллекта вести логичную беседу в разговорной форме с человеком.
Распознавание речи, простая на взгяд человека возможность, которую он преобретает будучи в младенчестве. Но как распознавание естественного языка может быть доступно компьютерной программе? На смом деле, с начала развития данного направления и по сегодняшний день алгоритмы распознавания модернизируются. На смену грамматикам и строгой инструкции правил пришли нейронные сети и машинное обучение, что позволило повысить качество распознавания и значительно сократить ошибки.
В сети интернет представлены уже имеющиеся алгоритмы по распознаванию естественного языка и программы с исходным кодом, доступные для установки и дальнейшего использования как простым пользователем, так и сторонними разработчиками программного обеспечения.
Использование систем распознавания речи может стать эффективным и в такой области науки как медицина
. Голосовой ассистент, позволит записывать и формировать в отчетный документ назначения, истории болезней, действия при операции и сложных процедурах, требующих наивысшей концентрации.
Рассмотрим некоторые, наиболее эффективные системы распознавания ограниченного естественного языка представленных на рынке информационных услуг.
Облачные сервисы:
CLOUD SPEECH API от компании Google. Самый известный и наиболее популярный облачный сервис распознавания речи. В основе алгоритма распознавания лежит глубокое машинное обучение. Имеется поддержка более 110 языков, при этом процент распознавания речи достаточен для комфортного использования. Результат распознавания речи выдается сервисом в режиме реального времени. Взаимодействие с облаком происходит по веб интерфейсам, описание которых имеется на официальном сайте. Однако сервис является платным, стоимость использования: 60 минут в месяц бесплатно, свыше лимита – 0,006$ (примерно 36 копеек) за каждые 15 секунд.
SpeechKit Cloud от компании Яндекс, отечественный аналог CLOUD SPEECH API. Данный сервис прекрасно справляется с распознаванием русского языка, а также имеет средства синтеза речи. Взаимодействие происходит также, по средствам веб интерфейсов. Как и зарубежный аналог данный сервис является платным. Для знакомства с технологией предусмотрен бесплатный тестовый период — 1 месяц с момента отправки первого запроса на сервер. Чтобы продолжить использовать SpeechKit Cloud после этого, необходимо заключить договор. Можно приобрести пакет (фиксированное количество запросов в месяц) или оплачивать запросы по факту. Стоимость лицензии зависит от количества обращений и в среднем составляет 200 рублей за 1000 запросов или 60 копеек за 1 минуту, что дешевле зарубежного аналога.
Microsoft Speech API от компании Microsoft. Как и в двух предыдущих сервисах в основе распознавания речи данного сервиса лежит машинное обучение. Также управление происходит посредствам веб интерфейсов, а использование платное. Стоимость: до 5000 транзакций (речь длинною менее 15 секунд) в месяц бесплатно
Закажи написание статьи по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!
Наш проект является банком работ по всем школьным и студенческим предметам. Если вы не хотите тратить время на написание работ по ненужным предметам или ищете шаблон для своей работы — он есть у нас.
Нужна помощь по теме или написание схожей работы? Свяжись напрямую с автором и обсуди заказ.
В файле вы найдете полный фрагмент работы доступный на сайте, а также промокод referat200 на новый заказ в Автор24.