Логотип Автор24реферат
Заказать работу
Реферат на тему: Информационные системы в медиаиндустрии, системы машинного перевода
100%
Уникальность
Аа
13515 символов
Категория
Информационные технологии
Реферат

Информационные системы в медиаиндустрии, системы машинного перевода

Информационные системы в медиаиндустрии, системы машинного перевода .doc

Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод Эмоджи на новый заказ в Автор24. Это бесплатно.

ВВЕДЕНИЕ
21 век – это век новаций, новаторства, информационного скачка в развитии, когда именно информационные технологии «идут» быстрее всех. Наряду с развитием новых тенденции в виде блогерства и стримов, остро встает вопрос о переводе «live-каналов» в реальном времени, т.к. интернет объединяет людей, когда преграда в тысячи километров не играет уже никакой роли.
К великому сожалению ни каждый обладает даже средним уровнем знания, того или иного языка. К большому огорчению умение, уровень и адаптивность машинного перевода оставляет желать лучшего, зачастую это результат набора слов или отсутствие подобающей стилистики. Но не смотря на подобные «баги», каждый из нас прибегал к услугам машинного перевода, да перевод «кривой», пусть бессмысленный, но результат присутствует: слова ведь переведены и о смысле или характере текста уже можно догадаться.
Цель моей работы это немного рассказать об истории происхождения машинного перевода в информационных системах, рассказать о типах и их особенностях, ну и самое главное – затронуть его «больные» и слабые зоны.
Но забегая вперед, могу сказать, что нет каких-то идеалов или идеальных программ, информационные системы штука очень интересная, это как приложения на Android-е, требует постоянного контроля и обновления, ведь информационные системы никогда не стоят на месте, каждый день, каждый час вносятся какие-то обновления, начиная от адаптивности и заканчивая критическими ошибками.
ИНФОРМАЦИОННЫЕ СИСТЕМЫ В МЕДИАНДУСТРИИ И СИСТЕМЫ МАШИННОГО ПЕРЕВОДА
ИСТОРИЯ МАШИННОГО ПЕРЕВОДА
Сама идея и задумка машинного перевода была «рождена» еще в далеком 1947 г., но тогда эта задача носила иной характер. Идеей была дешифровка данных, это была обнаружено и обнародовано в письме специалиста по криптографии Уоррена Уивера.
Первая же работающая система по переводу с русского на английский была представлена в далеком 1954 г. и носила название IBM MARK II. Пусть она была примитивной и узкой, но начало было положено, ведь как правило начать всегда сложнее всего.
МАШИННЫЙ ПЕРЕВОД
«Переводом называется процесс преобразования речевого произведения на одном языке в речевое произведение на другом языке при сохранении неизменного плана содержания, то есть значения»[Бархударов, 1975, с.10].
«Перевод - это сложный и многогранный вид человеческой деятельности» [Комиссаров, 1990, с.10].
Смысл слова перевод можно трактовать по разному и глубина его многогранна и многоопциональна, но суть - это преобразование слов, предложений и выражений без потери смысла на понятный нам язык.
Существует три вида алгоритмов преобразования текста машинного перевода:
- rule-based (основанный на правилах), его используют многие разработчики систем машинного перевода, такие как ПРОМТ в России;
- statistical-based (основанный на статистике), его обширное распространение в такой нише как YANDEX, GOOGLE-переводчик и т.д;
- гибридные, являются наиболее перспективными, т.к. в него пытаются внедрить сильные стороны предыдущих двух видов.
RULE-BASED
Rule-based – машинный перевод на основе правил, по другому, это перевод на основе лингвистической информации об исходном и переводном языке. Данный вид принято считать классическим. Принцип его прост – связь структура входного и выходного предложения перед компьютерной машиной. У этого вида существует три группы:
Системы пословного перевода;
TRANSFER – преобразование структуры входного языка в грамматические конструкции выходного языка;
INTERLINGUA – промежуточный язык описания смысла.
Главным достоинством систем на основе трансфера – минимальный уровень затрат на первичную разработку и модернизацию, а также высокая полнота охвата текстов.
А теперь рассмотрим «плюсы» и «минусы» и перейдем к следующему виду

Зарегистрируйся, чтобы продолжить изучение работы

. Что входит в «плюсы»:
- синтаксическая и морфологическая тонность;
- возможность настройки на предметную область;
- стабильность и предсказуемость результата.
А «минусы» это:
- трудоемкость и длительность разработки;
- «машинный акцент» при переводе;
- необходимость обновления базы-данных.
СИНХРОННЫЙ АВТОМАТИЧЕСКИЙ ПЕРЕВОД
Что подразумевает в себе синхронный автоматический перевод? Speech-to-SpeechReal-TimeTranslation - «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
В отличие от печатного текста или искусственных сигналов, естественная речь не допускает простого и однозначного членения на элементы (фонемы, слова, фразы), поскольку они не имеют явных физических границ. Границы слов в потоке речи автоматически могут быть определены лишь в ходе распознавания посредством подбора оптимальной последовательности слов, наилучшим образом согласующейся с входным потоком речи по акустическим, лингвистическим, семантическим и иным критериям.
Процесс электронного перевода речи (S2S Real-TimeTranslation), как правило, включает следующие три этапа):
- автоматическое распознавание речи (ASR — automaticspeechrecognition) — преобразование речи в текст;
- машинный перевод (MAT — Machine-AssistedTranslation); — автоматический перевод текста с одного языка на другой.
- синтез речи (TTS — text-to-speech) — технология, которая даёт возможность произнести текст голосом, приближенным к естественному.
Говорящий на языке A говорит в микрофон, а модуль распознавания речи признаёт произнесённое. Происходит сравнение входных данных с фонологическими моделями, состоящими из большого количества речевых библиотек. Отфильтрованное таким образом, используя словарь и грамматику языка А, преобразуется в строку слов, основанную на массиве фразы языка А. Модуль автоматического перевода преобразует эту строку. Ранние системы, заменяли каждое слово, с соответствующим словом в языке B. Более совершенные системы, не используют дословный перевод, а принимают во внимание весь контекст фразы, чтобы произвести соответствующий перевод. Созданный перевод передаётся в модуль синтеза речи, который оценивает произношение и интонацию, соответствующую ряду слов из массива речевых данных языка B. Данные, соответствующие фразе, отбираются, соединяются и выводятся в необходимой потребителю форме на языке В.
Помимо проблем, связанных с переводом текста, синхронный перевод речи имеет дело с особыми проблемами, включая бессвязность разговорного языка, меньше ограничений грамматики разговорного языка, неясной границы слова разговорного языка и коррекции ошибок распознавания речи. Кроме того, у синхронного перевода есть свои преимущества по сравнению с переводом текста, в том числе менее сложную структуру разговорного языка и меньше лексики в разговорном языке.
По мере роста мощностей аппаратных устройств, можно ожидать появления машинных переводчиков c меньшим количеством ошибок в переводе, что является главной проблемой всех электронных переводчиков речи

50% реферата недоступно для прочтения

Закажи написание реферата по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!

Промокод действует 7 дней 🔥
Оставляя свои контактные данные и нажимая «Заказать работу», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.

Магазин работ

Посмотреть все
Посмотреть все
Больше рефератов по информационным технологиям:

Искусственный интеллект как напарник естественного

17547 символов
Информационные технологии
Реферат
Уникальность

Современные мультимедийные программы обучения китайцев русскому языку

11912 символов
Информационные технологии
Реферат
Уникальность

Инструментальные средства управления версиями ПО

18962 символов
Информационные технологии
Реферат
Уникальность
Все Рефераты по информационным технологиям