Логотип Автор24реферат
Задать вопрос
Реферат на тему: Методы и программное обеспечение для анализа контента
86%
Уникальность
Аа
21659 символов
Категория
Информационные технологии
Реферат

Методы и программное обеспечение для анализа контента

Методы и программное обеспечение для анализа контента .doc

Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод Эмоджи на новый заказ в Автор24. Это бесплатно.

Введение

Широкое распространение вычислительной техники как средства обработки информации привело к информатизации общества и появлению принципиально новых, так называемых, информационных технологий.
Появление любых новых технологий, как правило, имеет как положительные, так и отрицательные стороны. Тому множество примеров. Атомные и химические технологи, решая проблемы энергетики и производства новых материалов, породили экологические проблемы. Интенсивное развитие транспорта обеспечило быструю и удобную доставку людей, сырья, материалов и товаров в нужных направлениях, но и материальный ущерб и человеческие жертвы при транспортных катастрофах возросли.
В современном мире информация просто свалилась на человека – резко увеличилось число телевизионных программ, поменялся и их формат. Готовый продукт, попадаемый в эфир, формирует у слушателей необходимые установки и мнения. По этой причине очень важно изучать соотношения такой информации с реальностью, насколько она соответствует тому, что наблюдается в обществе с учетом всех изменений и корректировок, привносимых в информационный контент.
В данной работе будут рассмотрены вопросы, которые касаются основных характеристик понятия контент-анализ, а также программного обеспечения, которое используется для осуществления процедуры контент-анализа.

1 Описание метода контент-анализа
Метод контент-анализа используется при анализе документов с целью определения произвольных фактов и тенденций, которые находятся в этих документах. Фактически это формализованный метод, применяющийся для получения произвольной информации, суть которого состоит в переводе имеющихся данных в количественные цифры и ее дальнейшей статистической обработке. Данный метод может быть охарактеризован такими словами, как строгость, систематичность.
В данном методе также требуется обычный (т.е. содержательного) анализ документов. Использование контент-анализа помогает обнаружить в тексте то, чего обычно не видно при поверхностном анализе в процессе традиционного изучения, однако это имеет особенный социальный смысл.
Важное отличие данного метода заключается в его высокой строгости и систематизированности всех действий. Контент-анализ направлен на выработку детального описания содержания текста, на фиксацию основных отличительных признаков и подведение статистики по ним.
Большое число социологов считают, что контент-анализ можно смело называть «текстуальным кодированием», поскольку в данном методе предполагается добывать количественную информацию об информации в документе с использованием методов кодирования.
Помимо этого, данный метод анализа отличается от иных методов изучения документов, поскольку он позволяет вместить информацию документа в контекст, произвести его осмысление и оценку.
Метод контент-анализа заключается в:
- фиксации конкретных единиц содержания;
- исследовании документов в социальном плане;
- использовании его как главного или вспомогательного в процессе исследований.
В качестве объекта в данном методе выступают документы, радиопередачи, телевидение, различные протоколы, нормативные документы, данные анкет и т.п.
Среди главных направлений использования данного метода анализа можно выделить следующие:
- определение того, что было до текста и что в итоге в нем было отражено;
- выявление того, что имеется только внутри текста;
- определение того, что останется после текста, точнее после того, как его изучит адресат.
Можно выделить следующие основные стадии разработки и применения контент-анализа:
- определяется тема, основные задачи и гипотезы будущего исследования;
- задаются категории анализа, к которым относятся основные, ключевые понятия, которые соответствуют задачам исследования.
Система категорий несет роль вопросов при процедуре анкетирования и показывает, какие ответы могут быть обнаружены в тексте.
Категории данного метода анализа должны удовлетворять следующим требованиям:
- исчерпываемость;
- взаимозаменяемость;
-надежность;
-уместность.
В процессе определения необходимых категорий для данного метода анализа требуется исключать любые крайности, поскольку это может повлиять на существенное упрощение анализа, и он будет довольно поверхностным. В некоторых ситуациях следует учитывать отсутствующие элементы в документе, которые несут достаточно большое значение для данного метода анализа.
В методе контент-анализа очень важно осуществить выбор требуемой единицы анализа или же лингвистической единицы или элемента, которые будут использоваться в тексте в качестве индикатора наиболее интересных для исследователя явлений.
В качестве такой единицы анализа довольно часто используется:
- слово или целиковое предложение;
- основная тема или идея документа;
- конкретный автор исследуемого документа или же какой-то конкретный персонаж;
- произвольная социальная ситуация;
- некоторая часть текста, которая объединена чем-то, что может соответствовать основному смыслу категории анализа.
Сложные типы контент-анализа чаще всего работают сразу с несколькими лингвистическими единицами. Те из единиц анализа, которые берутся изолировано, во многих случаях не совсем верно описываются, в связи с чем их можно рассматривать как наиболее широкие лингвистические структуры, которые указывают на характер деления текста, в рамках которого определяются присутствие или отсутствие структурных единиц анализа. К примеру, для такой единицы анализа, как «слово», можно использовать такую контекстуальную единицу, как «предложение».
Часто требуется определить единицу счета, которая представляет собой количественную меру, служащую для связи текстовых и вне текстовых событий

Зарегистрируйся, чтобы продолжить изучение работы

. Чаще всего на практике используются следующие единицы счета: время-пространство, применение признаков в документе, частота (или интенсивность) их использования.
Единица счета представляет собой количественную меру, с помощью которой можно осуществлять регистрацию интенсивности возникновения характерного признака для категории анализа в исследуемом документе. В качестве единицы счета возможно использовать определенное число слов или их всевозможных сочетаний, число печатных знаков, страниц или листов и т.п.
Очень важным является выбор требуемых источников, которые подвергаются методу контент-анализа.
Главная проблема, которая заключается в процессе выборки, заключается в определении источника, определенного числа сообщений, их даты и содержания. Огромное число подобных параметров выборки определяются конкретными целями и объемами исследования.
Обычно контент-анализ осуществляется на годичной выборке. В случае, если происходит изучение протоколов всех собраний, то вполне достаточно рассмотреть 12 протоколов, если рассматриваются документы в средствах массовой информации, то требуется исследовать от 12 до 16 номеров журналов, газет или радио дней. Чаще всего выборка документов, берущихся из средств массовой информации, колеблется в районе от 200 до 600 документов.
К главным процедурам данного метода относятся:
- выделение смысловых единиц метода, к числу которых можно отнести:
- понятия, выделяемые в отдельных определениях;
- темы, выделяемых в смысловых документах;
- фамилии людей;
- происходящие события;
- выявление единиц счета, которые могут как совпадать, так и отличаться от единиц анализа.
Для первого случая производится подсчет интенсивности упоминания конкретной смысловой единицы, а для второго – выдвижение единиц счета на основе глубокого анализа, к которым можно отнести:
-объем и площадь текста;
- количество строк, абзацев и т.п.;
- протяженность видео трансляции по телевидению или радио;
- длительность пленки;
- число рисунков с конкретным сюжетом, содержанием и т.п.
Процесс расчета в основном виде будет похожа на стандартные методы классификации по определенным группировкам. Используется составление таблиц, специальных компьютерных программ, математических формул и т.п.
Процесс анализа с использованием методов контента требует предварительной разработки набора исследовательских инструментов. К числу основных относятся:
- классификатор метода контент-анализа;
- итоговый протокол, который обладает вторичным названием – бланком контент-анализа;
- регистрационная карта или матрица кодирования;
- инструкция исследователю, который занимается регистрацией и кодировкой счетных единиц;
- список документов, которые подвергались анализу.
Классификатором в методе контент-анализа считается таблица, где отображены категории и единицы анализа. Главный смысл данной таблицы заключается в четкой фиксации того, в чем выражаются все категории, которые применяются в исследовании. Классификатор можно сравнить с социологической анкетой, в которой категории анализа выполняют функции вопросов, а единицы анализа – функции ответов. Классификатор служит главным методическим документом в методе контент-анализа, который дает возможность изучить все инструменты данного метода.
Протокол (или, по-другому, бланк), используемый в контент-анализе, содержит:
- информацию о документе;
- результаты его анализа.
Бланки заполняются, в основном, в закодированном виде, однако это делается не для того, чтобы сохранить в тайне результаты метода контент-анализа, а для того, чтобы на одном листе разместить все данные о документе. Это позволяет наиболее удобно сравнивать полученные результаты анализа произвольных документов. В ситуации, когда контент-анализу подвергается незначительное количество документов, можно не выполнять кодирование и заполнять данные протоколы в открытом виде.
Регистрационная карточка выполняется в виде кодировальной матрицы, где отмечается число единиц счета, которые определяют используемые единицы анализа. Протокол метода контент-анализа для единичного документа заполняется по результату подсчета информации каждой регистрационной карточки, которая принадлежит данному документу.
Важным условием служит разработка таблицы метода контент-анализа, которая является главным рабочим документом, который используется для осуществления исследования.
Тип таблицы задается в соответствии с этапом исследования. К примеру, создавая категориальный аппарат, исследователь составляет таблицу, которая соединяет в себе систему скоординированных категорий анализа. Данная таблица внешне похожа на анкету: все вопросы имеют определенное число ответов, по которым в результате составляется содержание текста.
Фиксирование единиц анализа осуществляется с помощью кодировальной матрицы. В ситуации, когда объем выборки очень большой, кодировщик работает с большим набором матричных листов. В тех случаях, когда выборка небольшая, можно осуществить двумерный или даже многомерный анализ. В данной ситуации для каждого текста создается конкретная кодировальная матрица. Данная работа является весьма трудоемкой и кропотливой, в связи с этим в тех случаях, когда выборка является достаточно большой, сравнение интересующих исследователя признаков проводится на компьютере[1, 2].
Среди основных преимуществ контент-анализа можно выделить:
-наличие точной регистрации внешне неотличимых показателей в громадных массивах данных;
- способность к определению скрытых тенденций (или закономерностей);
- допустимость осуществления отложенного анализа ситуаций;
-высокая объективность процедур и достаточно высокая надёжность результатов;
- отсутствие проявлений эффекта влияния исследователя на поведение испытуемых.
Среди основных недостатков метода контент-анализа можно выделить:
- характер данных во многом зависит от мыслей автора и конкретной формой предъявления

50% реферата недоступно для прочтения

Закажи написание реферата по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!

Промокод действует 7 дней 🔥
Оставляя свои контактные данные и нажимая «Заказать работу», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.
Больше рефератов по информационным технологиям:

Возможности Word Wibe Web при работе с информационными ресурсами

17307 символов
Информационные технологии
Реферат
Уникальность

Информационные системы в проффесиональной деятельности политолога

22719 символов
Информационные технологии
Реферат
Уникальность
Все Рефераты по информационным технологиям
Получи помощь с рефератом от ИИ-шки
ИИ ответит за 2 минуты