Логотип Автор24реферат
Задать вопрос
Реферат на тему: Методы и программное обеспечение для анализа контента
86%
Уникальность
Аа
21659 символов
Категория
Информационные технологии
Реферат

Методы и программное обеспечение для анализа контента

Методы и программное обеспечение для анализа контента .doc

Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод Эмоджи на новый заказ в Автор24. Это бесплатно.

Введение

Широкое распространение вычислительной техники как средства обработки информации привело к информатизации общества и появлению принципиально новых, так называемых, информационных технологий.
Появление любых новых технологий, как правило, имеет как положительные, так и отрицательные стороны. Тому множество примеров. Атомные и химические технологи, решая проблемы энергетики и производства новых материалов, породили экологические проблемы. Интенсивное развитие транспорта обеспечило быструю и удобную доставку людей, сырья, материалов и товаров в нужных направлениях, но и материальный ущерб и человеческие жертвы при транспортных катастрофах возросли.
В современном мире информация просто свалилась на человека – резко увеличилось число телевизионных программ, поменялся и их формат. Готовый продукт, попадаемый в эфир, формирует у слушателей необходимые установки и мнения. По этой причине очень важно изучать соотношения такой информации с реальностью, насколько она соответствует тому, что наблюдается в обществе с учетом всех изменений и корректировок, привносимых в информационный контент.
В данной работе будут рассмотрены вопросы, которые касаются основных характеристик понятия контент-анализ, а также программного обеспечения, которое используется для осуществления процедуры контент-анализа.

1 Описание метода контент-анализа
Метод контент-анализа используется при анализе документов с целью определения произвольных фактов и тенденций, которые находятся в этих документах. Фактически это формализованный метод, применяющийся для получения произвольной информации, суть которого состоит в переводе имеющихся данных в количественные цифры и ее дальнейшей статистической обработке. Данный метод может быть охарактеризован такими словами, как строгость, систематичность.
В данном методе также требуется обычный (т.е. содержательного) анализ документов. Использование контент-анализа помогает обнаружить в тексте то, чего обычно не видно при поверхностном анализе в процессе традиционного изучения, однако это имеет особенный социальный смысл.
Важное отличие данного метода заключается в его высокой строгости и систематизированности всех действий. Контент-анализ направлен на выработку детального описания содержания текста, на фиксацию основных отличительных признаков и подведение статистики по ним.
Большое число социологов считают, что контент-анализ можно смело называть «текстуальным кодированием», поскольку в данном методе предполагается добывать количественную информацию об информации в документе с использованием методов кодирования.
Помимо этого, данный метод анализа отличается от иных методов изучения документов, поскольку он позволяет вместить информацию документа в контекст, произвести его осмысление и оценку.
Метод контент-анализа заключается в:
- фиксации конкретных единиц содержания;
- исследовании документов в социальном плане;
- использовании его как главного или вспомогательного в процессе исследований.
В качестве объекта в данном методе выступают документы, радиопередачи, телевидение, различные протоколы, нормативные документы, данные анкет и т.п.
Среди главных направлений использования данного метода анализа можно выделить следующие:
- определение того, что было до текста и что в итоге в нем было отражено;
- выявление того, что имеется только внутри текста;
- определение того, что останется после текста, точнее после того, как его изучит адресат.
Можно выделить следующие основные стадии разработки и применения контент-анализа:
- определяется тема, основные задачи и гипотезы будущего исследования;
- задаются категории анализа, к которым относятся основные, ключевые понятия, которые соответствуют задачам исследования.
Система категорий несет роль вопросов при процедуре анкетирования и показывает, какие ответы могут быть обнаружены в тексте.
Категории данного метода анализа должны удовлетворять следующим требованиям:
- исчерпываемость;
- взаимозаменяемость;
-надежность;
-уместность.
В процессе определения необходимых категорий для данного метода анализа требуется исключать любые крайности, поскольку это может повлиять на существенное упрощение анализа, и он будет довольно поверхностным. В некоторых ситуациях следует учитывать отсутствующие элементы в документе, которые несут достаточно большое значение для данного метода анализа.
В методе контент-анализа очень важно осуществить выбор требуемой единицы анализа или же лингвистической единицы или элемента, которые будут использоваться в тексте в качестве индикатора наиболее интересных для исследователя явлений.
В качестве такой единицы анализа довольно часто используется:
- слово или целиковое предложение;
- основная тема или идея документа;
- конкретный автор исследуемого документа или же какой-то конкретный персонаж;
- произвольная социальная ситуация;
- некоторая часть текста, которая объединена чем-то, что может соответствовать основному смыслу категории анализа.
Сложные типы контент-анализа чаще всего работают сразу с несколькими лингвистическими единицами. Те из единиц анализа, которые берутся изолировано, во многих случаях не совсем верно описываются, в связи с чем их можно рассматривать как наиболее широкие лингвистические структуры, которые указывают на характер деления текста, в рамках которого определяются присутствие или отсутствие структурных единиц анализа. К примеру, для такой единицы анализа, как «слово», можно использовать такую контекстуальную единицу, как «предложение».
Часто требуется определить единицу счета, которая представляет собой количественную меру, служащую для связи текстовых и вне текстовых событий

Зарегистрируйся, чтобы продолжить изучение работы

. Чаще всего на практике используются следующие единицы счета: время-пространство, применение признаков в документе, частота (или интенсивность) их использования.
Единица счета представляет собой количественную меру, с помощью которой можно осуществлять регистрацию интенсивности возникновения характерного признака для категории анализа в исследуемом документе. В качестве единицы счета возможно использовать определенное число слов или их всевозможных сочетаний, число печатных знаков, страниц или листов и т.п.
Очень важным является выбор требуемых источников, которые подвергаются методу контент-анализа.
Главная проблема, которая заключается в процессе выборки, заключается в определении источника, определенного числа сообщений, их даты и содержания. Огромное число подобных параметров выборки определяются конкретными целями и объемами исследования.
Обычно контент-анализ осуществляется на годичной выборке. В случае, если происходит изучение протоколов всех собраний, то вполне достаточно рассмотреть 12 протоколов, если рассматриваются документы в средствах массовой информации, то требуется исследовать от 12 до 16 номеров журналов, газет или радио дней. Чаще всего выборка документов, берущихся из средств массовой информации, колеблется в районе от 200 до 600 документов.
К главным процедурам данного метода относятся:
- выделение смысловых единиц метода, к числу которых можно отнести:
- понятия, выделяемые в отдельных определениях;
- темы, выделяемых в смысловых документах;
- фамилии людей;
- происходящие события;
- выявление единиц счета, которые могут как совпадать, так и отличаться от единиц анализа.
Для первого случая производится подсчет интенсивности упоминания конкретной смысловой единицы, а для второго – выдвижение единиц счета на основе глубокого анализа, к которым можно отнести:
-объем и площадь текста;
- количество строк, абзацев и т.п.;
- протяженность видео трансляции по телевидению или радио;
- длительность пленки;
- число рисунков с конкретным сюжетом, содержанием и т.п.
Процесс расчета в основном виде будет похожа на стандартные методы классификации по определенным группировкам. Используется составление таблиц, специальных компьютерных программ, математических формул и т.п.
Процесс анализа с использованием методов контента требует предварительной разработки набора исследовательских инструментов. К числу основных относятся:
- классификатор метода контент-анализа;
- итоговый протокол, который обладает вторичным названием – бланком контент-анализа;
- регистрационная карта или матрица кодирования;
- инструкция исследователю, который занимается регистрацией и кодировкой счетных единиц;
- список документов, которые подвергались анализу.
Классификатором в методе контент-анализа считается таблица, где отображены категории и единицы анализа. Главный смысл данной таблицы заключается в четкой фиксации того, в чем выражаются все категории, которые применяются в исследовании. Классификатор можно сравнить с социологической анкетой, в которой категории анализа выполняют функции вопросов, а единицы анализа – функции ответов. Классификатор служит главным методическим документом в методе контент-анализа, который дает возможность изучить все инструменты данного метода.
Протокол (или, по-другому, бланк), используемый в контент-анализе, содержит:
- информацию о документе;
- результаты его анализа.
Бланки заполняются, в основном, в закодированном виде, однако это делается не для того, чтобы сохранить в тайне результаты метода контент-анализа, а для того, чтобы на одном листе разместить все данные о документе. Это позволяет наиболее удобно сравнивать полученные результаты анализа произвольных документов. В ситуации, когда контент-анализу подвергается незначительное количество документов, можно не выполнять кодирование и заполнять данные протоколы в открытом виде.
Регистрационная карточка выполняется в виде кодировальной матрицы, где отмечается число единиц счета, которые определяют используемые единицы анализа. Протокол метода контент-анализа для единичного документа заполняется по результату подсчета информации каждой регистрационной карточки, которая принадлежит данному документу.
Важным условием служит разработка таблицы метода контент-анализа, которая является главным рабочим документом, который используется для осуществления исследования.
Тип таблицы задается в соответствии с этапом исследования. К примеру, создавая категориальный аппарат, исследователь составляет таблицу, которая соединяет в себе систему скоординированных категорий анализа. Данная таблица внешне похожа на анкету: все вопросы имеют определенное число ответов, по которым в результате составляется содержание текста.
Фиксирование единиц анализа осуществляется с помощью кодировальной матрицы. В ситуации, когда объем выборки очень большой, кодировщик работает с большим набором матричных листов. В тех случаях, когда выборка небольшая, можно осуществить двумерный или даже многомерный анализ. В данной ситуации для каждого текста создается конкретная кодировальная матрица. Данная работа является весьма трудоемкой и кропотливой, в связи с этим в тех случаях, когда выборка является достаточно большой, сравнение интересующих исследователя признаков проводится на компьютере[1, 2].
Среди основных преимуществ контент-анализа можно выделить:
-наличие точной регистрации внешне неотличимых показателей в громадных массивах данных;
- способность к определению скрытых тенденций (или закономерностей);
- допустимость осуществления отложенного анализа ситуаций;
-высокая объективность процедур и достаточно высокая надёжность результатов;
- отсутствие проявлений эффекта влияния исследователя на поведение испытуемых.
Среди основных недостатков метода контент-анализа можно выделить:
- характер данных во многом зависит от мыслей автора и конкретной формой предъявления

50% реферата недоступно для прочтения

Закажи написание реферата по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!

Промокод действует 7 дней 🔥
Больше рефератов по информационным технологиям:

Инофрмационные системы и технологии

22434 символов
Информационные технологии
Реферат
Уникальность

Управление корпоративной информацией

11708 символов
Информационные технологии
Реферат
Уникальность

Описание одного функционала информационной системы

29233 символов
Информационные технологии
Реферат
Уникальность
Все Рефераты по информационным технологиям
Учись без напряга с AI помощником и готовыми решениями задач
Подписка Кампус откроет доступ в мир беззаботных студентов