Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Введение
Информационные технологии стали одним из наиболее важных факторов, которые влияют на формирование общества XXI века. Стремительное становление сферы информационных технологий привело к возникновению в мире социальных, правовых и технических феноменов. Наиболее важным является феномен перехода общества от традиционного естественного взаимодействия в реальном мире и в реальном времени к электронным методам передачи информации по компьютерным сетям. В наше время очень трудно представить жизнь без информационных технологий, не взирая на то, что в ближайшем прошлом человечество и понятия не имело о них.
В современном мире информационные технологии используются во многих сферах человеческой жизни. В мире, который функционирует в жестких коммерческих отношениях, своевременная обработка информации позволяет совершенствовать производство, оперативно и долгосрочно планировать, прогнозировать и анализировать хозяйственную деятельность, что способствует успешному конкурированию на рынке.
Актуальность данной темы работы заключается в том, что в настоящее время информационные технологии широко используются во всех сферах человеческой жизни. Каждая организация стремится уменьшить затраты времени, материальных и трудовых ресурсов в ходе своей деятельности и упростить процесс обработки и использования информации. Данные задачи можно решить при помощи внедрения автоматизированных информационных систем и баз данных.
Цель работы – изучить особенности организации, а также технологии создания и ведения распределенных баз данных. Поставленная цель предполагает решение следующих задач:
рассмотреть понятие и особенности распределенных баз данных;
исследовать особенности организации, а также технологии создания и ведения распределенных баз данных, их организационные принципы;
проанализировать применение распределенных баз данных.
Объект исследования – распределенные базы данных. Предмет исследования – особенности организации, а также технологии создания и ведения распределенных баз данных.
При написании работы использовались такие методы, как теоретическое обоснование темы, изучение научных источников, а также их сравнительный анализ.
1 Понятие и особенности распределенных баз данных
Время идет, и такая технология, как BigData, обрела свое применение почти в каждой области человеческой деятельности – популярность ее набирает обороты, актуальность ее изучения и применения не оставляет сомнений. Именно повсеместный повышенный интерес к методам и технологиям разработки программных продуктов, выполняющих вычисления на кластерах, стал подсказкой к выбору объекта исследования для данной работы – распределенная разработка данных, как сфера технических наук, набирает силу и нуждается в привлечении новых специалистов для развития и прогресса.
Как ни была бы юна данная отрасль IT-индустрии, области и направления ее применения уже успели значительно разрастись, поэтому, для анализа и изучения в контексте данной работы была выбрана более узкая, но самая популярная в повседневной жизни направленность – распределенная обработка неструктурированных или слабоструктурированных данных (примером могут послужить результаты социологических опросов, научных экспериментов и пр.).
Так, распределённая база данных – архитектура, объединяющая в себе логически взаимосвязанные информационные блоки, находящиеся как в виртуальных сетях, так и на всех компьютерах, подключенных к данной сети [4].
Распределенные базы данных являются совокупностью баз данных, которые физически распределены по взаимосвязанным ресурсам локальной сети и доступны для совместного применения и использования в разных местах разными пользователями. Главный критерий распределения данных в сети заключается в том, что данные должны располагаться там, где существует наибольшая частота обращений пользователей к ним. Распределенная база данных разъединена только физически, а не логически, то есть вся база данных потенциально доступна с любого автоматизированного рабочего места пользователя.
Другими словами, это единая логическая система данных, разделенная на физически удаленные фрагменты. С появлением возможностей для оперативного обмена информацией, в том числе Интернета, распределенные базы данных стали повсеместно вытеснять централизованные [1, с. 51]. В состав распределенной базы данных входит несколько фрагментов, которые размещены на разных узлах сети и, возможно, управляются разными системами управления БД.
Отметим, что существуют различные формы распределения данных. В одних случаях данные фрагментируются, то есть делятся на порции, распределяемые между множеством физических ресурсов. В других случаях они тиражируются, то есть дублируются на нескольких узлах.
Однородные распределенные системы баз данных относительно просты для понимания. Они имеют в своей основе один продукт СУБД, обычно с единственным языком баз данных (например, SQL с расширениями для управления распределенными данными). СУБД с поддержкой однородного распределения являются сильно связанными системами, их встроенные средства поиска данных и средства обработки запросов оптимизированы и настроены для достижения максимальной производительности и пропускной способности. На рисунке 1 изображена структура типичной однородной среды распределенной базы данных.
Рисунок 1 - Структура типичной однородной среды распределенной базы данных
Противоположностью однородных систем распределенных баз данных являются, конечно, неоднородные распределенные системы баз данных. Неоднородные системы включают два или более существенно различающихся продукта управления данными. На рисунке 2 показана типичная конфигурация неоднородной распределенной базы данных. Неоднородные системы баз данных можно, в свою очередь, также подразделить на классы в широком диапазоне - от федеративных систем до различных типов систем мультибаз данных; существует и формальная таксономия неоднородных моделей.
Рисунок 2 - Типичная конфигурация неоднородной распределенной базы данных
Отметим, что третий этап развития баз данных – распределенные базы данных. Многим известно, что история эволюционирует по спирали, следовательно, 15 после процесса «персонализации» возник обратный процесс – «интеграция». Увеличивается число локальных сетей, все больше информации передается между компьютерами, во внимание принимается задача согласованности данных, которые хранятся и обрабатываются в разных местах, но логически взаимосвязаны друг с другом, возникают задачи, связанные с параллельной обработкой транзакций – последовательностей выполнение операций над базой данных, которые переводят ее из одного непротиворечивого состояния в другое непротиворечивое состояние
.
Успешное разрешение данных задач привело к возникновению распределенных многопользовательских баз данных, которые сохраняют все преимущества настольных систем управления базами данных и в то же время дают возможность осуществлять параллельную обработку информации и поддержку целостности базы данных. Большое количество современных систем управления базами данных рассчитаны на многоплатформенную архитектуру, что позволяет им функционировать на современных компьютерах с разной архитектурой и под разными операционными системами, при этом для пользователей доступ к хранящимся данным практически неразличим. Потребность в поддержки многопользовательской работы и возможность децентрализованного хранения данных потребовали развития средств администрирования баз данных с реализацией общей концепции средств защиты данных от несанкционированного доступа к ним.
Данная концепция была реализована при помощи разграничения доступа пользователей к хранящимся данным и установлением паролей на аккаунты пользователей. Необходимость в новых реализациях вызвала создание серьезных научно-теоретических трудов по оптимизации распределенных многопользовательских баз данных. Полученные результаты стали активно внедряться в организационные системы управления базами данных. Практически все современные системы управления базами данных имеют функцию подключения клиентских приложений, которые разработаны с использованием настольных систем управления базами данных, и средства, предназначенные для экспорта данных из форматов настольных систем управления базами данных второго этапа развития в необходимый формат.
К данному этапу развития можно отнести и разработку стандартов в рамках языков описания и манипулирования данными и технологий по обмену данными между различными системами управления базами данных. Также начинаются производственные работы, связанных с реализацией концепции объектно-ориентированных баз данных. Представителями систем управления базами данных, относящимся к третьему этапу, можно считать Microsoft Access и все современные серверы баз данных Oracle, Microsoft SQL Server и другие современные серверы баз данных, которых в настоящее время насчитывается несколько десятков.
2 Организации и технология создания и ведения распределенных баз данных
Жизнь в современном мире невозможно представить без эффективного управления. Важной категорией являются системы обработки информации, от которых во многом зависит эффективность работы любого учреждения не зависимо от формы собственности. Система обработки информации предоставляет пользователю возможности по получению общих и детализированных отчетов по итогам проделанной работы, позволяет легко определять тенденции изменения важнейших показателей эффективности работы, обеспечивает получение информации без существенных задержек, а также выполняет анализ данных. Ядром любой системы обработки информации является база данных, а для того чтобы она функционировала необходима система управления базой данных, которая используется в роли интерфейса между базой данных и пользователем, работающим с ней.
Имея представление о состоянии распределенной обработки в мире в целом, определив направление разработки на основании выбранных технологии и формы представления данных, остается лишь сформировать конечное представление о деталях настоящего проекта. Итак, конечный продукт, как средство обработки большого объема ка информации, представленной в слабоструктурированном формате должен обладать ил следующими качествами:
распределенность вычислений по нескольким на машинам, для повышения производительности и снижения времени расчетов;
цельность, не взирая на мультикомпонентность даже на этапе планирования, ил стремление к повышению данного показателя обеспечивает легкость транспортировки или переустановки конечной программы, что несомненно – одно из ключевых показателей качества для потенциальных клиентов;
наглядность конечного представления - необходимо выбрать наиболее подходящую структуру данных для демонстрации за результатов.
Так, правила и цели которыми должны обладать распределенные базы данных описаны профессором Кристофером Дейтом [2].
Прежде чем начать, необходимо составить полную картину концепции приложения. Какие данные по структуре и объему предполагаются, какие запросы теоретически придется выполнять чаще всего. В работе над любым проектом в сфере IT всегда остается риск будущих глобальных изменений, при выборе инструментов это всегда лучше учитывать, и предпринимать все возможное, чтобы целевое приложение было на столько гибким, на сколько это возможно.
Например, при значительном расширении клиентской базы того или иного программного продукта, метаинформация о пользователях и их взаимосвязях –уже не просто данные – это непредсказуемая структура, которая со временем может преобразоваться либо в BigData, либо в комплексную семантическую сеть, часто разработчик не может заранее сказать, какой она будет. Как же выбрать базу данных –или хотя бы ее архитектуру, чтобы создать действительно эффективно работающее приложение? Чтобы ответить на этот вопрос, следует систематизировать информацию о различных базах данных.
Самый распространенный и известный претендент на эксплуатацию – это реляционные базы данных с единым языком SQL. Просто, привычно и стандартно. Именно благодаря стандартизации реляционные базы данных обрели популярность и доминируют на рынке. Но на деле реляционные базы данных – это просто таблицы, где в каждой строке выстраивается однозначное соответствие между ключом и его многочисленными (или малочисленными) атрибутами. Пока приложениям было достаточно отдельных таблиц и не учитывать особенных взаимодействий на между собой и разными типами данных, этого было вполне достаточно.
Отметим, что обеспечение независимости прикладных программ и данных (логическая и физическая независимость)
Закажи написание реферата по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!
Нужна помощь по теме или написание схожей работы? Свяжись напрямую с автором и обсуди заказ.
В файле вы найдете полный фрагмент работы доступный на сайте, а также промокод referat200 на новый заказ в Автор24.