Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Введение
Современный мир – это мир информации, потому что она во всех сферах жизни людей, в том числе связанными с бизнесом или управлением. С самого начала цивилизации человек манипулирует данными, а данные и информация поступают и передаются в процессе. Однако, важное место дисциплины, связанные с получением и обработкой информации, заняли только в последние несколько десятилетий. Сегодня манипулирование данными и обработка информации стали основными задачами любой организации, малой или большой, будь то образовательное учреждение, правительственная организация, научная, коммерческая или любая другая. Таким образом, мы можем сказать, что информация является основной управления любого бизнеса или организации.
На начальном этапе появление вычислительной техники и ее применения в использовании баз данных для хранения, обработки и использования информации, проблемы структуризации данных решались индивидуально в каждой информационной системе. Однако, современные информационные системы требуют сложных структур денных, а индивидуальные средства управления данными, являясь существенной частью информационной системы, стали практически повторяться от одной системы к другой, что привело к желанию выделить и обобщить общую часть информационных системы, ответственных за управление сложно структурированными данным, что стало первым шагом к созданию СУБД.
Целью данной работы является изучение баз данных, их истории и системы управления ими.
1 Сущность баз данных, их классификация и история развития
1.1 Обзор литературы
В данной части этой главы рассмотрим литературу, которая была использована при написании данной работы.
В статье Грей Дж. «Управление данными: Прошлое, Настоящее и Будущее» рассматриваются этапы эволюции систем управления данными, при этом автор выделяет шесть поколений менеджеров данных и соответствующие им шесть поколений развития баз данных и систем управления ими.
В учебном пособии Кумскова М.И. «Базы данных и процессы их создания» рассматриваются вопросы визуального моделирования и логического проектирования, организации процессов создания базы данных и информационных систем. Также затрагиваются вопросы основы реляционной модели и языка формирования запросов к этой базе. Автор также описывает процесс визуального моделирования логической структуры базы данных, который описывается в нотации UML.
В учебнике Сиранта О.В. и Коваленко Т.А. «Работа с базами данных» содержит классификации баз данных и систем управления данными в рамках, а также подробное описание каждого типа и область их применения.
В учебном пособии Сычева А.Н. «ЭВМ и периферийные устройства» рассматриваются электронно-вычислительные машины и периферийные устройства, которые необходимы для управления современных систем управления базами данных.
В книге Таненбаума Э. «Компьютерные сети» приводятся описание структуры и организации сетей, которые необходимы для организации работы распределенных баз данных.
В учебнике Шустовой Л.И. и Тараканова О.В. «Базы данных» приводятся основы проектирования и реализации реляционных баз данных, при этом особое внимание уделяется фундаментальным понятиям и принципам организации моделей данных «сущность-связь» и реляционной модели данных.
1.2 История развития
Первые известные письменные свидетельства описывают учет царской казны и налогов в Шумере. Таким образом, хранение и обработка записей имеет долгую историю. На протяжении следующих шести тысячелетий происходила эволюция ведения записей от глиняных таблиц к папирусу, затем к пергаменту и, наконец, к бумаге. Объем информации рос, вводились новые формы представления данных, однако, обработка информации осуществлялась вручную.
Первая попытка автоматизации обработки информации была в начале 19 века, когда Джеквард Лум начал осуществлять раскрой ткани по представленным перфокартами образцам. Позже похожая технология была применена в механических пианино. Спустя почти век в 1888 году американским инженером Германом Холлеритом была сконструирована первая электромеханическая счетная машина. Данная машина, которую назвали табулятором, была способна считывать и сортировать статистические данные, закодированные на перфокартах. Спустя 2 года изобретение Холлерита впервые применялось в 11 американской переписи населения, в результате чего с работой, на которую ранее выполняло 500 сотрудников на протяжении 7 лет, 43 машины Холлерита помогли выполнить за 1 месяц 43 сотрудниками, благодаря технологии перфокарт.
В 1896 году Холлерит основал фирму Computing Tabulating Recording Company, ставшую прародительницей IBM (International Business Machines Corporation, IBM) – компании, которая сделала огромный вклад в развитие мировой компьютерной техники и процветала в период с 1915 до 1960 года как поставщик оборудования регистрации данных для бизнеса и правительственных организаций.
К 1955 году многие компании имели целые этажи, которые использовались для хранения перфокарт, что было отчасти похоже на шумерские архивы глиняных таблиц. Другие этажи содержали ряды перфораторов, сортировщиков и табуляторов. Крупные компании обрабатывали и производили миллионы записей ежедневно, что было бы невозможно при использовании ручных методов обработки.
В 1960 г. Чарльз Бахман, перейдя на работу в компанию General Electric (GE) из химической компании Dow Chemical, разработал одну из первых в мире систем управления базами данных, получившую название Integrated Date Store.
В 1965 г. на конференции CODASYL (Conference on Data System Languages) создана рабочая группа, которая должна была определить спецификации среды, допускавшие бы разработку баз данных и управление данными. В 1971 году был опубликован отчет о результатах работы этой группы, определявший три компонента:
сетевая схема (организации базы данных в целом);
подсхема (часть базы данных, как она видится пользователям и приложениям):
язык управлении данными, включавший язык описания данных (ЯОД, или DDL – Data definition Language) и язык манипулирования данными (ЯМД или DML – Data Manipulation Language).
Системы, созданный на основе результатов CODASYL относятся к СУБД первого поколения и используют сетевые и иерархические модели данных.
В 1970 г. Э. Кодд опубликовал статью о реляционной модели данных, что ознаменовало новый этап в развитии баз данных и послужило мощным толчок к развитию реляционных СУБД. Коммерческие СУБД, использующие реляционную модель данных, появились в конце 1970-х – начале 1980-х гг. Особо следует отметить СУБД System R (IBM, 1976 г.), в которой был использован язык SQL. СУБД, использующие реляционную модель данных, – это СУБД второго поколении.
В 1976 г. П. Чен представил модель «сущность – связь», определив тем самым технологию проектировании баз данных и дав толчок новому этапу в их развитии. В результате чего появились расширенная реляционная модель данных и семантические модели данных.
С ростом сложности приложений стали использовать объектно-ориентированные модели данных, в результате чего появились объектно-ориентированные и объектно-реляционные СУБД, которые определяются как СУБД третьего поколения.
1.3 Исторические аспекты
Движущими силами развития информационных систем и баз данных являлись две тенденции. Во-первых, выгода их использования в крупных коммерческих организациях (или корпорациях) и, во-вторых, стремительное развитие средств вычислительной техники. Кратко рассмотрим «как это было». До начала 80-х гг. роль компьютеров была ясной и понималась однозначно. Большие универсальные машины (mainframe) являлись инструментом для решения задач бизнеса крупных корпораций. Существовали большие поставщики, такие как IBM и DEC, которые имели свои системы, свою стратегию и свои прикладные решения. Эти компании четко определяли организационные структуры, профессиональный состав персонала и консультантов на всех этапах применения технических и программных средств.
В 60-70-с годы компьютеры не столько изменяли что-либо в организациях, сколько предохраняли от этого. Большие организации, утопавшие до этого в бумагах, обнаружили, что использование информационных технологий позволяет им повысить эффективность существующих структур. Вместо того чтобы изменять существовавшие бизнес-процессы, компьютеры делали их более «быстрыми». Одно из утверждений тех времен гласит: процесс в бизнесе не должен преобразовываться до тех пор, пока он эффективно функционирует: «не меняй процесс – сделай его более быстрым».
Компьютеры 60-х годов не вызвали фундаментальных изменений в организациях бизнеса, они сыграли важную роль в сохранении функциональнойструктуры организаций тоговремени в первоначальном виде. Компьютер делал возможной сложную централизованно управляемую бюрократическую деятельность. Автоматизировались все существующие «негибкости» бюрократии.
Возможности вычислительной техники значительно изменились в период с 1968 по 1972 гг. Базы данных, терминалы, сети и магнитные диски – все появилось практически в одно время. В результате почти все существовавшие до тех пор приложения устарели, и возникла потребность в целом классе новых приложений.
В начале 70-х годов в издании Harvard Business Review была описана концепция баз данных, подключенных и управляемых с использованием терминалов – менеджерам предлагалось проведение следующих мероприятий:
Рассматривать информацию как ключевой корпоративный ресурс;
Построить целостную и нитрированную БД, охватывающую все сферы деятельности компании;
Обеспечить оперативный ввод и обновление информации в БД, сразу, как только информация поступает в компанию.
С течением времени выяснилось, что:
Базы данных, функционирующие в реальном масштабе времени, могут сделать их предприятия более конкурентоспособными
. Если информация доступна, оперативна и организована в БД, то это даст возможность компании работать эффективней.
Создание современных ИС, работающих в оперативном режиме, является исключительно дорогостоящим делом.
Одной из задач, с которой сталкивается руководители различных уровней, является владение информацией, позволяющей знать, что же в действительности происходит на предприятии. БД дает возможность задавать вопросы, позволяющие решить насущные проблемы, в рамках информационной системы предприятия.
Восьмое десятилетие прошлого века – это время появления и развития персональных компьютеров, которые изменили взгляды пользователей на доступность вычислительных ресурсов и сформировали потребность в совершенно новом классе приложений и компьютерных систем. Фокус компьютерной индустрии переместились из сферы самих компьютеров и БД в сферу процессов проектировании и построения приложений. Этот период характеризуется перехода процесса разработки приложений для бизнеса из области искусства в инженерную дисциплину. В ходе этого процесса сформировались два важных результата: методология и CASE-средства.
Восьмое десятилетие прошлого века можно назвать десятилетием персонального компьютера. В 1990г. в мире насчитывалось 30 тыс. больших универсальных компьютеров – самое большое количество, которое когда-либо может повториться снова. В том же году число персональных компьютеров составляло свыше 30 млн.
До второй половины 80-х годов большинство людей имели лишь очень ограниченный доступ к вычислительным ресурсам. В 1985 году уже миллионы пользователей были вовлечены в «персональное использование» текстовых редакторов и электронных таблиц – MultiMate, VisiCalc, Lotus 1-2-3, dBase, WordStar. Эти приложения были значительно проще в освоении и применении по сравнению с приложениями, используемыми на универсальных ЭВМ. Эти приложения позволяли пользователям думать по-новому, поскольку они могли настраиваться под их конкретные потребности. Персональные компьютеры 80-х не могли использоваться для построения реальных приложений для бизнеса. Поскольку профессионалы компьютерных подразделений предприятий пренебрежительно отнеслись к возможностям первых персональных компьютеров, то в течение 80-х годов выросло новое поколение «других» профессионалов. Вчерашние программисты VisiCalc, Lotus 1-2-3, BASIC и С, стали «гуру» к области технологии клиент-сервер, специалистами по интеграции таких систем.
Результаты использования ПК были очевидны: легкий в применении графический интерфейс пользователя, фактически неограниченных доступ к ресурсам компьютера с индивидуальною рабочею места и новое представление о компьютерах и приложениях, выполняемых на них. Затраты на информационные технологии к концу 80-х годов утроилась (но сравнению с 1980г). Большинство компаний достигли отметки, когда они тратили на компьютеры больше, чем могли себе позволить. 90-е годы лучше всею охарактеризовать как десятилетие, когда сфера управления окончательно убедилась, что она не может больше мириться е ростом затрат на информационные технологии (ИТ). В целом затраты на ИТ вышли из-под контроля.
Период 80-90-е гг. характеризовался тесным сближением структур БД и тех предприятий, которые они поддерживают. Появились:
Объектно-ориентированные технологии в программировании и управлении данными. Это позволило разработчикам говорить с заказчиками и пользователями на одном языке и упростить связь между концептуальным проектом и реализацией ИС.
Управление потоками работ (workflow management), при котором определяется последовательность исполняемых задач, как пользователей, так и ИС приложений в рамках единою бизнес процесса. Системы, основанные на потоках работ, дают возможность моделировать «естественный пуп, осуществления производственной деятельности».
1.4 Классификация баз данных
Существует множество подходов к классификации баз данных в зависимости от признака, по которому осуществляется классификация (рис. 1).
Рисунок 1 – Классификация баз данных
Прирассмотрении вычислений принято различать централизованные базы данных, расположенные на «универсальных ЭВМ» (mainframe) и БД архитектуры «клиент-сервер». Централизованные БД доминировали в 70-80-х годах, архитектура «клиент-сервер» является основной в настоящее время.
При централизованном подходе вычисления проводятся па «большой» универсальной вычислительной машине, к которой подключены терминалы. Электронные картотеки (или наборы данных) организованы в виде множества пар «Главная – Подчиненная». Запись главной картотеки содержит (физические) указатели па одну или несколько записей подчиненной картотеки. Общая организация БД на логическом уровне может быть представлена в виде иерархии (дерева), где узлу (вершины дерева) представляют картотеки, имеющие одинаковую структуру записей. Такие БД называются иерархическими - классическим представителем БД этого класса является система IMS фирмы IBM.
В 80-х годах начали использовать БД, логическая структура данных которых представляется в виде сети – внутри структуры данных разрешаются циклы. Такая модель данных называется сетевой. И в сетевой, и в иерархической модели данных работа с данными состояла в «перемещении фокуса вычисления» по «Графу картотек». Поэтому эти две модели данных иногда называют навигационными моделями, чтобы отличать их от реляционной модели.
Для определения данных и разработки прикладных программ в навигационных БД использовался (и продолжает использоваться) алгоритмический язык COBOL. Чтобы оценить масштаб современного применения навигационных БД, использующихся в «старых» системах (или в унаследованных системах – Legacy system), достаточно сказать, что число программистов, пишущих на языке COBOL, в настоящее время превышает два миллиона человек во всем мире.
В архитектуре «клиент-сервер» используются распределенные вычисления – на стороне пользователей (или «клиентов», т.е. на стороне прикладных программ) вычисления проводятся на ПЭВМ, которые имеют доступ к данным на сервере. Сервер – это логический процесс, который обеспечивает обслуживание запросов других процессов на предоставление доступа к общему ресурсу (например, к принтеру, к электронной почте и т.п.). Сервер не посылает данных клиенту, пока от него не поступит запрос. Сервер отвечает за управление синхронизацией обслуживания клиентов и за связи сервера с другими процессами. Таким образом, сервер – это не узел локальной вычислительной сети (ЛВС), а логический процесс, отвечающий за обработку запросов к ВД.
Клиент – это процесс, посылающий серверу запрос на обслуживание. Клиент может начать взаимодействие е сервером, а сервер – нет. Как правило, клиент – это прикладная программа, выполняющаяся на рабочем месте (например, ПЭВМ) пользователя. Она обеспечивает автоматизацию бизнес-задач пользователя, например, ввод данных о заказе клиента. Клиент и сервер, как правило, выполняющаяся на различных узлах сети, хотя это не обязательно – они могут физически выполняться на одной и той же машине. Технология «клиент-сервер» обеспечивает распределенную обработку данных используются различные вычислители, связанные друг с другом сетью.
На физическом уровне СУБД может хранить данные на многих ЭВМ, – узлах сети. В этом случае говорят о распределенной базе данных. Клиенты могут не знать о таком распределении и рассматривать данные (на логическом уровне) как «хранимые в одном месте», т.е. на одной машине. Взаимодействие клиента с сервером осуществляется с использованием языка, ориентированного на работу с БД. Для реляционных БД таким языком является SQL. После обработки запроса сервер БД возвращает клиенту только данные, удовлетворяющие запросу.
2 Информационные технологии баз данных
2.1 Описание систем и технологий
Как уже отмечалось ранее для управления базами данных используются систему управления базами данных, которые также могут быть классифицированы по различным признакам (рис. 2).
Рисунок 2 – Классификация СУБД
CУБД представляет собой оболочку, с помощью которой при организации структуры таблиц и заполнения их данными получается та или иная база данных. В связи с этим полезно поговорить о системе программно-технических, организационных и «человеческих» составляющих (рис. 3). Программные средства включают систему управления, обеспечивающую ввод-вывод, обработку и хранение информации, создание, модификацию и тестирование БД, трансляторы.
Рисунок 3 – Состав СУБД
Базовыми внутренними языками программирования являются языки четвертого поколения
Закажи написание реферата по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!
Нужна помощь по теме или написание схожей работы? Свяжись напрямую с автором и обсуди заказ.
В файле вы найдете полный фрагмент работы доступный на сайте, а также промокод referat200 на новый заказ в Автор24.