Быстрый поиск в условиях больших массивов данных
Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Введение
В современном мире все чаще возникает необходимость хранения данных. На данный момент данная задача не является проблематичной, однако необходимо учитывать специфику хранения: так, ключевыми факторами являются безопасность, скорость обработки и выгрузки, и несомненно целостность и её поддержание в хранилище. Рынок ПО предлагает множество решений для хранения данных, однако хранение больших данных – это уже довольно специфичная тематика, и СУБД здесь необходимо выбирать с большей осторожностью и вниманием. Вместе с тем, в классическом стеке можно найти решения для большинства задач, устанавливаемых бизнес-логикой, однако если задачи лежат в области специфики прикладной области – к примеру, высоконагруженная передача данных, обработка миллионов записей и т.д. – то здесь необходимо использовать специализированные средства, которые способны наиболее оптимальным образом обеспечить корректное взаимодействие с хранимыми данными. Цель изучения: проанализировать существующие механизмы работы с большими данными, а также поиск в таковых данных. Объект изучения: большие массивы данных. Предмет изучения: реляционные и нереляционные СУБД и их технологии для больших данных. Задачи: найти и изучить существующую литературу по тематике; агрегировать полученные знания в категории; осветить нюансы в изучаемой тематике; составить сравнительный анализ по тематике; произвести выводы, исходя из полученных данных.
Взаимодействие с базой данных
Функциональные возможности, предоставляемые СУБД, могут сильно отличаться. Основной функциональностью является хранение, извлечение и обновление данных. Кодд предложил следующие функции и услуги, которые должна предоставлять полноценная СУБД общего н...
Открыть главуБольшие данные
Большие данные — это поле, в котором рассматриваются способы анализа, систематического извлечения информации или иного обращения с ней. Наборы данных, которые слишком велики или сложны, чтобы иметь дело с традиционным программным обеспечением для обр...
Открыть главуB-дерево:бинарные деревья поиска
B-дерево является обобщением двоичного дерева поиска в том, что узел может иметь более двух дочерних элементов. В отличие от других самобалансирующихся бинарных деревьев поиска, B-дерево хорошо подходит для систем хранения, которые читают и записываю...
Открыть главуСравнение СУБД для работы с большими данными
В основном, для хранения данных используют два типа СУБД: реляционные и нереляционные, также называемые SQL и NoSQL. Они различаются с точки зрения поиска, распространения и обработки данных. Реляционный. Поскольку структурированный язык запросов явл...
Открыть главуЗаключение
В ходе выполнения курсового проекта были достигнуты следующие задачи: изучены средства взаимодействия с большими данными; составлено описание и проблематика больших данных; предоставлены наиболее популярные средства для работы с большими данными; предоставлены существующие механизмы для оптимизации взаимодействия с большими данными; произведен сравнительный анализ двух подходов к организации данных. Все поставленные изначальные задачи были выполнены. Цель курсового проекта выполнена в полном объеме. Стоит отметить, что полученная информация может послужить фундаментом для дальнейших исследований и наработок в данной области: на их основе возможно произвести множество эмпирических исследований, а также служить руководством в прикладной сфере разработки.
Список литературы
Дейт, К., Дж. Введение в системы баз данных. 6-е изд. – СПб.: «Вильямс», 2015. – 848 с. В.В. Корнеев, А.Ф. Гареев, С.В. Васютин, В.В. Райх. Базы данных. Интеллектуальная обработка информации. – М.: Нолидж, 2015. – 496 с. Мартин Фаулер, Прамодкумар Дж. Садаладж. NoSQL: новая методология разработки нереляционных баз данных. -- М.: «Вильямс», 2013. Карпова Т.С. «Базы данных: модели, разработка, реализация» – СПб.: Питер, 2015. – 304 с.: ил. Хoмoненкo A.Д., Цыгaнкoв В.М., Мaльцев М.Г. Бaзы дaнных: Учебник для выcших учебных зaведений / Пoд pед. пpoф. A.Д. Хoмoненкo. – Издaние втopoе, дoпoлненнoе и пеpеpaбoтaннoе. – CПб.: КOPOНA пpинт, 2016. - 672 c. Глушaкoв C.В., Лoмoтькo Д.В. Бaзы дaнных: Учебный куpc. – Хapькoв: Фoлиo; Pocтoв н/Д: Феникc; Киев: Aбpиc, 2015. – 504 c. Хаббард, Дж. Автоматизированное проектирование баз данных; М.: Мир, 2011. - 453 c. Архитектура системы big data информационного пространства вуза URL:https://cyberleninka.ru/article/n/arhitektura-sistemy-big-data-informatsionnogo-prostranstva-vuza дата обращения 17.11.2019 Mongo DB URL: https://www.mongodb.com/compare/mongodb-postgresql - дата обращения 17.11.2019 Сопоставление реляционных баз данных и NoSQL URL: https://code.tutsplus.com/articles/mapping-relational-databases-and-sql-to-mongodb--net-35650 Дата обращения 17.11.2019 Кластеризованные индексные структуры URL: https://docs.microsoft.com/en-us/previous-versions/sql/sql-server-2008-r2/ms177443(v=sql.105)?redirectedfrom=MSDN Дата обращения 17.11.2019 Проектирование и оптимизация индексов URL: https://searchsqlserver.techtarget.com/tip/Database-index-design-and-optimization-Some-guidelines дата обращения: 17.11.2019