Лекции по системам управления базами данных - файл n1.doc

Лекции по системам управления базами данных
Скачать все файлы (140 kb.)

Доступные файлы (1):
n1.doc140kb.18.02.2014 22:05скачать

n1.doc

  1   2   3
Основные понятия и определения

Основные понятия и определения.

1988 г. – документ, определяющий понятие БД, БнД.

Банк данных – система, специальным образом организованных данных, т.е. баз данных, программных, технических, языковых, организационно-методических средств, предназначенная для обеспечения централизованного накопления и коллективного многоцелевого использования.

База данных – именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области.

СУБД – совокупность языковых и программных средств, предназначенная для создания, ведения и совместного использования БД многими пользователями.

Приложения – программы, с помощью которых пользователи работают с БД, будем назвать приложениями.

Архитектура БД. Физическая и логическая независимость.

Среди множества предложенных архитектур БД выделим трехуровневую систему организации БД, которая была предложена комитетом по стандартизации ANSI:


Внешняя модель данных 1



Внешняя модель данных n

Концептуальный уровень

физический уровень

1

2

3



  1. Уровень внешних моделей.

Каждая модель имеет свое видение данных. Определяет точку зрения на БД отдельных приложений ( с позиции пользователей и взаимодействия).

Каждое приложение видит и обрабатывает только необходимые ему данные.

Пр: система распределения работ, отдел кадров.

  1. Концептуальный уровень – центральное управляющее звено. БД представляется в наиболее общем виде, который объединяет данные, используемые всеми приложениями, работающими с БД.

Отражает обобщенную модель предметной области для которой создавалась БД.

  1. Физический уровень. Собственно данные, расположенные в файлах, страничных структурах, которые размещены на внешних носителях информации.

Логическая структура: между уровнями 1и 2, физическая структура: между уровнями 2 и 3. Обеспечивается независимость при работе с данными.

Логическая независимость – возможность изменения одного приложения без изменения других, работающих с БД.

Физическая независимость – возможность переноса хранящейся информации с одних носителей на другие, сохраняя работоспособность приложений, работающих с БД.

Процесс прохождения пользовательского запроса.

Схема взаимодействия пользователя СУБД и ОС при обработке запроса на получение данных:


user

Рабочая память

Системный буфер

БМД



1. Пользователь посылает СУБД запрос на получение данных из БД.

2. Анализируются права пользователя и внешней модели данных, соответствующей данному пользователю. В результате: подтверждение – доступ, неподтверждение – запрет.

3. В случае запрета на доступ к данным СУБД сообщает пользователю, что ему запрещено (стрелка 11) и прекращает процесс.

4. в противном случае СУБД определяет часть концептуальной модели, которая затрагивается запросом пользователя.

5. СУБД получает информацию о запрошенной части концептуальной модели.

6. СУБД запрашивает информацию о местоположении данных на физическом уровне (файл или физический адрес).

6. В СУБД возвращается информация в терминах ОС.

7. СУБД обращается к ОС, чтобы ОС предоставила необходимые данные используя средства ОС.

8. ОС перекачивает информацию из устройств хранения и пересылает ее в системный буфер.

9. ОС оповещает СУБД об окончательной пересылке.

10 (11). СУБД выбирает из доставленной информации, находящейся в системном буфере только то, что нужно пользователю и пересылает эти данные в рабочую область пользователя.

Если пользователь обращается к СУБД с новым запросом, то для него не повторяются действия по проверке прав доступа и других шагов (повторяющихся для тех же данных).

БМД – база метаданных (данных о данных). Хранится информация об использованных структурах данных, логической организации данных, правах доступа пользователей, физическом расположении данных.

Для управления БМД используют специальное ПО для администрирования БД.

Стадии развития БнД.

1. Проектирование.

2. Реализация.

3. Эксплуатация.

4. Модернизация и развитие.

5. Полная реорганизация (может не быть).

На каждом этапе с БД связаны разные категории пользователей.

Основные категории пользователей и их роль в функционировании БнД:

1. Конечные пользователи:

Основная категория, под них создаются БнД. Круг конечных пользователей различается в зависимости от особенностей БнД. Могут быть: случайные пользователи, регулярные пользователи.

2. Администраторы БнД:

Группа пользователей на начальной стадии разработки БнД. Отвечают за его оптимальную организацию с точки зрения одновременной работы множества конечных пользователей. На стадии эксплуатации отвечают за корректность работы данного банка информации в многопользовательском режиме. На стадии развития и реорганизации отвечают: возможность корректной реорганизации БнД без изменения и прекращения его текущей эксплуатации.

3. Разработчики и администраторы приложений:

Функционируют во время проектирования, создания и реорганизации БнД.

Администраторы приложений координируют работу разработчиков; разработчики работают с той частью информации из БД, которая требуется для конкретного приложения.

Пр: При разработке ИС с использованием СУБД администратор данных, администратор приложений и разработчик – одно лицо. Возможна группа администраторов приложений для БД. В состав группы администраторов БД входят: системные аналитики, проектировщики структур данных, проектировщики структур данных, проектировщики технологических процессов, системные и прикладные программисты, операторы и специалисты по техническому обслуживанию. Также возможны специалисты по маркетингу.

Основные функции группы администраторов БнД:

1. Анализ предметной области (Описание предметной области, выявление ограничений целостности и определение статуса информации, определение потребности пользователей, определение соответствия данных к пользователям, определение объемно-временных характеристик обработки данных.).

2. проектирование структуры БД. (Определяется состав и структура файлов БД и связей между ними, осуществляется выбор методов упорядочивания данных, методов доступа к информации, описание БД на языке описания данных).

3. Задание ограничений целостности при описании структуры БД и процедур обработки БД (Задание декларативных ограничений целостности присущей предметной области, определение ограничений целостности вызванных структурой БД, разработка процедуры обеспечения целостности БД при вводе и корректировании данных, ограничение целостности при параллельной работе пользователей в многопользовательском режиме.).

4. Первоначальная загрузка и ведение БД (Разработка технологии проверки соответствия введенных данных реальному состоянию предметной области.).

5. Функция защиты данных (Определяется система паролей, принципы регистрации пользователей с одинаковыми правами доступа, разработка принципов для защиты данных, при сети: разработка методов кодирования информации, тестирование, рассмотрение случаев нарушения системы защиты).

6. Обеспечение восстановления БД (Разработка средств (программных технологий) восстановления БД после сбоев).

7. Анализ обращений пользователей БД (сбор статистики).

8. Анализ эффективности функционирования.

9. работа с конечными пользователями (Сбор информации об изменении предметной области, об оценке работы БД, обучение, консультирование пользователей, разработка методической и учебной документации.).

10. Подготовка и поддержание системы средств (Анализ существующих на рынке программных средств, анализ возможностей и необходимости их использования в рамках БД.).

Классификация моделей данных:

Одним из основополагающих является концепция.

Данные (в концепции БД) - набор конкретных значений, параметров, характеризующих объект, условия, ситуации или любые другие факторы. Данные не обладают определенной структурой, но могут стать информацией, когда пользователь задаст определенную структуру, т.е. осознает их смысловое содержание.

Модель данных – некоторая абстракция, которая будучи приложима к конкретным данным позволяет пользователям и разработчикам трактовать их как информацию, то есть сведения содержащие данные и взаимосвязь между ними.


Модели данных

Инфологические модели

Физические модели

Даталогические модели

Фактографические

Документальные

Основанные на странично-сегментной организации

Основанные на файловых структурах

Диаграммы Бахмана

ER-диаграммы (Модели, сущности, связи)


Документальные модели:

1. Модели, ориентированные на формат документа.

2. Дескрипторные модели.

3. Тезаурусные модели.

Фактографические модели:

1. Теоретико-графовые модели.

2. Теоретико-множественные модели.

3. Объектно-ориентированные модели.

Для каждого уровня можно выделить модели.

Физическая модель данных оперирует категориями, касающимися организации внешней памяти и устройств хранения. Организация файлов прямого и последовательного доступа, индексных файлов, инвертированных файлов, файлов, использующих различные методы кэширования и т.д.

Концептуальный уровень: модели данных, используемые на этом уровне. Внешние модели к моделям данных, используемые на уровне – подсхемы.

Модели данных.

Реляционная модель данных.

Основные определения.

В основе модели лежит теория отношений. Чарльз Содерс-Пирс (1839 – 1914), Шредер (1841 - 1902). Они показали, что множества отношений замкнуты относительно некоторых специальных операций, образует абстрактную алгебру.

Тодд в 1970 г впервые сформулировал основные понятия и ограниченные реляционные модели. Ограничил набор операций в модели с 7 основными и 4 дополнительными. Основная структура данных для модели – отношение.

n-арным отношением R называется подмножество декартового произведения множества D1xD2x…xDn, где D1,D2,…,Dn (n>1).

Исходные множества называют доменами.

Полное декартово произведение – набор всевозможных сочетаний из n элементов, где каждый элемент берется из своего домена.

3 домена: D1 – 3 фамилии

D2 – 2 учебные дисциплины

D3 – набор из 3 оценок

D1={Ив, Кр, Ст}

D2={Тех пр, БД}

D3={3,4,5}

Полное декартово произведение будет содержать набор из 18 троек.

Первый элемент: фамилия

Второй: дисциплина

Третий: оценка

Отношение R моделирует реальную ситуацию и может содержать только 5 строк:

Ив, Тех пр, 4

Кр, Тех пр, 5

Ст, Тех пр, 5

Ив, БД, 3

Ст, БД, 4

Простая графическая интерпретация. В виде таблицы соответствия вхождения и доменов в отношения, а строки – набором из n значении, взятых из исходных доменов. Фактически отношение R графически может быть представлено:

Фамилия Дисциплина Оценка

Ив ТП 3

Кр ТП 5

Ст ТП 5

Ив БД 3

Ст БД 4

Есть ряд специфических свойств: 1. В таблице нет одинаковых строк.

2. Таблица имеет столбцы, соответствующие атрибутам отношения.

3. Каждый атрибут отношения имеет уникальное имя.

4. Порядок строк в таблице произвольный.

Атрибут – вхождение домена в отношения. Строки отношения – кортеж. Количество атрибутов в отношении – степень или ранг отношения.

В соответствии со свойствами: отношения двух отношений отличаются только порядком строк или столбцов будут в рамках модели одинаковыми.

Любое отношения – динамическое отношение некоторого реального объекта внешнего мира. Экземпляр отношения отражает состояние объекта в текущий момент времени.

Схема – определяет структуру отношения.

Схемой отношения R называется перечень имен атрибута с указанием домена, к которому относятся.

S_R(A1,A2,…,An) <= Di

Если атрибуты принимают значения из одного и того же домена, то они называются Q-сравнимыми, где Q множество допустимых операций сравнения, заданных для данного домена.

Если выборка по оценкам, то Q={>,<,=,<=,>=} с символьными данными тоже могут быть заданы операции сравнения.

Схемы двух отношений эквивалентные, если они имеют одинаковую степень и возможно такое упорядочивание имен атрибутов в схемах, что на одинаковых местах будут находиться сравнимые атрибуты, то есть атрибуты, принимающие отношения из одного домена.

Пр: Реляционная модель – БД в виде множества взаимосвязанных отношений, причем связи между отношениями поддерживаются неявным образом.

Иерархические связи между отношениями.

В каждой связи одно отношение может быть основным, другое – подчиненным.

Один кортеж основного отношения может быть связан с несколькими кортежами подчиненного отношения.

Наборы атрибутов, по которым они связаны, должны содержать отношения для поддержки связей.

В основном – первичный ключ однозначно определяет кортеж отношения. В подчиненном – набор атрибутов, соответствующий первичному ключу основного отношения. Этот набор атрибутов – вторичный или внешний ключ, который связан основным отношениями.

Пр: карьера человека – 2 отношения. 1. Моделирует рабочих людей. 2. Моделирует запись трудовых книжек.

1. Сотрудник, 2. Карьера.


Сотрудник

Паспорт

Карьера


Первичный ключ: «Сотрудник», атрибут «Паспорт»; вторичный ключ: «Карьера», атрибут «Паспорт».

Операции над отношениями

В основе операций над отношениями лежит:

Алгебра – множество объектов заданных операциями. Основное множество в реляционной алгебре – отношения.

2 группы операций: 1. Теоретико-множественные операции, 2. Специальные операции.

Теоретико-множественные операции:

4 операции, из них 3 бинарные (2 отношения, требуют эквивалентных схем исходящих отношений).

А. Объединение – объединение двух отношений (отношение содержит множество кортежей принадлежащих либо первому, либо второму исходным отношениям, либо двум отношениям одновременно).

Пр: R1={r1}; R2={r2}

r1,r2 – кортежи отношений R1 и R2

Тогда R1 v R2={r|r принадл R1 v r принадл R2}

Б. Пересечение – отношение, содержащее множество кортежей, принадлежащих и первому и второму отношению.

В. Разность отношений – отношение, содержащие множество кортежей, принадлежащих одному и не принадлежащих другому отношению.

А и Б – коммутативные (результат не зависит от порядка аргументов), В – несимметричная операция.

Г. Расширенное декартово отношение – допустима для любых отношений.

Сцепление кортежей – кортеж, получающийся добавлением значений второго в конец первого.

Расширенным декартовым произведением отношения R степени n со схемой S_R1=(А1,…,Аn) и схемой S_R2=(B1,B2,…,Bn) называется схема S_R3=(A1,…,An,B1,…,Bn) содержит кортежи, полученные сцеплением кортежей для отношений R1 и R2.

Операция используется для получения отношения, которое характеризует все возможные комбинации между элементами отдельных множеств.

Концептуальное проектирование

Семантическое моделирование

Этапы:

1. Выявляется множество понятий (сущностей), которые могут быть полезны при неформальном обсуждении реального мира.

Сущности могут быть классифицированы по разным типам сущностей. Сущности будут обладать (определенного типа) некоторыми разными свойствами. Сущность обладает особым свойством, предназначенным для ее идентификации. Сущность может быть связанна с другой сущностью посредством связей.

2. Определяется набор соответствующих формальных объектов, которые могут использоваться для представления описания (семантических концепций) сущностей.

3. определяется набор формальных операторов, предназначенных для манипулирования формальными объектами.

Таблица некоторых семантических концепций

Понятие: сущность. Неформальное определение: некоторый отличимый объект, явление или процесс. Пример: Поставщик, деталь, поставка, произведение, концерт, оркестр.

Понятие: Свойство. Неформальное определение: элемент данных, описывающих характеристику сущности. Пример: номер поставщика, количество поставки, тип концерта.

Понятие: связь. Неформальное определение: связь, служащая для обеспечения взаимодействия между двумя и более сущностями. Пример: связь – поставка (соединение сущности поставщик и деталь). Связь запись (произведение, оркестр, дирижер).

Понятие: подтип. Неформальное определение: сущность типа у является подтипом сущности типа х, когда каждый экземпляр сущности типа у обязательно является экземпляром сущности типа х. Пример: Концерт (подтип сущности произведение).

  1   2   3
Учебный текст
© perviydoc.ru
При копировании укажите ссылку.
обратиться к администрации