Основные понятия
Для улучшения функционирования требуется наличие развитой ин-фой системы (ИС), которая реализует
автоматизированный сбор, обработку и манипулирование данными.
ИС вкл в себя :
Вычислительную систему
Систему управления БД (СУБД)
Одну или несколько баз данных
Набор прикладных программ (приложение БД)
Предметная область – это часть реального мира, подлежащая изучения с целью ее автоматизации.
Любая предметная область несет в себе огромное кол-во ин-ии, часть которой можно четко выделить,
структурировать и сохранить на эл-м носителе с целью последующего эффективного поиска и обработки.
Некоторую часть ин-и пердметной области можно сформулировать ввиде бизнес-правил – формальных
правил, которые учитываются при определении связей между элементами данных, так формируется БД,
которую можно считать информационной моделью предметной области.
Документо-ориентированные
Фактографические базы данных
БД+ПО=ИС
Классификация ИС
По назначению:
ИПС-информационно поисковые системы
УИС(ЭИС)-управляющие(экономические) ИС
ЭС-экспертные системы
ЭС- способны на самостоятельное принятие решений, т.е имеют в своем составе базу знаний,
позволяющую получать новые знания на основе уже имеющихся.
По предметной области:
Состав ИС
Базовое Прикладное
ОС СУБД Приложения БД
СУБД явл надстройкой над ОС, которая значительно расширяет стандартные возможности ОС по
управлению данными.
ПрПО включает программы (приложения), специфичные для конкретной предметной области, которые
решают все прикладные задачи, необходимые пользователям системы.
АБД несет ответственность за безопасность и целостность всех данных и осуществляет такие функции,
как разграничение доступа пользователей и аудит их действий, регулярное резервное копирование данных и
восстановление БД в случае сбоев, обеспечение приемлемой производительности системы, целостности
данных и т.д.
1. Принцип интегрированности.
Принцип состоит в том, что существует одна единая интегрированная БД для всей предметной области,
которая совместно используется персоналом, при этом одновременно может быть запущено множество
приложений с различной функциональностью.
Преимущества:
б) физическая независимость – может быть изменен физический формат хранения данных, т.е.
переход на новую СУБД или новую версию СУБД, без коренной переделки прикладного программного
обеспечения.
Принцип масштабируемости:
Принцип масштабируемости – это свойство инфор-ой системы при переносе на новую платформу не
происходит потерь ин-ии и коренной переделке прикладного ПО.
Локальные ИС, которые располагаются целиком на одном компьютере и предназначены для работы
только одного пользователя.
Сервер представляет собой набор программ, которые контролируют выполнение различных процессов.
Основная функция сервера – по запросу клиента запустить какой-либо определённый процесс и отправить
клиенту результат его работы.
Основная задача клиента – выполнение приложения и осуществление связи с сервером, когда этого
требует приложение. Т.е клиент должен предоставлять пользователю интерфейс для работы с приложением,
реализовать логику его работы и при необходимости отправлять задание серверу.
Типы серверов:
Архитектура «файл-сервер»
Копии базы данных передаются для обработки на клиентские компьютеры, при этом постоянно
выполняется синхронизация основной базы данных с ее копиями в случае их обновления.
Архитектура «клиент-сервер»
Недостаток – большая нагрузка на сервер, который должен отрабатывать запросы всех клиентов, и
малая нагрузка на клиентскую часть. По мере роста количества одновременно работающих пользователей
сервер часто становится узким местом всей системы и возникает необходимость его разгрузки.
Многозвенные архитектуры
В 3хзвенной в качестве промежуточного слоя программного обеспечения между сервером и клиентом
используется сервер приложений. Сервер приложений берет на себя существенную часть обработки данных,
позволяя разгрузить и серверную, и клиентскую части.
В трехзвенной архитектуре часто используется так называемый тонкий клиент (thin client), который
вообще не выполняет никаких функций обработки данных, а только обеспечивает представление данных и
взаимодействие с пользователем. В отличие от этого, клиента двухзвенной системы обычно называют
толстым клиентом (fat client).
web-архитектура
На клиентской стороне требуется только браузер (например, Internet Explorer) для отображения html-
страниц, принимаемых со стороны web-сервера, и взаимодействия с пользователем.
В терминальном режиме весь программный код как серверной, так и клиентской части исполняется на
сервере, а на терминалы передается лишь изображение, которое должно быть отображено на экране
монитора. Все данные, введенные с терминала, немедленно передаются для обработки на сервер.
На сервере должно быть запущено столько копий клиентского программного обеспечения, сколько
терминалов подключено к серверу.
Модели данных
Под модель баз данных понимается структура базы и методов работы с ней.
Понятиями. На основе которых строится модель хвл. объекты и отношения между ними. Подобную
модель данных, функционирующею на сервере, и можно назвать базой данных.
1. Иерархическая модель.
2. Сетевая модель
3. Реляционная модель
4. Объектно-реляционная модель
5. Объектно-ориентированная
Иерархическая модель.
Вершины модели представляют собой совокупность данных. каждой вершине соответствует файл.
Вершины расположены по уровням и связаны между собой отношениями подчиненности. Тип связей 1:1,
1:М, М:1.
Сетевая модель
РМ БД представляет объекты и взаимосвязи между ними в виде таблиц, а все операции над данными
сводятся к операциям над этими таблицами.
Каждая строка содержит данные относящиеся к некоторому объекту или части объекта. Каждый
столбец описывает какой-либо атрибут этого объекта. Строки отношения наз сущностями, а столбцы –
атрибутами.
Таблица отношение
Объектно-реляционная модель
Объектно-ориентированная модель
ООСУБД представляют собой библиотеку, процедуры управления данными которой вкл в прикладную
программу.
Ключи и индексы
1. Ключ
Ключ представляет собой комбинацию полей, данные в которых однозначно определяют каждую
запись в таблице. Простой ключ состоит из одного поля, а составной (сложный) — из нескольких полей. Поля,
по которым построен ключ, называют ключевыми. В таблице может быть определен только один ключ. Ключ
обеспечивает:
Значение ключа располагается в определённом порядке (отрисованы). Для каждого значения ключа
имеется уникальная ссылка, указывающая на расположение соответствующей записи в таблице БД. Поэтому
при поиске записи выполняется, не последовательный просмотр всей таблицы, а прямой доступ к записи.
2. Индекс
Индекс, как и ключ, строится по полям таблицы, однако он может допускать повторение значений
составляющих его полей. Поля, по которым построен индекс, называют индексными. Простой индекс состоит
из одного поля, а составной (сложный) — из нескольких полей.
Организация связи (отношений) между таблицами называется связыванием или соединением таблиц.
Для связывания таблиц используются поля связи (иногда используется термин совпадающие поля).
Поле связи (первичный ключ) – особое поле таблицы, которое однозначно идентифицирует запись.
В подчиненной таблице для связи с главной таблицей берется индекс, который также называется
внешним ключом.
Поля связи должны быть индексированными. Связь между таблицами определяет отношение
подчиненности, при котором одна таблица является главной, а вторая — подчиненной.
1:1
1: N
N:1
N:M
Отношение 1:1
Имеет место, когда одной записи в родительской таблице соответствует одна запись в дочерней.
Отношение 1:N
Имеет место, когда одной записи родительской таблицы может соответствовать несколько записей
дочерней.
Отношение N:M
|. Ограничение целостности.
Ограничение целостности - это некоторое утверждение, которое может быть истинным или ложным в
зависимости от состояния базы данных.
В любой момент времени любая бд содержит некоторую конфигурацию значений данных, которая
должна отображать действительность.
1. Целостность сущностей
Объект реального мира представляется в реляционной базе данных, как запись некоторого отношения.
Требование целостности сущностей – это каждая запись любого отношения отличается от любой записи
этого отношения, т.е. каждое отношение должно иметь первичный ключ.
Правило: атрибуты, которые входят в состав потенциального ключа не могут иметь null-значений.
2. Целостность ссылок.
Целостность ссылок - сложный объект реального мира представляет в реляционной базе данных в виде
записей нескольких нормализованных отношений.
При этом:
Транзакция
Транзакция – это последовательность действий с БД, в которой все действия либо выполняются
успешно, либо не выполняется ни одно из них.
Нормализация
Нормализация- это метод организации реляционной базы данных с целью сокращения избыточности
данных.
В ходе этого процесса неоптимальная таблица разбивается на две и более таблиц, между которыми
создаются отношения(связи).
Цель нормализации: структура базы данных должна обеспечивать принцип «По одному факту в одном
месте».
При нормализации бд создается больше таблиц, информация в них распределяется равномернее, что
приводит к снижению избыточности данных.
Нормализация:
Дата Сотрудники
Значения в ячейке не должно содержать групп значений
2НФ
2НФ требует, чтобы Отношение находилось в 1НФ и все столбцы зависели от полного первичного
ключа, а не от его частей.
Те поля, которые зависят только от части первичного ключа, должны быть выделены в состав отдельных
таблиц.
Таблица, в которой первичным ключом является один столбец, автоматически считается имеющей
вторую нормальную форму.
Отношение находится в 3нф тогда и только тогда, когда оно находится во 2нф и не содержит
транзитивных отношений.
Для приведения отношения к НФБК надо разделить исходное отношение на части, выделив в отдельное
отношение атрибуты, меняющиеся в составе потенциальных ключей.
Пример:
Имеется отношение, отражающее сдачу студентами экзаменов сессии, со схемой = № зач книжки, №
студ билета, дисциплина, дата, оценка
Неизбежного повторения можно избежать, разделив это оношения на два других со схемами:
1 вариант:
2 вариант:
Таблица нарушает требованиям 4нФ, если служит мостом между более чем двумя таблицами.
Денормализация
Денормализация – это процесс, обратный нормализации, ради повышения производительности. Т.е –
введение избыточности данных в бд.
А это приводит к появлению множества значений, реализующих внутренние связи между таблицами и
дополнительные затраты времени на выполнение операций объединения, что влияет на производительность.