Общая характеристика реляционной модели данных.

Файлы.

Файловые системы.

Файлы.

Хранение данных.

Использование данных в вычислительной технике.

2.1. Направления использования вычислительной техники:

1. Вычисление расчётов, невыполнимых вручную (сложные трудоёмкие алгоритмы).

2. Использование средств вычислительной техники в автоматизированных информационных системах.

Информационная система (ИС) - программный комплекс для выполнения специфических операций с данными, предоставление удобного интерфейса.

Задача - обеспечение надёжного хранения информации, оперативной выдачи необходимой информации.

Характеризуется большими объёмами исходных данных и простыми алгоритмами преобразования.

2.2. Хранение данных.

До конца 50-ых основными носителями памяти являются:

- магнитные ленты и магнитные барабаны (ёмкость магнитных лент 20 Мб и 10 Мб). Недостатки: информация организована в формате последовательного доступа, скорость магнитных лент низкая. Магнитный барабан: вместо одной считывающей головки на барабане их было несколько.

- накопители на магнитных дисках. Ёмкость - 2,5 Мб; 7,5 Мб; 29 Мб; 100 Мб; 200 Мб.

На сегодняшний день список расширился: HDD, магнитные диски, Flash-носители, пластиковые носители.

Файл - это поименованная область внешней памяти, с которой может считываться информация (с точки зрения прикладных программ).

Функции системы управления файлами:

1. Распределение внешней памяти.

2. Отображение имён файлов в соответствии с адресами внешней памяти.

3. Обеспечение доступа к данным.

Структура файла.

1. На магн. ленте – файл последовательного доступа:

заголовок

байт 0

байт 1

байт 2

байт 3

EOF (конец файла)

2. На магн. дисках физическая структура файла изменилась:

О - N цилиндров

O - M треков (дорожек)

O - K секторов

В зависимости от объёма накопителя сектора объединяются в блоки (кластеры - минимальная адресная единица информации), т.е. блок - минимальный объём, который можно прочитать или записать. Файл может занимать несколько блоков. Но читается этот файл как файл последовательного доступа.

Файл имеет свой адрес - № цилиндра, № трека и № сектора. Для обмена информацией с аппаратурой необходимо указать N, M, K. Такой вариант существенно ускоряет время доступа.

Два подхода представления файлов:

1. Файл - последовательность байтов. Из файла можно прочитать или записать указанное количество байт.

2. Файл представляется пользователю, как последовательность записей, а каждая запись - это последовательность байтов постоянного или переменного действия. Запись можно читать или записывать последовательно, либо можно позиционировать файл на запись с указанным номером.

0 Запись 1

1 Запись 2

2 Запись 3

Файл, разделённый на индексы - индексно-последовательный файл.

Именование файла.

1. Непосредственное имя файла.

2. Полное имя файла (многоуровневое).

Практически все системы поддерживают многоуровневые названия файлов (имя содержит имена каталогов, в которые он включён).

Существует 2 варианта полного названия файла:

- Цепочка имён начинается с имени накопителя - организация изолированной файловой системы:

имя накопителя->каталог 1->каталог 2->файл

- Полностью централизованная файловая система - все накопители объединяются в одно файловое пространство (цепочка начинается с корневого каталога), частично реализована в ОС Unix.

 

Защита файлов.

Любая информационная система должна обеспечивать доступ к своим ресурсам. Файл связан с определенной приложенной информацией, разорвать эту цепочку практически невозможно.

Режим многопользовательского доступа

Если операционная система поддерживает многопользовательский режим, вполне реальна ситуация, когда два или более пользователей одновременно пытаются работать с одним и тем же файлом.

Исторически в файловых системах применялся следующий подход. В операции открытия файла (первой и обязательной операции) помимо прочих параметров указывался режим работы (чтение или изменение). Если к моменту выполнения этой операции от имени некоторой программы (процесса) A файл уже находился в открытом состоянии от имени некоторой другой программы B, причем существующий режим открытия был несовместимым с желаемым режимом (совместимо только чтение), то в зависимости от особенностей системы программе A либо сообщалось о невозможности открытия файла в желаемом режиме, либо она блокировалась до тех пор, пока программа B не выполнит операцию закрытия файла.

2.4. Файловые системы.

Моделирование отношений на файловых структурах.

Файл 1 основной

F1

Файл 2 зависимый

F2

Структура записи основного файла:

в самом файле кроме первичного ключа и записи, мы получаем элементы, в которых мы имеем № записи, зависимой от кортежа. Получаем мы их по соответствующему ключу (ссылке-указателю на первую запись в подчиненном файле).

Структура записи подчиненного файла:

указатель на следующую запись, запись в цепочке подчиненных записей.

Пример создания файловой системы:

CREATE INDEX - создание индексированных файлов для первичного и вторичного ключа

CREATE INDEX <имя инд.> ON <имя отношения> (<имя атрибута> [<признак упорядочивания>],

имя инд. - уникальный идентификатор индекса в системе

имя атрибута - имя ключевого атрибута (первичный и вторичный ключ)

признак упорядочивания - упорядоченность по ключу.

В данное время большинство файловых систем непригодны для построения БД. Причины, которые не позволяют эффективно использовать файловую систему для создания информационной системы:

1. Системы управления файлами не поддерживают логически согласованный набор файлов.

2. Файловая система не обеспечивает интерпретации внутри содержимого файла.

3. Файловая система не способна к восстановлению файла после различного рода сбоев.

4. Файловая система не поддерживает режим многопользовательского доступа к информации.

 

Лекция 3. Реляционная модель. Часть 1.