Общая характеристика реляционной модели данных.
Файлы.
Файловые системы.
Файлы.
Хранение данных.
Использование данных в вычислительной технике.
2.1. Направления использования вычислительной техники:
1. Вычисление расчётов, невыполнимых вручную (сложные трудоёмкие алгоритмы).
2. Использование средств вычислительной техники в автоматизированных информационных системах.
Информационная система (ИС) - программный комплекс для выполнения специфических операций с данными, предоставление удобного интерфейса.
Задача - обеспечение надёжного хранения информации, оперативной выдачи необходимой информации.
Характеризуется большими объёмами исходных данных и простыми алгоритмами преобразования.
2.2. Хранение данных.
До конца 50-ых основными носителями памяти являются:
- магнитные ленты и магнитные барабаны (ёмкость магнитных лент 20 Мб и 10 Мб). Недостатки: информация организована в формате последовательного доступа, скорость магнитных лент низкая. Магнитный барабан: вместо одной считывающей головки на барабане их было несколько.
- накопители на магнитных дисках. Ёмкость - 2,5 Мб; 7,5 Мб; 29 Мб; 100 Мб; 200 Мб.
На сегодняшний день список расширился: HDD, магнитные диски, Flash-носители, пластиковые носители.
Файл - это поименованная область внешней памяти, с которой может считываться информация (с точки зрения прикладных программ).
Функции системы управления файлами:
1. Распределение внешней памяти.
2. Отображение имён файлов в соответствии с адресами внешней памяти.
3. Обеспечение доступа к данным.
Структура файла.
1. На магн. ленте – файл последовательного доступа:
заголовок
байт 0
байт 1
байт 2
байт 3
EOF (конец файла)
2. На магн. дисках физическая структура файла изменилась:
О - N цилиндров
O - M треков (дорожек)
O - K секторов
В зависимости от объёма накопителя сектора объединяются в блоки (кластеры - минимальная адресная единица информации), т.е. блок - минимальный объём, который можно прочитать или записать. Файл может занимать несколько блоков. Но читается этот файл как файл последовательного доступа.
Файл имеет свой адрес - № цилиндра, № трека и № сектора. Для обмена информацией с аппаратурой необходимо указать N, M, K. Такой вариант существенно ускоряет время доступа.
Два подхода представления файлов:
1. Файл - последовательность байтов. Из файла можно прочитать или записать указанное количество байт.
2. Файл представляется пользователю, как последовательность записей, а каждая запись - это последовательность байтов постоянного или переменного действия. Запись можно читать или записывать последовательно, либо можно позиционировать файл на запись с указанным номером.
0 Запись 1
1 Запись 2
2 Запись 3
Файл, разделённый на индексы - индексно-последовательный файл.
Именование файла.
1. Непосредственное имя файла.
2. Полное имя файла (многоуровневое).
Практически все системы поддерживают многоуровневые названия файлов (имя содержит имена каталогов, в которые он включён).
Существует 2 варианта полного названия файла:
- Цепочка имён начинается с имени накопителя - организация изолированной файловой системы:
имя накопителя->каталог 1->каталог 2->файл
- Полностью централизованная файловая система - все накопители объединяются в одно файловое пространство (цепочка начинается с корневого каталога), частично реализована в ОС Unix.
Защита файлов.
Любая информационная система должна обеспечивать доступ к своим ресурсам. Файл связан с определенной приложенной информацией, разорвать эту цепочку практически невозможно.
Режим многопользовательского доступа
Если операционная система поддерживает многопользовательский режим, вполне реальна ситуация, когда два или более пользователей одновременно пытаются работать с одним и тем же файлом.
Исторически в файловых системах применялся следующий подход. В операции открытия файла (первой и обязательной операции) помимо прочих параметров указывался режим работы (чтение или изменение). Если к моменту выполнения этой операции от имени некоторой программы (процесса) A файл уже находился в открытом состоянии от имени некоторой другой программы B, причем существующий режим открытия был несовместимым с желаемым режимом (совместимо только чтение), то в зависимости от особенностей системы программе A либо сообщалось о невозможности открытия файла в желаемом режиме, либо она блокировалась до тех пор, пока программа B не выполнит операцию закрытия файла.
2.4. Файловые системы.
Моделирование отношений на файловых структурах.
Файл 1 основной
F1
Файл 2 зависимый
F2
Структура записи основного файла:
в самом файле кроме первичного ключа и записи, мы получаем элементы, в которых мы имеем № записи, зависимой от кортежа. Получаем мы их по соответствующему ключу (ссылке-указателю на первую запись в подчиненном файле).
Структура записи подчиненного файла:
указатель на следующую запись, запись в цепочке подчиненных записей.
Пример создания файловой системы:
CREATE INDEX - создание индексированных файлов для первичного и вторичного ключа
CREATE INDEX <имя инд.> ON <имя отношения> (<имя атрибута> [<признак упорядочивания>],
имя инд. - уникальный идентификатор индекса в системе
имя атрибута - имя ключевого атрибута (первичный и вторичный ключ)
признак упорядочивания - упорядоченность по ключу.
В данное время большинство файловых систем непригодны для построения БД. Причины, которые не позволяют эффективно использовать файловую систему для создания информационной системы:
1. Системы управления файлами не поддерживают логически согласованный набор файлов.
2. Файловая система не обеспечивает интерпретации внутри содержимого файла.
3. Файловая система не способна к восстановлению файла после различного рода сбоев.
4. Файловая система не поддерживает режим многопользовательского доступа к информации.
Лекция 3. Реляционная модель. Часть 1.