Лекция 9. Файловая система хранения, поиска и обработки информации

 

 

Все программы и данные хранятся в долговременной (внешней) памяти компьютера в виде файлов.

Файл- это определенное количество информа­ции (программа или данные), имеющее имя и хра­нящееся в долговременной (внешней) памяти.

Имя файла.Имя файла состоит из двух частей, разделен­ных точкой: собственно имя файла и расширение, определя­ющее его тип (программа, данные и так далее). Собственно имя файлу дает пользователь, а тип файла обычно задается программой автоматически при его создании.

Таблица 1. Типы файлов и расширений

Тип файла Расширения
Программы exe, com
Текстовые файлы txt, doc
Графические файлы bmp, д1Т,]рдидр
Звуковые файлы wav, mid
Видеофайлы avi
Программы на языках программирования bas, pas и др

Файловая система.На каждом носителе информации (гиб­ком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске опре­деляется используемой файловой системой.

Каждый диск разбивается на две области: область хране­ния файлов и каталог. Каталог содержит имя файла и указание на начало его размещения на диске.

Для дисков с небольшим количеством файлов (до несколь­ких десятков) может использоваться одноуровневая файловая система, когда каталог (оглавление диска) представляет со­бой линейную последовательность имен файлов. Такой каталог можно сравнить с оглавлением детской книж­ки, которое содержит только названия отдельных рассказов.

Таблица 2.Одноуровневый каталог

Имя файла Номер начального сектора
Файл_1
Файл_2
…….  
Файл_112

Если на диске хранятся сотни и тысячи файлов, то для удобства поиска используется многоуровневая иерархиче­ская файловая система, которая имеет древовидную струк­туру.

Начальный, корневой каталог содержит вложенные ката­логи 1-го уровня, в свою очередь, каждый из последних мо­жет содержать вложенные каталоги 2-го уровня и так далее. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы.

Файловая система— это система хранения фай­лов и организации каталогов.

Путь к файлу.Путь к файлу вместе с именем файла называют иногда полным именем файла.

Операции над файлами.В процессе работы на компьюте­ре наиболее часто над файлами производятся следующие операции:

• копирование (копия файла помещается в другой ката­лог);

• перемещение (сам файл перемещается в другой каталог);

• удаление (запись о файле удаляется из каталога);

• переименование (изменяется имя файла).

Форматирование дисков.Для того чтобы на диске можно было хранить информацию, диск должен быть отформатиро­ван, то есть должна быть создана физическая и логическая структура диска.

Формирование физической структуры диска состоит в со­здании на диске концентрических дорожек, которые, в свою очередь, делятся на секторы. Для этого в процессе формати­рования магнитная головка дисковода расставляет в опреде­ленных местах диска метки дорожек и секторов.

После форматирова­ния гибкого диска 3,5" его параметры будут сле­дующими:

• информационная ем­кость сектора — 512 байтов;

• количество секторов на дорожке — 18;

• дорожек на одной сто­роне — 80;

• сторон — 2.

Логическая структура гибких дисков. Логическая струк­тура магнитного диска представляет собой совокупность секторов (емкостью 512 байтов), каждый из которых имеет свой порядковый номер (например, 100). Сектора нумеруют­ся в линейной последовательности от первого сектора нуле­вой дорожки до последнего сектора последней дорожки.

На гибком диске минимальным адресуемым элементом является сектор.

При записи файла на диск будет занято всегда целое ко­личество секторов, соответственно минимальный размер файла — это размер одного сектора, а максимальный соот­ветствует общему количеству секторов на диске.

Файл записывается в произвольные свободные сектора, которые могут находиться на различных дорожках. Напри­мер, Файл_1 объемом 2 Кбайта может занимать сектора 34, 35 и 47, 48, а Файл_2 объемом 1 Кбайт — сектора 36 и 49.

Таблица 3. Логическая структура гибкого диска формата 3,5" (2-я сторона)

№ дорожки № сектора
………………….
                                 

 

Для того чтобы можно было найти файл по его имени, на диске имеется каталог, представляющий собой базу данных.

Запись о файле содержит имя файла, адрес первого секто­ра, с которого начинается файл, объем файла, а также дату и время его создания.

Таблица 4. Структура записей в каталоге

Имя файла Адрес первого сектора Объем файла, Кбайт Дата создания Время создания
Файл 1 14 01 99 14 29
Файл 2 14 01 99 14 45

Полная информация о секторах, которые занимают фай­лы, содержится в таблице размещения файлов (FAT — File Allocation Table). Количество ячеек FAT соответствует коли­честву секторов на диске, а значениями ячеек являются це­почки размещения файлов, то есть последовательности ад­ресов секторов, в которых хранятся файлы.

Цепочка размещения для файла Файл_1 выглядит следую­щим образом: в начальном 34-м секторе хранится адрес 35, в 35-м секторе хранится адрес 47, в 47-м — 48, в 48-м — знак конца файла (К).

Для размещения каталога — базы данных и таблицы FAT на гибком диске отводятся секторы со 2 по 33. Первый сек­тор отводится для размещения загрузочной записи операци­онной системы. Сами файлы могут быть записаны, начиная с 34 сектора.

Виды форматирования. Существуют два различных вида форматирования дисков: полное и быстрое форматирование. Полное форматирование включает в себя как физическое форматирование (проверку качества магнитного покрытия дискеты и ее разметку на дорожки и секторы), так и логиче­ское форматирование (создание каталога и таблицы разме­щения файлов). После полного форматирования вся хранив­шаяся на диске информация будет уничтожена.

Быстрое форматирование производит лишь очистку кор­невого каталога и таблицы размещения файлов. Информа­ция, то есть сами файлы, сохраняется и в принципе возмож­но восстановление файловой системы.

Информационная емкость гибких дисков. Рассмотрим различие между емкостью неформатированного гибкого маг­нитного диска, его информационной емкостью после форма­тирования и информационной емкостью, доступной для за­писи данных.

Заявленная емкость неформатированного гибкого маг­нитного диска формата 3,5" составляет 1,44 Мбайт.

Рассчитаем общую информационную емкость отформати­рованного гибкого диска:

Количество секторов: N = 18 х 80 х 2 = 2880.

Информационная емкость:

512 байт х N = 1 474 560 байт = 1 440 Кбайт -= 1,40625 Мбайт.

Однако для записи данных доступно только 2847 секто­ров, то есть информационная емкость, доступная для записи данных, составляет:

512 байт х 2847 = 1 457 664 байт = 1423,5 Кбайт = 1,39 Мбайт.

Логическая структура жестких дисков. Логическая структура жестких дисков несколько отличается от логической структуры гибких дисков. Минимальным адресуемым элементом жесткого диска является кластер, который может включать в себя не­сколько секторов. Размер кластера зависит от типа использу­емой таблицы FAT и от емкости жесткого диска.

На жестком диске минимальным адресуемым элементом является кластер, который содержит не сколько секторов.

Таблица FAT16 может адресовать 216 — 65 536 кластеров. Для дисков большой емкости размер кластера оказывается слишком большим, так как информационная емкость жест­ких дисков может достигать 150 Гбайт.

Например, для диска объемом 40 Гбайт размер кластера будет равен:

40 Гбайт/65536 = 655 360 байт = 640 Кбайт.

Файлу всегда выделяется целое число кластеров. При размещении на жестком диске большого количества небольших по размеру файлов они будут занимать кластеры лишь частично, что при­ведет к большим потерям свободного дискового пространства.

Эта проблема частично решается с помощью использова­ния таблицы FAT32, в которой объем кластера принят рав­ным 8 секторам или 4 килобайтам для диска любого объема.

В целях более надежного сохранения информации о раз­мещении файлов на диске хранятся две идентичные копии таблицы FAT.

Преобразование FAT16 в FAT32 можно осуществить с по­мощью служебной программы Преобразование диска в FAT32, которая входит в состав Windows.

Мы рассмотрели файловую систему, имеющую название FAT, од­нако в последнее время все большую популярность приобретает фай­ловая система NTFS (New Technology File System - файловая система операционных систем семейства Windows NT), которая, в частности, используется в Windows NT и Windows ХР.

Максимальный размер раздела NTFS в данный момент ограничен лишь размерами «жестких» дисков. Как и любая другая система, NTFS делит все полезное место на кластеры — блоки данных, используемые единовременно. NTFS поддерживает почти любые размеры кластеров — от 512 байт до 64 Кбайт, неким стандартом же считается кластер раз­мером 4 Кбайт. Диск NTFS условно делится на две части. Первые 12 % диска отводятся под так называемую зону MFT (Master File Table). Это БД, представляющая собой общую файловую таблицу, строки которой соответствуют файлам тома NTFS, а столбцы - атрибутам файлов. Запись каких-либо других данных в эту область невозможна. Остальные 88 % диска является обычным пространством для хранения файлов.

Зона MFT поделена на записи фиксированного размера (обычно 1 Кбайт), и каждая запись соответствует какому-либо файлу (в общем смысле этого слова). Первые 16 файлов носят служебный характер и недоступны ОС — они называются метафайлами, причем самый первый метафайл - сам MFT. Эти первые 16 элементов MFT - един­ственная часть диска, имеющая фиксированное положение. Интересно, что вторая копия первых трех записей для надежности — они очень важны - хранится ровно посередине диска. Остальной MFT-файл может располагаться, как и любой другой файл, в произвольных местах диска — восстановить его положение можно с помощью его самого, «зацепившись» за самую основу первый элемент MFT.

Дефрагментация дисков.Замедление скорости обмена данными может происходить в результате фрагментации файлов. Фрагментация файлов (фрагменты файлов хранятся в различных, удаленных друг от друга кластерах) возраста­ет с течением времени, в процессе удаления одних файлов и записи других.

Так как на диске могут храниться сотни и тысячи файлов в сотнях тысяч кластеров, то фрагментированность файлов будет существенно замедлять доступ к ним (магнитным го­ловкам придется постоянно перемещаться с дорожки на до­рожку) и в конечном итоге приводить к преждевременному износу жесткого диска. Рекомендуется периодически прово­дить дефрагментацию диска, в процессе которой файлы за­писываются в кластеры, последовательно идущие друг за другом.