Базы данных и управление ими

Форматы данных

Форматы данных определяют способ хранения информации на жестком диске, а также механизм ее обработки. Модели данных и форматы данных определенным способом взаимосвязаны.

Существует большое количество форматов данных. Можно отметить, что во многих ГИС поддерживаются основные форматы хранения растровых данных (TIFF, JPEG, GIF, BMP, WMF, PCX), а также GeoSpot, GeoTIFF, позволяющие передавать информацию о привязке растрового изображения к реальным географическим координатам, и MrSID - для сжатия информации. Наиболее распространенным среди векторных форматов является - DXF.

Все системы поддерживают обмен пространственной информацией (экспорт и импорт) со многими ГИС и САПР через основные обменные форматы: SHP, E00, GEN (ESRI), VEC (IDRISI), MIF (MapInfo Corp.), DWG, DXF (Autodesk), WMF (Microsoft), DGN (Bentley). Только некоторые, в основном отечественные системы, поддерживают российские обменные форматы – F1M (Роскартография), SXF (Военно-топографическая служба).

Довольно часто для эффективной реализации одних компьютерных операций предпочитают векторный формат, а для других растровый. Поэтому, в некоторых системах реализуются возможности манипулирования данными в том и в другом формате, и функции преобразования векторного в растровый, и наоборот, растрового в векторный форматы.

Совокупность цифровых данных о пространственных объектах образует множество пространственных данных и составляет содержание баз данных.

База данных (БД) – совокупность данных организованных по определенным правилам, устанавливающим общие принципы описания, хранения и манипулирования данными

Создание БД и обращение к ней (по запросам) осуществляется с помощью системы управления базами данных (СУБД).

Логическая структура элементов базы данных определяется выбранной моделью БД. Наиболее распространенными моделями БД являются иерархические, сетевые и реляционные и объектно-ориентированные.

Иерархические модели представляют древовидную структуру, в этом случае каждая запись связана только с одной записью, находящейся на более высоком уровне.

Такая система хорошо иллюстрируется системой классификации растений и животных. Примером может также служить структура хранения информации на дисках ПК. Главное понятие такой модели уровень. Количество уровней и их состав зависит от принятой при создании БД классификации. Доступ к любой из этих записей осуществляется путем прохода по строго определенной цепочке узлов. При такой структуре легко осуществлять поиск нужных данных, но если изначально описание неполное, или не предусмотрен какой либо критерий поиска, то он становится невозможным. Для достаточно простых задач такая система эффективна, но она практически непригодна для использования в сложных системах с оперативной обработкой запросов.

Сетевые модели были призваны устранить некоторые из недостатков иерархических моделей. В сетевой модели каждая запись в каждом узле сети может быть связана с несколькими другими узлами. Записи, входящие в состав сетевой структуры, содержат в себе указатели, определяющие местоположение других записей, связанных с ними. Такая модель позволяет ускорить доступ к данным, но изменение структуры базы требует значительных усилий и времени.

Реляционные модели собирают данные в унифицированные таблицы. Таблице присваивается уникальное имя внутри БД. Каждый столбец - это поле, имеющее имя, соответствующее содержащемуся в нем атрибуту. Каждая строка в таблице соответствует записи в файле. Одно и тоже поле может присутствовать в нескольких таблицах. Так как строки в таблице не упорядочены, то определяется один или несколько столбцов, значения которых однозначно идентифицируют каждую строку. Такой столбец называется первичным ключом. Взаимосвязь таблиц поддерживается внешними ключами. Манипулирование данными осуществляется при помощи операций, порождающих таблицы. Пользователь может легко заносить в базу новые данные, комбинировать таблицы, выбирая отдельные поля и записи, и формировать новые таблицы для отображения на экране.

Объектно-ориентированные модели применяют, если геометрия определенного объекта способна охватывать несколько слоев, атрибуты таких объектов могут наследоваться, для их обработки применяют специфические методы.

Для обработки данных, размещенных в таблицах необходимы дополнительные сведения о данных, их называют метаданными.

Метаданные - данные о данных: каталоги, справочники, реестры и иные формы описания наборов цифровых данных.