Данные», «информация», «знания» в ГИС

Основные компоненты ГИС

Тема 2. Основные компоненты ГИС. «Данные», «информация», «знания» в ГИС. Источники данных. Классификация ГИС.

Составляющими (компонентами) ГИС, исходя из определения являются:

· данные

· программное обеспечение

· аппаратное обеспечение

· персонал

· методологический аппарат

Рассмотрим каждый компонент подробнее.

Вспомним определение ГИС :

Географическая информационная система (ГИС) - это информационная система, обеспечивающая сбор, хранение, обработку, анализ и отображение пространственных данных и связанных с ними непространственных, а также получение на их основе информации и знаний о географическом пространстве.

Прежде всего, обратимся к базовым категориям – данным, информации и знаниям, - которые были использованы при определении ГИС.

Под данными понимается совокупность фактов, известных об объектах, либо результаты измерения этих объектов. Данные, используемые в ГИС, отличаются высокой степенью формализации. Данные - это как бы строительный элемент в процессе создания информации, поскольку она получается в процессе обработки данных.

Выделяют следующие типы данных:

· числовые - число

· логические - «да»-«нет»

· текстовые– текст произвольный или из заданного набора терминов (например, словаря).

Информация - это совокупность сведений (данных), которая воспринимается из окружающей среды (входная информация), выдается в окружающую среду (исходная информация) или сохраняется внутри определенной системы. Информация существует в виде документов, чертежей, рисунков, текстов, звуковых и световых сигналов, электрических и нервных импульсов и т.п. Данные являются составной частью информации, представляющие собой зарегистрированные сигналы. Применительно к ГИС под информацией понимается совокупность сведений, определяющих меру наших знаний об объекте. Во всех случаях для характеристики объекта используется :

1. пространственное положение.

2. описание специфических свойств в данной точке или области пространства (на определенный момент времени).

В соответствии с этим любая ГИС работает с 2 основными типами информации:

1. Пространственныеили метрические (пространственные, географические, координатные) данные, т.е. это данные, указывающие на локализацию объекта в пространстве. Представляются с помощью следующих графических объектов: точки, линии, области и поверхности. Описание объектов осуществляется путем указания координат объектов и составляющих их частей.

В русскоязычной терминологии "пространственным данным" соответствуют два разных понятия [Геоинформатика.., 1999; Кошкарев, 2006]. Первое, относящееся к предметной области геоинформатики, - это все пространственные данные об объектах реальности в широком смысле слова, включающие цифровые изображения, цифровые карты, каталоги координат пунктов опорной геодезической сети и т.п. Второе связано с информационным обеспечением ГИС - это цифровые данные об объектах реальности (местности, территории и т.п.). В качестве синонимов термина "пространственные данные" в обоих значениях употребляют термины "географические данные" и "геопространственные данные". Мы будем использовать следующее определение: «Пространственные данные – сведения, которые характеризуют местоположение объектов в пространстве относительно друг друга и их геометрию», что является комбинацией первого и второго. Пространственные объекты представляют с помощью следующих графических объектов: точки, линии, области и поверхности. Описание объектов осуществляется путем указания координат объектов и составляющих их частей.

Точечные объекты – это такие объекты, каждый из которых расположен только в одной точке пространства, представленной парой координат X, Y (например, дерево).

Линейные объекты, представлены как одномерные, имеющие одну размерность – длину, ширина объекта не выражается в данном масштабе или не существенна. Примеры таких объектов: реки, границы муниципальных округов, горизонтали рельефа.

Области (полигоны) – площадные объекты, представляются набором пар координат (Х, У) или набором объектов типа линия, представляющих собой замкнутый контур. (например, территории, занимаемые определенным ландшафтом, городом или целым континентом).

Поверхность - при ее описании требуется добавление к площадным объектам каких-либо значений. Восстановление поверхностей осуществляется с помощью использования математических алгоритмов (интерполяции и аппроксимации) по исходному набору координат X, Y, Z.

2. Атрибутивныеили семантические (в пер. с греческого «обозначающий») данные - тематические, атрибутивные данные. Они представляются в виде описательной информации об определенных пространственных объектах и их временных параметрах. Примеры таких данных: географическое название, видовой состав растительности, характеристики почв и т.п.

Объекты реального мира отличаются пространственными, временными и тематическими характеристиками.

Пространственные характеристики определяют положение объекта в заранее определенной системе координат, основное требование к таким данным – точность.

Временные характеристики фиксируют время исследования объекта и важны для оценки изменений свойств объекта с течением времени. Основное требование к таким данным – актуальность, что означает возможность их использования для обработки, неактуальные данные – это устаревшие данные.

Тематические характеристики описывают разные свойства объекта, включая экономические, статистические, технические и другие свойства, основное требование – полнота.

Природа пространственных и атрибутивных данных различна, соответственно различны и методы манипулирования (хранения, ввода, редактирования, поиска и анализа) для двух этих составляющих геоинформационной системы. Одна из основных идей, воплощенных в традиционных ГИС - это сохранение связи между пространственными и атрибутивными данными, при раздельном их хранении и, частично, раздельной обработке.

Однородные семантические (атрибутивные) данные в ГИС формируют слой данных (другие термины – оверлей (over lay), покрытие, тема). От слов over lay, говорят, что ГИС имеют оверлейную, или послойную структуру данных. Комбинируя слои и их последовательность (верхние, нижние) мы можем получать различные тематические карты. Многослойная организация карты позволяет упростить анализ картографической информации, делать тематические или пространственные выборки, проводить анализ. В результате анализа слоев, отображающих “сырые” данные об объектах строятся новые слои в соответствии с задачей исследования. Многослойная организация электронной карты, при наличии гибкого механизма управления слоями, позволяет объединить и отобразить гораздо большее количество информации, чем на обычной карте. Данные о пространственном положении (географические данные) и связанные с ними табличные, могут подготавливаться самим пользователем либо приобретаться.

В таком контексте знания можно рассматривать как результат интерпретации информации. Наиболее общее определение: знание – результат познания действительности, получивший подтверждение в практике. Научное знание отличается своей систематичностью, обоснованностью и высокой степенью структуризации. Информационные системы можно рассматривать как эффективный инструмент получения знаний.