Современное состояние информационных систем и динамика их развития

Современное состояние информационных систем и динамика их развития. Влияние научно- технического прогресса и развития мультимедийных технологий на эволюцию информационных систем маркетинга. Программные продукты в маркетинге. Национальные и международные базы данных и базы знаний

В разработках информационных систем прочные позиции заняли объектные технологии. Их использование в этой области продолжает расширяться. В значительной мере этому способствует создание развитой объектной инфраструктуры.

Большой вклад в ее формирование вносит консорциум OMG (Object Management Group), который вот уже почти полтора десятилетия ведет активную работу по созданию комплекса стандартов интероперабельных неоднородных распределенных объектных сред.

Существенный вклад в компонентные технологии внесла корпорация Microsoft, которая первой разработала компонентную объектную модель COM (Component Object Model) и ее распределенную версию DCOM (Distributed Component Model), ставшие основой ряда программных продуктов компании.

Важное значение имеет создание компанией Sun Microsystems и широкое распространение объектного языка программирования Java, а также основанного на этом языке комплекса средств компонентной разработки приложений из повторно используемых объектных компонентов — компонентная модель JavaBeans, архитектура Enterprise JavaBeans, а также технология Java 2 Enterprise Edition. Наряду с указанными общими элементами объектной инфраструктуры, независимыми от класса информационных систем, созданы также ее элементы, ориентированные на отдельные классы систем, — системы баз данных, Web, текстовые системы. Основой разработки коммерческих объектных СУБД стал стандарт объектных баз данных консорциума ODMG (Object Data Management Group).

Объектный подход нашел применение и в технологиях Web. Технология Java-аплетов обеспечивает мобильность программного обеспечения в среде Web с помощью Web-браузеров со встроенной виртуальной машиной Java (Java Virtual Machine, JVM). Консорциумом W3C был разработан стандарт DOM (Document Object Model), обеспечивающий объектное представление XML-документов — единицы информационных ресурсов в новой технологической платформе Web, основанной на языке XML. Языковые средства DOM используются как спецификации API для XML-ориентированных СУБД. Для работы с текстовыми информационными ресурсами объектные типы данных, поддерживаемые расширителями типов, используются в объектно-реляционных серверах DB2, Oracle, Informix.

Объектное направление в области информационных систем хорошо оснащено инструментальными средствами CASE, основанными на методах объектного анализа и проектирования и использующими стандартизованный консорциумом OMG язык UML (Unified Modeling Language) для представления метаданных. ''Интеграция неоднородных информационных ресурсов.'' Благодаря активным разработкам информационных систем многие организации стали обладателями коллекций информационных ресурсов разной природы, каждая из которых поддерживается собственными программными средствами, обеспечивающими для пользователя свой специфический интерфейс. Под интеграцией информационных ресурсов понимается обеспечение пользователям доступа к нескольким источникам информационных ресурсов в терминах единого материализованного или виртуального представления, исключающего избыточность информации на логическом или семантическом уровне.

Неоднородность информационных ресурсов может проявляться в различных аспектах, например:

* в различии парадигм моделирования данных (реляционная модель, объектная модель и т.п.);

* в многообразии сред представления ресурсов (текстовая, аудио и т.д.);

* в разной степени структурированности данных (структурированные, слабоструктурированные, неструктурированные);

* в различиях интерпретации их содержания, в различии программных систем, которые их поддерживают, и т.д.

Интеграция информационных ресурсов охватывает большой комплекс проблем, к числу которых относятся, в частности:

* разработка интегрирующих моделей данных;

* создание методов отображения моделей данных;

* создание архитектур систем интеграции;

* разработка адаптеров (Wrapper) - компонентов таких архитектур, обеспечивающих интероперабельность интегрируемых неоднородных информационных ресурсов;

* создание посредников (Mediator) - компонентов архитектур интеграции, обеспечивающих семантическую интеграцию информационных ресурсов;

* интеграция схем объединяемых баз данных;

* разработка языков описания онтологии;

* создание методов слияния онтологии и др.

Технологии интеграции неоднородных информационных ресурсов уже находят практическое применение. Некоторые относительно простые возможности интеграции обеспечиваются программными продуктами. Более сложные проблемы семантической интеграции пока еще являются предметом изучения многих исследовательских проектов.

Архитектура распределенных систем. Распределенные информационные системы стали в настоящее время обыденной реальностью. В многочисленных корпоративных информационных системах используются распределенные базы данных. Отработаны методы распределения данных и управления распределенными данными, архитектурные подходы, обеспечивающие масштабируемость систем, реализующие принципы многозвенной архитектуры «клиент-сервер», а также архитектуры промежуточного слоя.

Начинают применяться на практике мобильные архитектуры. Это относится как к системам баз данных, так и к приложениям Web.

Возрождается подход к построению распределенных систем, основанный на одноранговой архитектуре, при котором, в отличие от доминирующей сегодня в распределенных системах архитектуры «клиент-сервер», роли взаимодействующих сторон в сети не фиксируются. Они назначаются в зависимости от ситуации в сети, от загруженности ее узлов.

В связи с интенсивным развитием коммуникационных технологий активно развиваются мобильные информационные системы. Разработаны технические средства и программное обеспечение для их создания. Благодаря этому стали развиваться мобильные системы баз данных. Многие научные коллективы проводят исследования специфических особенностей таких систем, создают разнообразные их прототипы. Важным инструментом для разработки мобильного программного обеспечения стали технологии Java. Создан стандарт протокола беспроводного доступа приложений в Web (WirelessApplication Protocol, WAP), который уже поддерживается некоторыми моделями сотовых телефонов. На основе WAP и языка XML консорциум W3C разработал язык разметки для беспроводных коммуникаций WML (Wireless Markup Language).

''Поддержка метаданных.'' В разработках информационных систем больше внимания стали уделять метаданным. Здесь предпринимаются шаги в двух направлениях — стандартизация представления метаданных и обеспечение их поддержки в системе. В информационных системах используются разнообразные способы и средства представления метаданных (различного рода репозитории метаданных). Отсутствие унификации в этой области значительно осложняет решение проблем мобильности приложений, повторного использования и интеграции информационных ресурсов и информационных технологий, а также реинжиниринга информационных систем. Для преодоления указанных трудностей активно ведутся разработки стандартов метаданных, ориентированных на различные информационные технологии. В этой области уже существует ряд международных, национальных и индустриальных стандартов, определяющих представление метаданных и обмен метаданными в информационных системах. Некоторые из них уже приобрели статус стандартов де-факто. Ограничимся здесь упоминанием лишь наиболее значимых из них.

Вероятно, первым стандартом де-факто этой категории был язык описания данных CODASYL для баз данных сетевой структуры. Из более поздних стандартов следует назвать: стандарт языка запросов SQL для реляционных баз данных, содержащий определение так называемой информационной схемы — совокупности представлений схем реляционных баз данных; компонент стандарта объектных баз данных ODMG, описывающий интерфейсы репозитория объектных схем; международный стандарт IRDS (Information Resource Dictionary Systems), описывающий системы для создания и поддержки справочников информационных ресурсов организации.

Далее следует упомянуть разработанный консорциумом OMG стандарт CWM (Common Warehouse Metamodel) представления метаданных хранилищ данных , основанный на ранее созданном для более широких целей стандарте OIM (Open Information Model) консорциума MDC (Meta Data Coalition).

Новая технологическая платформа XML для Web также включает стандарты представления метаданных. Поддержка метаданных — это одно из важнейших нововведений Web, радикальным образом изменяющее технологии управления его информационными ресурсами. В то время как в технологиях баз данных поддержка метаданных была изначально необходимой, в Web первого поколения метаданные не поддерживались.

К числу стандартов метаданных Web относится подмножество языка XML, используемое для описания логической структуры XML-документов некоторого типа. Это описание называется DTD (Document Type Definition)-Кроме того, платформа XML включает стандарт XML Schema, предлагающий более развитые возможности для описания XML-документов. Стандарт RDF (Resource Definition Framework) определяет простой язь<к представления знаний для описания содержимого XML-документов. Наконец, разрабатываемый стандарт OWL (Ontology Web Language) определяет формальный язык описания онтологии, предназначенный для семантического Web.

Стандарт языка UML (Unified Modeling Language), обеспечивающий представление метаданных инструментов CASE для визуального объектного анализа и проектирования, разработан консорциумам OMG. Этот язык поддерживается во многих программных продуктах CASE. Консорциум OMG создал также стандарт XMI (XML Metadata Interchange) для обмена метаданными между инструментами CASE, использующими язык UML.

Следует упомянуть здесь также стандарт Дублинского ядра (Dublin Core, DC) — набора элементов метаданных для описания содержания Документов различной природы. Этот стандарт быстро приобрел популярность и нашел, в частности, широкое применение в среде Web .

Работы по развитию существующих и созданию новых стандартов представления метаданных для информационных систем продолжаются.

''Семантическая обработка информационных ресурсов.'' Ранее, еще в 70—80-е годы, предпринимались попытки создания систем, основанных на знаниях. Был выполнен ряд посвященных этим проблемам исследовательских проектов в Стэнфордском университете (США), в университете Торонто (Канада) и других крупных научных центрах. Были созданы различные исследовательские прототипы систем баз данных, поддерживающих семантические модели данных, а также информационно-поисковых систем, в которых в качестве языков запросов использовались естественные языки. Поисковые системы такого типа создавались и в нашей стране. В последние годы активно велись работы по семантическому текстовому поиску. Консорциум W3C и несколько крупных исследовательских центров в США и Европе развернули и активно проводят работы по созданию семантического Web. В то время как действующая реализация Web предусматривает интерпретацию информационных ресурсов человеком, семантический Web позволит создавать приложения с компьютерной их интерпретацией. Он будет располагать также средствами логического вывода.

''Управление потоками данных.'' Управление потоками данных — одно из новых формирующихся направлений в области информационных систем, связанное с обработкой данных сетевого трафика, данных, порождаемых различного рода датчиками, потоков сообщений электронной почты и т.п. Стали создаваться предназначенные для этой цели инструментальные средства, которые называют системами управления потоками данных (Data Stream Management System, DSMS) общего назначения. Возникло специфическое направление, связанное с потоками документов, в текстовых системах — фильтрация потоков.

Специфика этого класса информационных систем состоит в том, что, в отличие от систем баз данных и систем текстового поиска, они имеют дело не с базой данных или коллекцией документов, содержащейся в среде хранения информационных ресурсов системы, а с потоком транзитных ресурсов, которые нужно обрабатывать «на проходе». В связи с этим необходимо разрабатывать новые технологии для решения проблем, связанных с информационными ресурсами такой природы.

''Совместное использование информационных технологий.'' В последние годы стали появляться инструментальные средства и крупные информационные системы, в которых совместно используются различные информационные технологии из области баз данных, текстовых систем и Web. Так, создан ряд коммерческих СУБД, которые наряду с традиционными для технологий баз данных функциями управления данными предоставляют возможности текстового поиска. Простейшие возможности контекстного поиска обеспечивают популярные Web-браузеры. Поисковые машины Web используют реализованную в этой среде технологию доступа к информационным ресурсам вместе с технологиями текстового поиска. В новом классе СУБД, называемых XML-ориентированными, совместно используются технологии баз данных и технологии XML. В среде Web обеспечивается доступ к базам данных SQL по запросам пользователей. Создаются интегрированные системы, предусматривающие доступ к базам данных и к текстовым информационным ресурсам с использованием единого интерфейса. Одна из таких систем создана компанией IBM.

С середины 90-х годов во многих странах стали активно разрабатываться информационные системы нового класса, называемые электронными библиотеками. Одной из основных особенностей продвинутых систем такого рода является поддержка и обеспечение интеграции неоднородных информационных ресурсов. Поэтому настоятельной необходимостью в электронных библиотеках стало совместное использование различных информационных технологий — технологий баз данных, технологий текстового поиска, технологий Web.

''Рост масштабов информационных систем.'' Совершенствование технических возможностей средств вычислительной техники, развитие коммуникационных средств и технологий управления информационными ресурсами в последние годы привели к появлению более крупных информационных систем. Речь идет о масштабах систем не только относительно объема поддерживаемых информационных ресурсов, но и числа их пользователей. Появились системы очень больших баз данных, поддерживающие многие гигабайты и даже петабайты данных, системы текстового поиска с очень большими коллекциями документов. Объем информационных ресурсов Web в настоящее время исчисляется многими миллионами страниц. Корпоративные системы баз данных насчитывают тысячи пользователей. На порядок больше пользователей имеют некоторые информационные сервисы Web. Количество таких крупных систем продолжает расти.

''Глобализация информационных систем.'' Усиливается тенденция к глобализации информационных систем. Глобализация информационных систем имеет две стороны — обеспечение глобального доступа пользователей к системе и интеграция информационных ресурсов, распределенных в глобальной сети. Уникальной глобальной информационной системой является Web. В нем воплощаются обе указанные стороны глобализации информационных систем. Он обеспечивает глобальный доступ к явно представленным на Web-сайтах информационным ресурсам, а также к ресурсам «скрытого» Web. Вместе с тем на платформе Web создаются разнообразные приложения, обеспечивающие интеграцию распределенных в Web информационных ресурсов. Многочисленные глобальные системы создаются в настоящее время как приложения Web для электронного бизнеса, для поддержки научной кооперации различных коллективов ученых во многих областях знаний в международном и национальном масштабе, в библиотечном деле и в других сферах. Среда Web предоставляет для поддержки таких систем идеальные условия.

''Конвергенция технологий.'' Одна из важных тенденций в области информационных систем состоит в конвергенции различных пластов технологий информационных систем. Имеет место взаимопроникновение идей, заимствование подходов и техники из смежных областей информационных технологий.

Действительно, в системах текстового поиска используются заимствованные из технологий баз данных методы прямого доступа к информационным ресурсам на основе техники индексирования. Технологии Web используют методы текстового поиска, отработанные за долгие годы в специально предназначенных для этого системах текстового поиска. В технологической платформе XML, создаваемой для Web нового поколения, используются многие ключевые концепции и подходы к управлению данными, созданные в области баз данных, такие как модель данных, схема, многоуровневое представление данных, ограничения целостности данных и др. В свою очередь, в технологиях баз данных зарождается новый класс систем баз данных, предназначенных для поддержки коллекций XML-документов. Появились коммерческие XML-ориентированные СУБД.

''Развитие стандартов информационных технологий.'' Последнее десятилетие стало периодом интенсивной деятельности по стандартизации различных аспектов информационных технологий. Эта деятельность осуществляется не только силами официальных органов стандартизации, но и многочисленными специально для этих целей учрежденными индустриальными консорциумами.

Благодаря созданию стандартов в этой области обеспечивается переносимость приложений и информационных ресурсов между различными программно-аппаратными платформами, интероперабельность программных продуктов различных поставщиков и созданных на их основе приложений, повторное использование ресурсов, в частности метаданных и программных компонентов приложений. Появилась возможность измерения производительности различных систем на эталонных тестах и сравнительной оценки результатов измерений и т.д.

Создано немалое количество международных, национальных и индустриальных стандартов разного назначения, многие из которых стали уже стандартами де-факто. Стандарты реляционных и объектных баз данных, многочисленные стандарты Web, хранилищ данных, интероперабельных неоднородных распределенных объектных сред, стандарты геоданных, компонентных моделей и архитектур представляют лишь часть проведенной в этой области огромной работы.

еятельность по созданию и развитию стандартов информационных технологий активно продолжается.

''Автоматизированная разработка информационных систем.'' Крупное достижение технологий современных информационных систем состоит в создании методов их анализа и проектирования, которые в течение двух-трех десятилетий прошли испытания на практике. На их основе разработаны инструментальные средства CASE, которые поставляются многими компаниями — разработчиками программного обеспечения. Такие технологии широко применяются прежде всего для создания систем баз данных. Важное место в этой области принадлежит методам объектного анализа и проектирования. Консорциумом OMG создан стандарт унифицированного визуального языка моделирования UML, основанного на таких методах. Язык UML поддерживают в настоящее время многие программные продукты.

Разработчики Web-сайтов также располагают развитым инструментальным оснащением, которое существенно облегчает создание страниц Web со сложным дизайном, позволяет динамически генерировать страницы Web на основе содержимого баз данных по запросам пользователей, разрабатывать и отлаживать встраиваемые в страницы Web Java-скрипты и т.д.

Создатели систем текстового поиска имеют в своем распоряжении вспомогательные средства для автоматизированной разработки тезаурусов, словарей и т.д., для сканирования и ввода документов, автоматического их индексирования.

Важная тенденция в области информационных систем состоит в том, что повышается удельный вес систем, которые создаются с использованием тех или иных средств автоматизированной разработки.

Повышается культура проектирования и реализации крупных информационных систем, основанных на технологиях баз данных. Все большее признание специалистов получают стандарты системного проектирования, обеспечивающие эффективное управление жизненным циклом создаваемой системы, отсутствие упущений в процессе разработки, высокое ее качество.В условиях рыночной экономики уделяется серьезное внимание управлению проектами систем, не только технологическим, но и экономическим их аспектам. Для этого развиваются необходимые методы и создаются инструментальные средства.