Лекции по Автоматизированным информационным системам и СУБД - файл n2.doc

Лекции по Автоматизированным информационным системам и СУБД
Скачать все файлы (185.4 kb.)

Доступные файлы (6):
n1.doc68kb.08.04.2010 00:12скачать
n2.doc86kb.08.04.2010 00:28скачать
n3.doc89kb.08.04.2010 01:28скачать
n4.doc143kb.08.04.2010 01:28скачать
n5.doc184kb.08.04.2010 10:42скачать
n6.doc73kb.08.04.2010 11:15скачать

n2.doc


Лекции по курсу «Автоматизированные информационные системы и СУБД»

ЛЕКЦИЯ 2

ФУНКЦИИ ИНФОРМАЦИОННЫХ СИСТЕМ


Рассмотрим функции, которые должны выполнять информационные системы для решения стоящих перед ними задач, связанных с поддержкой динамической информационной модели предметной области и с удовлетворением информационных потребностей ее пользователей.

К числу этих функций относятся сбор и регистрации информационных ресурсов, их хранение, обработка, актуализация, обеспечивающая актуализацию поддерживаемой информационной модели предметной области (для простоты здесь рассматривается только статическая часть модели), а также обработка запросов пользователей.

Сбор и регистрация информационных ресурсов


Эти функции обеспечивают «фотографирование» предметной области, формирование и поддержку на этой основе модели предметной области.

Для выполнения этих функций проводятся работы как вне программно-аппаратного комплекса системы, так и непосредственно в его среде. Способы реализации указанных функций зависят от характера используемых источников информации, в качестве которых могут служить: сущности и процессы в предметной области системы, различного рода автоматизированные технические системы, другие информационные системы, всевозможные данные на бумажных или электронных носителях и т.п.

Функции сбора и регистрации информационных ресурсов могут совмещаться во времени или выполняться последовательно. Возможны различные варианты их осуществления, например:

  1. путем измерений (наблюдений) фактов в реальном мире и ввода данных в систему вручную с помощью клавиатуры и/или каких-либо манипуляторов;

  2. полуавтоматически путем ввода в компьютер с некоторых носителей и в случае необходимости их оцифровки (например, при использовании текстов на бумажных носителях или аналоговых аудиозаписей);

  3. автоматически с помощью различного рода датчиков или обмена данными с другими автоматизированными системами.

С этими функциями механизмов информационных систем и их персонала связана необходимость решения ряда сопутствующих задач, таких как очистка, верификация, сжатие данных, конвертирование их из одного формата в другой и т.д.

Очистка данных ─ необходимая стадия предварительной обработки данных и подготовки их к загрузке в систему, особенно в случаях, когда используется несколько источников данных. Обычно она включает процедуры фильтрации данных, верификации, обеспечения логической целостности, устранения несогласованности, избыточности и различных ошибок, восполнения пропусков, а также другие процедуры, направленные на улучшение качества данных. Задачи перечисленных процедур в некоторой мере пересекаются.

В результате фильтрации производится отбор нужных данных из множества имеющихся в распоряжении. Верификация данных обеспечивает достоверность и логическую целостность данных. Проверка достоверности данных ─ это содержательная процедура, которая позволяет установить, адекватно ли характеризуют состояние предметной области собранные для ввода в информационную систему информационные ресурсы. Эта процедура, к сожалению, не может быть в полной мере формализована. Поэтому она в значительной мере возлагается на системный персонал и привлекаемых к этой работе экспертов. В системах баз данных за достоверность данных ответственен администратор данных. Проверка логической целостности данных может осуществляться на стадии предварительной их обработки, а также непосредственно при вводе в систему. Для этих целей в системах баз данных могут, в частности, использоваться механизмы СУБД, специально предназначенные для проверки ограничений целостности, которые были объявлены в схеме базы данных. Такая проверка осуществляется при обновлении состояния базы данных. Проверку целостности XML-документов может выполнять Web-браузер при условии, если для этого документа задано описание типа документов. Выбор конкретных методов обеспечения верификации данных зависит от характера их источников, качества данных, видов ограничений целостности и т.п.

В некоторых информационных системах информационные ресурсы хранятся в сжатом виде. Сжатие данных осуществляется с целью минимизации ресурсов памяти, необходимых для их хранения, а также для снижения затрат на передачу данных по коммуникационным каналам. Такой подход часто используется в различных репозиториях информационных ресурсов с файловой организацией среды хранения. Механизмы среды хранения данных некоторых СУБД включают встроенные средства, обеспечивающие сжатие отдельных значений данных, кортежей, доменов значений атрибутов и т.д., сжатие индексных файлов, резервных копий базы данных. Для рационального использования ресурсов памяти в некоторых классах систем, например в системах управления документами, документы подразделяются на активные и архивные. Хранение архивных документов осуществляется в сжатых форматах.

Конвертирование данных при вводе в систему используется для преобразования данных из одного формата в другой, допускающий автоматизированный импорт их в информационную систему. Конвертирование данных часто необходимо в случаях, когда источником данных является некоторая другая система.

Хранение информационных ресурсов


Эта функция информационных систем связана с необходимостью управления двумя видами ресурсов ─ ресурсами хранимых данных и ресурсами памяти. Требования к этим функциям различаются в разных классах информационных систем. Рассмотрим, каким же образом организованы хранение информационных ресурсов и доступ к ним в наиболее распространенных классах информационных систем.

В системах текстового поиска каждый документ хранится обычно в отдельном файле. Доступ к документам осуществляется с помощью структур данных, называемых индексами. Индексы в системах текстового поиска позволяют определять адрес размещения нужного файла по так называемым индексирующим свойствам хранящегося в нем документа ─ по значениям каких-либо атрибутов, ассоциированных с документом, по содержащимся в нем словам или словосочетаниям и т.п. При этом единицей доступа является полный документ. Управление памятью осуществляется в таких системах средствами компонента операционной системы компьютера, называемого файловой системой или системой управления файлами. Индексы документов в системах текстового поиска организуются в виде так называемых инвертированных списков. Для каждого значения индексирующего свойства документов в таких индексах поддерживаются адреса или идентификаторы файлов, их содержащих.

Файловая организация хранения информационных ресурсов используется также в действующей версии Web, основанной на технологиях HTML. Здесь каждая HTML-страница представлена в общем случае в виде совокупности файлов. Главный из них ─ это основной структурообразующий файл данной страницы. Он имеет формат HTML. Кроме того, в отдельных файлах представлены встроенные изображения и другие компоненты страницы, на которые имеются ссылки в ее главном файле. Доступ к страницам Web осуществляется непосредственно по их уникальным «адресам» в Web, называемым URL, либо с использованием навигации по гиперссылкам. Единицей доступа здесь является полная страница Web, хотя при навигации очередная гиперссылка может указывать только на фрагмент страницы. Функции управления ресурсами памяти, служащими для хранения ресурсов Web, возлагаются на операционные системы тех компьютеров сети, которые содержат используемые страницы.

Нужно заметить, что в связи с интенсивным ростом объемов информационных ресурсов Web навигационный доступ к требуемым ресурсам стал неэффективным. Пользователям Web обычно известно лишь ограниченное количество URL интересующих их страниц Web. Поэтому он в сравнительно небольшом числе случаев может воспользоваться прямым доступом к информационным ресурсам Web.

Вот почему стали создаваться приложения Web, называемые поисковыми машинами. Поисковая машина с некоторой периодичностью просматривает страницы закрепленной за ней группы Web-сайтов и строит либо актуализирует полнотекстовые индексы для этих страниц. На этой основе осуществляется обработка пользовательских запросов так, как это делается в системах текстового поиска.

Более тонкую организацию имеют механизмы управления хранением данных и пространством памяти в информационных системах, основанных на технологиях баз данных. Причины заключаются в том, что в системах баз данных используются более сложные структуры данных, требуется значительно более мелкая гранулярность доступа к ресурсам, более динамичный характер имеют хранимые данные.

Управление хранимыми данными в системах баз данных включает поддержку структуры хранимых данных, их размещение в пространстве памяти, поддержку физической целостности и обеспечение эффективного доступа к ним. Чаще всего используются прямой и последовательный доступ к единицам информационных ресурсов в каком-либо определенном порядке.

Прямой доступ осуществляется по известным значениям некоторых свойств (ключей) единиц информационных ресурсов. Для этой цели используются вспомогательные хранимые структуры данных, обеспечивающие отображение ключей в адреса размещения соответствующих единиц информационных ресурсов, например строк таблиц в реляционных базах данных.

Чаще всего в качестве таких вспомогательных структур используются эффективно организованные индексы и хеш-таблицы.

Индексные структуры, организованные в виде деревьев специальных видов, обеспечивают быстрый поиск с помощью навигации в этих деревьях по коротким цепочкам указателей и, возможно, ограниченного перебора. Существует большое многообразие способов построения индексов.

Хеш-таблицы, в отличие от индексов, обеспечивают определение адреса размещения искомой (или размещаемой) единицы информационных ресурсов не путем навигации в индексной структуре, а с помощью вычисления некоторой функции отображения ключа в адрес. Значения этой функции представляют собой случайные числа, равномерно распределенные в заданном интервале, которые используются как номера участков во внешней памяти или строк таблицы хеширования, содержащих соответствующие единицы информационных ресурсов или их адреса.

Индексные структуры поддерживают доступ к хранимым единицам информационных ресурсов в порядке соответствующих им ключей. Простая техника хеширования таких возможностей не предоставляет. Для этих целей применяют усовершенствованные методы хеширования.

Последовательный доступ к хранимым единицам информационных ресурсов осуществляется в порядке их физического размещения либо по значениям некоторых содержащихся в них или ассоциированных с ними идентификаторов (ключей). В последнем случае для поддержки необходимой упорядоченности обычно используют индексы по заданным ключам.

Нужно заметить, что в унаследованных СУБД, основанных на графовых моделях данных, использовался также и навигационный доступ к хранимым данным.

Управление ресурсами памяти в СУБД включает такие операции, как учет свободного пространства памяти, выделение пространства для размещения новых вводимых в систему информационных ресурсов, так называемая сборка мусора ─ возвращение освободившегося пространства памяти в пул свободного пространства для повторного его использования. Нужно назвать здесь также операцию реорганизации среды хранения базы данных. В результате выполнения этой операции изменяется размещение хранимых данных в пространстве памяти системы таким образом, чтобы стало возможным более эффективное использование ресурсов свободной памяти, а также чтобы сократить время доступа к часто используемым хранимым данным и т.п.

Важно заметить, что способы размещения информационных ресурсов в пространстве памяти системы и способы доступа к ним тесно связаны.

Среда хранения в системах баз данных также базируется на файловой организации. Однако над файловой системой надстраиваются механизмы, обеспечивающие более тонкие методы управления данными в терминах элементов содержания файлов. Единицей доступа здесь является, как уже отмечалось, не файл или порция файла, предусмотренная в файловой системе, а порции информационных ресурсов с гораздо более мелкой гранулярностью.

Актуализация информационных ресурсов


В соответствии с приведенным выше определением назначение информационной системы состоит в поддержке динамической информационной модели ее предметной области. Для того чтобы эта модель была практически полезной, необходимо своевременно и адекватно отображать в ней изменения состояния предметной области. Требуется актуализировать модель. Для этой цели нужно актуализировать информационные ресурсы системы.

Актуализация информационных ресурсов системы заключается в приведении их в соответствие текущему состоянию предметной области системы. В реляционных системах баз данных эта задача сводится к включению и/или удалению строк в таблицах базы данных, обновлению значений столбцов в некоторых строках. В случаях, когда изменяется структура предметной области системы, актуализация информационных ресурсов заключается в изменении схемы базы данных ─ добавлении или удалении столбцов таблиц, существующих в базе данных, к созданию новых и/или удалению существующих таблиц и т.д.

В системах текстового поиска актуализация информационных ресурсов чаще всего осуществляется путем ввода в систему новых или (реже) удаления существующих документов.

При актуализации Web-сайта в состав его ресурсов включаются новые или удаляются существующие страницы, модифицируются гиперссылки, связывающие страницы данного сайта и, возможно, страницы других сайтов, редактируется содержание существующих страниц.

Из приведенных примеров нетрудно видеть, что характер изменений, происходящих в предметной области и моделируемых в информационной системе, может быть различным. В одних случаях изменяются значения свойств принадлежащих ей сущностей и связей. В более сложных случаях изменяются структура предметной области и/или ее поведенческие свойства. Соответственно, разную природу имеют и процессы актуализации информационных ресурсов. Так, в системах баз данных в случаях первого рода изменяются значения данных, а при изменениях структуры предметной области изменяется схема базы данных.

Актуализация информационных ресурсов в информационных системах производится дискретно, через определенные интервалы времени. Поэтому адекватность состояния модели предметной области и ее состояния в реальности обеспечивается с временным лагом, величина которого равна продолжительности указанных интервалов. Величина лага может изменяться для разных систем в довольно широком диапазоне времени и зависит от назначения системы и особенностей ее предметной области. В информационных системах, входящих в состав систем управления сложными техническими объектами, например в системе управления космическими полетами, лаг измеряется в миллисекундах. В корпоративных информационных системах он может составлять минуты и часы. В некоторых исследовательских экономических системах возможен лаг, составляющий дни, месяцы, кварталы и годы.

Для того чтобы информационная система соответствовала своему назначению, важно соблюдать установленный для нее регламент актуализации информационных ресурсов.

Обработка информационных ресурсов


Некоторые информационные системы способны предоставлять пользователям только информационные ресурсы, ранее введенные в систему и хранящиеся в ней без какой-либо трансформации. Такая ситуация чаще всего встречается в системах текстового поиска, которые выдают пользователю документы, удовлетворяющие условиям запроса. В то же время системы баз данных способны продуцировать данные, производные от ранее введенных в систему и хранимых в базе данных. Достаточно упомянуть весьма развитое средство, предусмотренное для этих целей в реляционных СУБД, ─ механизм поддержки представлений данных. Продуцирование производных данных обеспечивается также в Web-сайтах с динамической генерацией страниц. Существуют текстовые информационные системы, позволяющие генерировать для хранимых документов их рефераты.

Возможность обработки информационных ресурсов, поддерживаемых в информационных системах, предусмотрена в приведенном ранее определении информационной системы. Она предусматривается и в отечественном стандарте терминологии по автоматизированным системам. При этом характер и содержание обеспечиваемой информационными системами обработки представленных в них информационных ресурсов не уточняется и не регламентируется для того, чтобы определение имело достаточно общий характер и позволяло бы охватить представительное множество систем.

Однако побочным эффектом такой общности определения является отнесение к этой категории многочисленных систем обработки данных, обладающих «памятью» и имеющих некоторое достаточно четко выраженное прикладное функциональное назначение, выходящее за рамки непосредственного назначения информационных систем. Существуют информационные системы, не только самостоятельно функционирующие, но и входящие в качестве функционального компонента в различные более сложные системы. Примерами могут служить системы управления крупными компаниями, которые решают большие комплексы задач, связанных с обеспечением жизнедеятельности компаний. Такие системы используют информационную систему как составную часть. Но вместе с тем они включают и крупные функциональные компоненты, использующие информационные ресурсы информационной системы для решения специфических задач системы ─ бухгалтерский учет, обработка заказов, управление запасами, планирование производства и т.п. Квалификация этих систем как корпоративных информационных систем представляется неубедительной. Фактически мы имеем здесь дело с объединением информационной системы и ее приложения. Такую объединенную систему за рубежом принято называть управленческой информационной системой.

Нужно заметить, что обработка информационных ресурсов в информационных системах не сводится лишь к продуцированию производной информации. Обработка осуществляется и для выполнения ряда системных функций, например для проверки ограничений целостности, для поиска в индексах, словарях и т.п.

Предоставление информационных ресурсов пользователям


Поддержка в информационной системе информационных ресурсов, позволяющих моделировать состояние и поведение предметной области, конечно же, не является самоцелью. Это делается для удовлетворения информационных потребностей пользователей.

Предоставление информационных ресурсов пользователям информационной системы может осуществляться с помощью pull-технологий и/или push-технологий.

В первом случае предполагается, что инициатором предоставления информационных ресурсов является пользователь, а во втором ─ сама система, в соответствии с определенным регламентом и для определенного круга пользователей.

Для предоставления информационных ресурсов по инициативе пользователя в информационной системе предусматриваются пользовательские интерфейсы ─ средства взаимодействия пользователей с системой. Характер пользовательских интерфейсов и их функции зависят от категории пользователей системы.

Пользовательский интерфейс в общем случае включает интерфейсные технические средства, язык или языки интерфейса, программные средства, поддерживающие функционирование интерфейсного оборудования и языков интерфейса.

Предполагается, что существует две категории пользователей информационных систем:

  1. конечные пользователи ─ специалисты в предметной области системы, обычно осуществляющие доступ к ее информационным ресурсам в интерактивном режиме;

  2. прикладные программы, использующие информационные ресурсы данной системы и являющиеся компонентами какого-либо ее приложения.

Технические средства интерфейса конечного пользователя могут включать периферийное оборудование ввода-вывода компьютера (клавиатура, мышь или другие манипуляторы, средства виртуальной реальности), монитор и другие средства воспроизведения информации, а также иные устройства. Программы, обеспечивающие их функционирование, входят в состав операционной системы или разрабатываются специально поставщиком соответствующего оборудования. Это могут быть, например, драйверы для устройств такого рода.

Технические средства интерфейса пользователей ─ компонентов прикладного программного обеспечения ─ могут включать коммуникационные ресурсы данной информационной системы, обеспечивающие телекоммуникационный доступ к ней.

В простейшем случае информационные потребности конечных пользователей регламентированы, известен их перечень. Иногда они зависят от каких-либо параметров, например даты, названия продукта, фамилии покупателя. Таких пользователей способен удовлетворить так называемый «кнопочный» интерфейс. Каждому виду запросов в таком интерфейсе соответствует некоторая клавиша клавиатуры или альтернатива показываемого на экране меню. Нажатие соответствующей клавиши или выбор нужной альтернативы в меню приводит к выдаче пользователю интересующих его информационных ресурсов.

В большинстве случаев, однако, информационные потребности конечных пользователей имеют нерегламентированный характер. Поэтому интерфейс конечного пользователя в системе с такими возможностями должен включать какой-либо язык запросов.

Для взаимодействия конечных пользователей с информационной системой с помощью языков запросов служат два вида пользовательских интерфейсов:

В первом случае для ввода сообщений и команд в систему служит язык запросов, имеющий свой алфавит и синтаксические правила для конструирования из его символов правильных команд или операторов. В качестве языков запросов используются естественные и искусственные языки.

Естественные языки запросов обычно используются в системах текстового поиска и в поисковых машинах действующей версии Web. Некоторые такие системы имеют мультиязыковой интерфейс ─ запросы могут формулироваться на одном из естественных языков из заданного набора.

Искусственные языки запросов применяются в системах, основанных на технологиях баз данных, а также в Web нового поколения и его приложениях. В настоящее время, как правило, используются непроцедурные декларативные языки запросов.

Языки четвертого поколения не являются языками в привычном смысле. Это пользовательские интерфейсы, которые обеспечивают ввод в систему сообщений с помощью выбора подходящих альтернатив в меню, ввода параметров через окна экранных форм, применения различных возможностей графического пользовательского интерфейса. Термин «язык четвертого поколения» был предложен американским специалистом по системам обработки данных Джеймсом Мартином (James Martin).

Пользователи системы ─ компоненты прикладного программного обеспечения ─ осуществляют доступ к ресурсам данной системы с помощью интерфейсов прикладного программирования (API). Средства таких интерфейсов можно применять только в программах, создаваемых с помощью систем программирования, на которые эти интерфейсы рассчитаны.

Доступ пользователей к ресурсам системы возможен только в пределах предоставленных им полномочий, которые обычно проверяются системными механизмами при попытках доступа. Наделение пользователей необходимыми полномочиями ─ функция системного администратора. Некоторые системы предоставляют свободный доступ к определенным ресурсам. Так, например, обстоит дело со многими Web-сайтами.

Рассмотрим теперь случай использования push-технологии для предоставления информационных ресурсов пользователям. Такая технология широко применяется в последние годы для распространения различного рода информации среди пользователей Internet. С этой целью стандартное сообщение рассылается по списку рассылки всем пользователям, в нем зарегистрированным. По этому принципу функционируют многочисленные телеконференции в Internet. Таким же образом организовано информирование пользователей некоторых электронных библиотек о поступлении новых документов в библиотеку. Однако, к сожалению, регистрация в списке рассылки осуществляется не всегда с учетом согласия пользователя. Одним из прибыльных сфер бизнеса в Internet стало коллекционирование действующих адресов пользователей сети. Базы данных, содержащие миллионы адресов, поставляются всем желающим за скромную плату. Такие базы данных охотно приобретаются недобросовестными рекламными службами коммерческих компаний, которые используют их для бездумной рассылки своей рекламы. Это привело к огромному росту трафика в Internet, к резкому снижению удельного веса полезной информации в потоках передаваемых в Internet сообщений.

В лекции были рассмотрены основные функции информационной системы, видимые пользователю. Однако они не исчерпывают всех существенных ее функций. Ряд из них возлагается на персонал системы и на ее программное обеспечение. К ним, в частности, относятся:

Вопросы для самопроверки

Учебный текст
© perviydoc.ru
При копировании укажите ссылку.
обратиться к администрации