* При перепечатке материалов ссылка на www.SeoLiga.ru обязательна!
Концепция хранилища данных
17 марта 2009
Определение понятия «хранилище данных» первым дал Уильям Инмон как «предметно-ориентированной, интегрированной, содержащей исторические данные, неразрушаемой совокупности данных, предназначенной для поддержки принятия управленческих решений». Информационное хранилище характеризуется четырьмя важными особенностями: • объектно-ориентированная база данных, в которой данные организованы в соответствии с их содержанием, а не прикладными программами; • цельность, связанная с преобразованием кодов блоков данных, полученных из различных баз данных; • этапность, определяющая сбор информации за определенный интервал времени; • защищенность, запрещающая изменять либо обновлять данные, помещенные в хранилище.
В основе концепции хранилища данных лежат две основные идеи: интеграция разъединенных детализированных данных (описывающих некоторые конкретные факты, свойства, события и т. д.) в едином хранилище и разделение наборов данных и приложений, используемых для обработки и анализа. Здесь процесс обработки данных разделяется на два этапа. Первый из них связан с обработкой транзакций в реальном времени (OLTP). В результате чего в базах данных накапливается первичная информация о функционировании предприятия либо организации. Например, банка. На втором этапе осуществляется аналитическая обработка в реальном времени (OLAP). Например, анализ снятия наличности со счетов, планирование объема оказываемых услуг, показатели эффективности работы служащих, отделений и всего банка. Технология OLAP обладает значительным числом преимуществ, к которым, в первую очередь, относятся: • многомерное представление данных, • высокая производительность, • динамическая обработка массивов, • гибкость средств генерации отчетов. При работе хранилища выполняются преобразования, обеспечивающие работу баз данных различных типов с разными форматами документов. В свою очередь хранилище используется для выполнения прикладных процессов. Информационное хранилище обслуживает запросы, анализирует результаты их выполнения и формирует отчеты. Оно также обеспечивает загрузку данных и периодическое удаление информации, утратившей актуальность.