Основні відмінності систем оброблення транзакцій (oltp) і аналітичних систем 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Основні відмінності систем оброблення транзакцій (oltp) і аналітичних систем

Поиск

Операційні дані

Дані СППР

Структура даних

стандартизована

інтегрована

Діапазон часу

поточні

історичні (накопичувані)

Підсумовування

не здійснюється

розширюване в системах

Мінливість даних

змінюються

довготермінові

Вимірність даних

одновимірні

багатовимірні

Метадані

бажані

обов’язкові й імпортовані

Структури даних. Розглянемо діапазон і суть відмінностей операційних даних і даних ОДСППР за форматом і структурою. Почнемо з операційних даних, які часто упорядковуються системою керування реляційної бази даних. Реляційні системи оброблення запитів (транзакційні системи) мають структури даних, які називаються таблицями, що повинні бути надзвичайно нормалізованими. Таблиці нормалізують, щоб уникнути аномалій у даних, коли виконуються, наприклад, такі операції як оновлення, додавання чи вилучення записів. Нормалізація є процесом переведення складної структури даних у найпростішу, найстійкішу структуру. За нормалізації вилучаються зайві атрибути, ключі й відношення у концептуальній моделі даних.

За зберігання операційних даних або даних транзакційних систем програмне забезпечення і апаратні засоби оптимізовані так, щоб підтримувати транзакції стосовно щоденних операцій компанії. Наприклад, кожного разу, коли продається виріб, то все, що з цим актом пов’язане, мусить бути записане і враховане, тобто обчислене у відповідній таблиці транзакцій. Також пов’язані з цією операцією дані — дані щодо замовників і запасів матеріалів, змінюються в системах оброблення транзакцій. Для того, щоб забезпечити ефективну й ефектну актуалізацію БД, системи транзакцій зберігають дані в багатьох малих таблицях, кожна з яких
має мінімальну кількість полів. Так, наприклад, простій транзакції з оброблення запиту щодо збуту продукції потрібно мати дані, елементи яких записуються в п’яти або більше різних таблицях, оскільки потрібно добавляти або змінювати запис у таблиці накладної, в таблиці рядків накладної, таблиці дисконтів, таблиці запасів і таблиці департаменту.

Хоч такий структурований підхід до створення багатьох малих таблиць розглядається як ефективний для бази даних транзак­цій, однак він не призначений для організації даних в ОДСППР. За такого підходу запити будуть виконуватися повільно, оскільки потрібно з’єднати багато таблиць, щоб завершити опрацювання запиту, на що витрачається багато часу і використовуються обширні ресурси системи.

Операційні дані, зазвичай, зберігаються в багатьох різних таблицях і містять інформацію про специфічні транзакції, а дані ОДСППР — у значно меншій кількості таблиць, причому в них не завжди можна відшукати детальні відомості щодо кожної транзакції, бо вони є переважно підсумковими даними транзакцій. Дані з численних операційних баз даних інтегровані, агреговані й підсумовані в базі даних ОДСППР, щоб задовольняти наперед невизначені потреби щодо підтримки прийняття рішень.

Орієнтовані на дані СППР можуть містити надлишкові дані, якщо це сприяє прискоренню оброблення запитів. Компонентами даних ОДСППР на основі сховища даних є: метадані, поточні деталізовані дані, давніші докладні дані, підсумовані дані тощо. Загальна нормалізація не ефективна для даних ОДСППР і навіть деяка часткова нормалізація може реально зменшити ефективність оброблення запитів у орієнтованих на дані СППР.

Діапазон часу. Операційні дані є поточними даними, оскільки вони відображають теперішній стан бізнесових транзакцій. Дані ОДСППР — це миттєві знімки станів у задані моменти часу, тобто вони являють собою упорядковану за часом сукупність або серію операційних даних. Фактично в ОДСППР зберігаються численні «часові зрізи» операційних даних.

Підсумовування.Дані ОДСППР можуть підсумовуватися за допомогою програмного забезпечення аналітичного оброблення. Можна відправити деякі дані з бази даних ОДСППР у мультивимірний куб даних для прискореного аналізу. Деякі бази даних ОДСППР утворюються виключно з підсумків або (як їх часто називають) похідних чи вторинних даних. Наприклад, скоріше, ніж зберігати кожну із 10 000 транзакцій зі збуту в окремих елементах пам’яті на даний період, база даних ОДСППР може містити загальну кількість проданих одиниць і обсяг збуту. Дані ОДСППР можна було б подати у такий спосіб, щоб спостерігати обсяги збуту в грошовому еквіваленті для кожного магазину або збут у різних одиницях виміру для кожного типу продукту. Метою підсумовування є визначення і оцінювання трендів продажу або порівняння збутів різних типів продукції. Користувач може захотіти, наприклад, дізнатися: який тренд продукту А? чи доцільно припинити продаж деякого продукту? чи були ефективними витрати на рекламу для створення сприятливих змін у збуті? На всі ці запитання можна відповідати, використовуючи інтегровані дані. Операційні дані не підсумовуються в базах даних.

Мінливість даних. Тільки два види дій відбуваються в сховищі даних або базі даних ОДСППР: завантаження даних і організація доступу до них. Можна додавати дані в пакетах, але це вже не буде інтерактивною актуалізацією даних. Отже, дані СППР не змінюються з часом. Операційні дані мають непостійний характер, оскільки вони змінюються, як тільки відбуваються нові транзакції.

Вимірність даних.Багатовимірність даних є, можливо, найхарактернішою особливістю даних ОДСППР. З погляду менеджера чи аналітика дані ОДСППР завжди пов’язані між собою багатьма різними способами. Наприклад, коли аналізується збут продукту окремому споживачеві протягом певного проміжку часу, то можна зробити такий запит: «Скільки виробів типу X було продано споживачеві Y протягом останніх шести місяців?» Дані ОДСППР можуть досліджуватися в різних аспектах, наприклад, за видами продуктів, за регіонами і за часом. Здатність аналізувати, виділяти і подавати дані як інформацію в зручному вигляді є однією із головних позитивних характеристик ОДСППР. На противагу ним, операційні дані мають тільки одну вимірність.

Метадані.В орієнтованій на дані СППР важливо розробити і підтримувати метадані про дані СППР. Словники баз даних можуть бути і для систем оброблення транзакцій, але через те, що дані ОДСППР можуть надходити від багатьох джерел, створення словників і метаданих є особливо важливим для СППР. Метадані — це «інформація про дані» в базі даних СППР. До ресурсів метаданих належать каталоги і словники бази даних, а також імена змінних, довжини полів, допустимі значенння змінних і описи елементів даних. Семантичні дані часто зберігаються в словнику бази даних. Метадані зберігають інформацію про зміни у схемі початкових джерел сховища даних або бази даних.

Орієнтовані на дані СППР часто відносять до типу аналітичних систем (АС), тобто інформаційних систем, метою яких є лише аналіз даних. Інколи терміни «АС» і «ОДСППР» уживають як синоніми. Зауважимо, що стосовно інформаційних процесів аналітичні системи є вторинними по відношенню до операційних транзакційних систем OLTP (On-line transaction processing), оскільки всі дані, що використовуються для аналізу, необхідно спочатку нагромадити і, за можливості, частково обробити, чим і займаються різні транзакційні системи, а лише потім їх про­аналізувати. Основні відмінності систем оброблення транзакцій OLTP (онлайнових систем оброблення даних) і аналітичних систем (орієнтованих на дані СППР) наведені в табл. 10.2.

Таблиця 10.2

Характеристика

Онлайнова система
оброблення транзакцій

Аналітична система

Мета
системи

Облік, зберігання і оперативне оброблення первинних, де­талізованих даних, що характеризують поточний стан об’є­ктів предметної галузі (ПГ)

Отримання і зберігання узагальнених даних про ПГ і подання їх у вигляді, зручному для бізнес-аналізу та підтрим­ки прийняття рішень

Джерела та но­менклатура даних

Поточні оперативні дані, що деталізовано характеризують стан об’єктів ПГ, як правило, за останній та кілька поперед­ніх місяців

Крім детальних, потрібні узагальнені дані за певні періоди, а також фактичні дані, нагромаджені за тривалий час. Крім внутрішніх потрібні ще й зовнішні дані

Вигляд
даних

Оперативні БД можуть містити семантично еквівалентну інформацію, подану в різних форматах, яка не завжди може бути узгодженою (з причин використання різних технологій та різних СКБД)

Сховище даних має містити узгоджену інформацію, що подається в однакових форматах і максимально відповідає оперативній БД. Тобто сховища даних містять компоненти для зведення до єдиного вигляду інформації з різних джерел.

Частота
оновлення

Дані є динамічними, поточними, тобто безперервно онов­люються і дуже часто зміню­ються

Дані є статичними, тобто вони практично не змінюються, а лише доповнюються новими записами

Закінчення табл. 10.2

Характеристика

Онлайнова система
оброблення транзакцій

Аналітична система

Характер
запитів
до системи

Перелік запитів до транзакційних систем відомий ще за їх проектування. Переважають регламентні запити, які детерміновані в часі, тобто створюються з певною періодичністю і мають фіксований перелік вихідних повідом­лень. За розв’язання таких
задач переважають дуже часті вибірки з БД даних невеликими порціями. Транзакційні системи, головно, містять задачі прямого розрахунку

За розв’язання аналітичних завдань переважають нерегламентні запити, які потребують оброблення великих обсягів агрегованих даних (сум, мінімальних, максимальних, середніх та інших значень показників). АС має надавати аналітику різноманітні інструменти для оброблення даних та методики аналізу (наприклад, весь спектр статистичних методів, генетичних алгоритмів, нечіткої логіки і т. п.)

Подання
результатів
роботи

Складання фіксованого ряду звітних форм наперед відомої структури. Переважна більшість цих звітів потребує первинної деталізованої інформації

Велика кількість різноманітних звітів на основі агрегованих даних. Надання аналітику можливості самому визна­чати характер і форму використовуваних звітів. Подання результатів аналізу в зручному для розуміння вигляді (графічному, табличному тощо)

Захист

Для оперативної БД, як правило, достатньо захисту на рівні таблиць

Аналітичні дані потребують більшого захисту, зокрема, на рівні окремих значень аналітичних показників

Наявність
метаданих

Метаданими в OLTP-систе­мах користуються переважно лише адміністратори систем

Репозитарій метаданих — це необхідна компонента, яка є довідником про дані сховища для користувачів системи

Необхідність перепроекту-вання

Бази даних транзакційної системи мають бути спроектовані так, щоб вони не потребували подальшого перепро­ектування

Створення сховищ даних є ітеративним за своєю суттю і потребує регулярного перепроектування протягом усьо­го їхнього життєвого циклу

Аналітичні завдання залежно від концепції аналізу можна поділити на дві групи: завдання статичного та завдання оперативного аналізу. Ці дві групи аналітичних завдань суттєво відрізняються між собою.

Перша група завдань характеризується тим, що вони реалізуються на основі традиційної технології автоматизації розв’язан­ня. За цієї технології спочатку формулюється технічне завдання, яке передається програмісту для програмування. Програміст складає програму та тестує її і лише після цього отримує результат у вигляді регламен­тованих, тобто чітко визначених форм. За такого підходу виникає велика затримка в часі між моментом виникнення потреби в аналізі та отриманням відповідного результату. Дуже часто результат аналізу, який був потрібний аналітику, отримують пізно і рішення прий­мається без його врахування. Тому для прийняття оперативних рі­шень такий вид аналізу не підходить.

Рис. 10.1. Узагальнена схема
інформаційної аналітичної системи

Саме потреба в оперативному багатоаспектному бізнес-аналізі привела до виникнення нової OLAP-технології розв’язання аналітичних завдань. Ця технологія призначена забезпечувати аналітиків динамічним багатовимірним аналізом консолідованих даних. Як уже зазначалося, розв’язання аналітичних завдань не може обмежуватись лише даними транзакційних систем. Для порівняльного аналізу та виявлення тенденцій потрібно мати великі обсяги зовнішніх даних з різних статистичних збірників, з електронних та інших джерел. Зручним способом зберігання даних для розв’язання оперативних аналітичних завдань є сховища даних, що утворюють основу аналітичних інформаційних систем. Узагальнена схема інформаційної аналітичної системи, котра ураховує описані засади, показана на рис. 10.1.

Орієнтовані на дані СППР мусять мати дані найвищої якості, інакше дані можуть призвести до невдач у розв’язанні проблем. Дані найвищої якості — це точні, своєчасні, значимі (важливі)
і повні (комплектні) дані. Оцінювання або вимірювання якості джерел даних є попереднім завданням, яке пов’язане з оцінюванням технічної здійснимості проекту орієнтованої на дані СППР.

 



Поделиться:


Последнее изменение этой страницы: 2024-06-27; просмотров: 39; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.217.21 (0.012 с.)