OLAP technológia. OLAP technológia olap technológiák és többdimenziós adatmodellek

23.02.2021 Tanácsot

1993-ban az adatbázis-építés relációs megközelítésének megalapítója, Edgar Codd és partnerei (Edgar Codd matematikus, IBM-ösztöndíjas) az Arbor Software (ma a híres Hyperion Solutions cég) kezdeményezésére megjelentettek egy cikket "OLAP biztosítása online analitikai feldolgozás) elemző felhasználók számára", amely az OLAP technológia 12 jellemzőjét fogalmazta meg, amelyeket ezt követően további hattal egészítettek ki. Ezek a rendelkezések egy új és nagyon ígéretes technológia fő tartalmává váltak.

Az OLAP technológia főbb jellemzői (Basic):

  • adatok többdimenziós fogalmi ábrázolása;
  • intuitív adatkezelés;
  • az adatok elérhetősége és részletessége;
  • kötegelt adatkinyerés vs. értelmezés;
  • OLAP elemzési modellek;
  • kliens-szerver architektúra (az asztalról elérhető OLAP);
  • átláthatóság (átlátható hozzáférés a külső adatokhoz);
  • többfelhasználós támogatás.

Különleges képességek:

  • nem formalizált adatok feldolgozása;
  • OLAP eredmények mentése: a forrásadatoktól elkülönített tárolása;
  • hiányzó értékek kizárása;
  • Hiányzó értékek kezelése.

A jelentésbemutató jellemzői:

  • a jelentéskészítés rugalmassága;
  • szabványos jelentési teljesítmény;
  • automatikus beállítás fizikai szinten adatkinyerés.

Dimenziókezelés:

  • a mérések egyetemessége;
  • korlátlan számú dimenzió és összesítési szint;
  • korlátlan számú művelet a dimenziók között.

Történelmileg ma az "OLAP" kifejezés nemcsak a végfelhasználótól származó adatok többdimenziós nézetét jelenti, hanem a céladatbázisban lévő adatok többdimenziós nézetét is. Pontosan ezért jelent meg a „Relációs OLAP” (ROLAP) és a „Multidimenzionális OLAP” (MOLAP) kifejezések önálló kifejezésként.

Az OLAP szolgáltatás nagy mennyiségű adat valós idejű elemzésére szolgáló eszköz. Az OLAP rendszerrel való interakció révén a felhasználó rugalmasan tekintheti meg az információkat, tetszőleges adatszeleteket szerezhet be, és elemző műveleteket hajthat végre a drill-down, roll-up, end-to-end elosztás és időbeli összehasonlítás során, sok paraméter egyidejű használatával. Az OLAP rendszerrel végzett minden munka kifejezésekben történik tárgykörbenés lehetővé teszi az üzleti helyzet statisztikailag megalapozott modellek felépítését.

Szoftver Az OLAP a raktárban tárolt adatok operatív elemzésére szolgáló eszköz. A fő jellemzője, hogy ezeket az eszközöket nem informatikai szakemberek, nem statisztikusok, hanem az alkalmazott menedzsment területén dolgozó szakemberek - egy osztály, osztály, menedzsment, ill. , végül egy rendező. Az eszközöket úgy tervezték, hogy az elemző a problémával kommunikáljon, ne a számítógéppel. ábrán. A 6.14. ábra egy alapvető OLAP-kockát mutat, amely lehetővé teszi az adatok három dimenzió mentén történő kiértékelését.


Többdimenziós OLAP-kocka és a megfelelő matematikai algoritmusok rendszere statisztikai feldolgozás lehetővé teszi bármilyen összetettségű adatok elemzését bármely időintervallumban.

Rizs. 6.14. Elemi OLAP kocka

Rugalmas adatmanipulációs és vizuális megjelenítési mechanizmusok birtokában (6.15. ábra, 6.16. ábra) a menedzser először megvizsgálja különböző szemszögekből azokat az adatokat, amelyek a megoldandó problémához kapcsolódnak (vagy nem).

Ezután különféle üzleti mutatókat hasonlít össze egymással, megpróbálva azonosítani a rejtett kapcsolatokat; alaposabban, részletesebben megvizsgálhatja az adatokat, például idő, régió vagy ügyfél szerinti komponensekre bontva, vagy fordítva, tovább általánosíthatja az információk megjelenítését, hogy eltávolítsa a zavaró részleteket. Ezt követően a statisztikai kiértékelő és szimulációs modul segítségével több lehetőség is felépítésre kerül az események fejlesztésére, és ezek közül kiválasztják a legelfogadhatóbb lehetőséget.

Rizs. 6.15.

Egy cégvezetőnek például lehet olyan hipotézise, ​​hogy a vagyongyarapodás elterjedése a vállalat különböző ágazataiban a műszaki, ill. gazdasági oktatás. Ennek a hipotézisnek a teszteléséhez a vezető lekérheti a raktárból és grafikonon megjelenítheti azon fiókok kamatai arányát, amelyeknek a tárgynegyedévben az eszközállomány növekedése több mint 10%-kal csökkent a tavalyi évhez képest, illetve azoknál, amelyeknél több mint 10%-kal nőtt. 25%. Képesnek kell lennie a rendelkezésre álló menü egyszerű kiválasztására. Ha a kapott eredmények szignifikánsan két megfelelő csoportba esnek, akkor ennek ösztönzővé kell válnia a felállított hipotézis további tesztelésére.

Jelenleg a fent említett FASMI elvet maradéktalanul megvalósító dinamikus modellezésnek (Dynamic Simulation) nevezett irány gyors fejlődést kapott.

A dinamikus modellezés segítségével az elemző egy bizonyos forgatókönyv szerint idővel kialakuló üzleti helyzet modelljét építi fel. Ezen túlmenően az ilyen modellezés eredményeként több új üzleti helyzet fakadhat lehetséges megoldások mindegyik valószínűségének és kilátásainak felmérésével.

Rizs. 6.16. Analitikai IS adatkinyeréshez, információk feldolgozásához és bemutatásához

A 6.3. táblázat mutatja összehasonlító jellemzők statikus és dinamikus elemzés.

vezető

Az utóbbi időben sokat írtak az OLAP-ról. Elmondhatjuk, hogy van némi fellendülés e technológiák körül. Igaz, nálunk ez a fellendülés némileg megkésett, de ez természetesen összefügg az ország általános helyzetével.

A vállalati szintű információs rendszerek rendszerint olyan alkalmazásokat tartalmaznak, amelyeket az adatok komplex többdimenziós elemzésére terveztek, dinamikája, trendjei stb. Az ilyen elemzés végső soron a döntéshozatal támogatását szolgálja. Ezeket a rendszereket gyakran döntéstámogató rendszereknek nevezik.

A döntéstámogató rendszerek általában rendelkeznek azokkal az eszközökkel, amelyek az eredeti halmaz különböző mintáinak összesített adatait biztosítják a felhasználó számára, az észlelés és elemzés számára kényelmes formában. Az ilyen aggregált függvények általában egy többdimenziós (és ezért nem relációs) adathalmazt alkotnak (gyakran hiperkockának vagy metakockának nevezik), amelynek tengelyei paramétereket, a cellák pedig azoktól függő összesített adatokat tartalmaznak - és ilyen adatokat. relációs táblákban is tárolhatók, de ebben az esetben az adatok logikai rendszerezéséről beszélünk, nem pedig tárolásuk fizikai megvalósításáról). Az egyes tengelyek mentén az adatok hierarchiába rendezhetők, amelyek különböző részletességi szinteket képviselnek. Ennek az adatmodellnek köszönhetően a felhasználók összetett lekérdezéseket fogalmazhatnak meg, jelentéseket készíthetnek, és adatok részhalmazait szerezhetik be.

A komplex többdimenziós adatelemzés technológiáját OLAP-nak (On-Line Analytical Processing) hívják.

Az OLAP az adattárház kulcseleme.

Az OLAP fogalmát Edgar Codd, neves adatbázis-kutató és a relációs adatmodell szerzője írta le 1993-ban (ld.E.F. Codd, S.B. Codd és C.T. Salley: OLAP (on-line analitikai feldolgozás) biztosítása a felhasználó-elemzők számára: IT-megbízás. Műszaki jelentés, 1993).

1995-ben a Codd által támasztott követelmények alapján megfogalmazták az úgynevezett FASMI tesztet (Fast Analysis of Shared Multidimensional Information), amely a következő követelményeket tartalmazza a többdimenziós elemzés alkalmazására:

· a felhasználó rendelkezésére bocsátani az elemzési eredményeket elfogadható időn belül (általában legfeljebb 5 s), még kevésbé részletes elemzés árán is;

· bármilyen logikai és Statisztikai analízis, adott alkalmazásra jellemző, és a végfelhasználó számára elérhető formában történő mentése;

· többfelhasználós hozzáférés az adatokhoz megfelelő zárszerkezetek és engedélyezett hozzáférési eszközök támogatásával;

· az adatok többdimenziós fogalmi megjelenítése, beleértve a hierarchiák és a többszörös hierarchiák teljes körű támogatását (ez az OLAP egyik legfontosabb követelménye);

· minden szükséges információhoz való hozzáférés lehetősége, függetlenül azok mennyiségétől és tárolási helyétől.

Meg kell jegyezni, hogy az OLAP funkcionalitás megvalósítható különböző utak, kezdve az irodai alkalmazások legegyszerűbb adatelemző eszközeivel és a szervertermékeken alapuló elosztott elemző rendszerekkel. A felhasználók könnyen megtekinthetik az adatokat többdimenziós struktúrában, mivel az a saját problémáikra vonatkozik.

2. Mi az OLAP

Az OLAP az angol On-Line Analytical Processing rövidítése – ez nem egy konkrét termék, hanem egy teljes technológia neve. Oroszul a legkényelmesebb az OLAP műveletelemző feldolgozást hívni. Bár egyes publikációkban az analitikus feldolgozást online és interaktívnak is nevezik, az „online” jelző tükrözi a legpontosabban az OLAP technológia jelentését.

A menedzsment megoldások menedzser általi fejlesztése a legnehezebben automatizálható területek kategóriájába tartozik. Ma azonban lehetőség nyílik a vezető segítségére a megoldások kidolgozásában, és ami a legfontosabb, jelentősen felgyorsítja a megoldások kidolgozásának folyamatát, azok kiválasztását és átvételét. Ehhez használhatja az OLAP-ot.

Nézzük meg, hogyan zajlik általában a megoldásfejlesztési folyamat.

Történelmileg az operatív tevékenységek automatizálására szolgáló megoldások voltak a legfejlettebbek. Tranzakciós adatfeldolgozó rendszerekről (OLTP), egyszerűbben operatív rendszerekről beszélünk. Ezek a rendszerek bizonyos tények rögzítését, rövid távú tárolását és archívumban való megőrzését biztosítják. Az ilyen rendszerek alapját a relációs adatbázis-kezelő rendszerek (RDBMS) adják. A hagyományos megközelítés az, hogy megpróbáljuk a már felépített operációs rendszereket felhasználni a döntéshozatal támogatására. Általában egy fejlett lekérdezési rendszert próbálnak felépíteni az operációs rendszerre, és az értelmezés után kapott jelentéseket közvetlenül a döntések alátámasztására használják fel. A riportokat egyedi alapon lehet felépíteni, pl. a vezető kér jelentést, és rendszeresen, amikor a beszámolók bizonyos események vagy időpontok teljesítésére épülnek. Például egy hagyományos döntéstámogatási folyamat így nézhet ki: egy menedzser elmegy egy információs szakemberhez, és megosztja vele kérdését. Ezután az információs osztály szakembere lekérést készít az operációs rendszer felé, megkapja az elektronikus jelentést, értelmezi, majd felhívja a vezetőség figyelmét. Természetesen egy ilyen rendszer bizonyos mértékig döntéstámogatást nyújt, de rendkívül alacsony a hatékonysága és rengeteg hátránya van. Csekély mennyiségű adatot használnak fel a küldetéskritikus döntések alátámasztására. Vannak más problémák is. Ez a folyamat nagyon lassú, mivel a kérelmek írása és az elektronikus jelentés értelmezése hosszadalmas. Sok napig tart, amikor a menedzsernek azonnal, azonnal döntést kell hoznia. Ha figyelembe vesszük, hogy a vezetőt a jelentés kézhezvétele után más kérdés is érdekelheti (mondjuk az adatok pontosítása vagy más kontextusban történő mérlegelése szükségessége), akkor ezt a lassú ciklust meg kell ismételni, és mivel az adatelemzés folyamata operációs rendszer ismétlődően fog megtörténni, akkor még több időre lesz szükség. Egy másik probléma a szakember különféle tevékenységi területeinek problémája információs technológiaés a vezető, aki különböző kategóriákban tud gondolkodni, és ennek következtében nem érti meg egymást. Ezután további tisztázó iterációkra lesz szükség, és itt az idő, amiből mindig hiány van. Egy másik fontos probléma az, hogy a jelentéseket nehéz megérteni. A menedzsernek nincs ideje kiválasztani a jelentésből az érdeklődésre számot tartó számokat, különösen azért, mert túl sok lehet belőlük (emlékezzen a hatalmas többoldalas jelentésekre, amelyekben több oldalt használnak fel, a többit pedig minden esetben). Azt is megjegyezzük, hogy a tolmácsolás leggyakrabban az információs osztályok szakembereire hárul. Vagyis a hozzáértő szakember figyelmét elvonja a rutinszerű és eredménytelen diagramrajzolás stb., ami képzettségére természetesen nem lehet kedvező hatással. Emellett nem titok, hogy az értelmezési láncban vannak jóakarók, akik érdeklődnek a bejövő információk szándékos eltorzításában.

A fenti hiányosságok elgondolkodtatnak az operációs rendszer általános hatékonyságán és a létezésével járó költségeken, hiszen kiderül, hogy az operációs rendszer létrehozásának költségeit nem kompenzálja megfelelően a működésének hatékonysága.

A valóságban ezek a problémák nem az operációs rendszer rossz minőségének vagy sikertelen felépítésének a következményei. A problémák gyökerei az operációs rendszer által automatizált működési tevékenységek és a fejlesztő és döntéshozó tevékenységek közötti alapvető különbségben rejlenek. Ez a különbség abban rejlik, hogy az operációs rendszer adatai egyszerűen bizonyos események és tények feljegyzései, de nem információ a szó általános értelmében. Az információ minden területen csökkenti a bizonytalanságot. És nagyon jó lenne, ha az információ csökkentené a bizonytalanságot a döntéshozatal terén. Az ismert E.F. egy alkalommal az RDBMS-re épített operációs rendszerek erre a célra való alkalmatlanságáról beszélt. Codd, a relációs adatbázis-kezelő rendszerek technológiájának úttörője az 1970-es években: „Bár a relációs adatbázis-kezelő rendszerek elérhetőek a felhasználók számára, soha nem ismerték el, hogy hatékony szintézis-, elemzési és konszolidációs képességeket biztosítanak (a többdimenziós adatelemzésnek nevezett funkciókat)”. Kifejezetten az információ szintéziséről, az operatív rendszerekből származó adatok információvá, sőt minőségi értékelésekké alakításáról beszélünk. Az OLAP lehetővé teszi ezt az átalakítást.

Az OLAP egy többdimenziós adatmodell ötletén alapul. Az emberi gondolkodás definíció szerint többdimenziós. Amikor az ember kérdéseket tesz fel, megszorításokat állít fel, ezáltal sok dimenzióban fogalmaz meg kérdéseket, így a többdimenziós modellben történő elemzés folyamata nagyon közel áll az emberi gondolkodás valóságához. A többdimenziós modellben a dimenziók szerint ábrázolják a vállalkozás tevékenységét befolyásoló tényezőket (például: idő, termékek, cégágak, földrajz stb.). Ily módon egy hiperkockát kapunk (persze a név nem túl sikeres, hiszen a kockán általában egyenlő élű figurát értünk, ami ebben az esetben messze nem így van), amit aztán kitöltünk a vállalkozás tevékenységének mutatói (árak, eladások, terv, nyereség, veszteség stb.). Ez mind az operációs rendszerek valós adataival, mind a múltbeli adatokon alapuló előrejelzési adatokkal kitölthető. A hiperkocka méretei összetettek, hierarchikusak lehetnek, és kapcsolatok létesíthetők közöttük. Az elemzési folyamat során a felhasználó megváltoztathatja az adatok nézőpontját (az ún. logikai nézet megváltoztatásának művelete), ezáltal az adatokat különböző nézőpontokból tekintheti meg, és konkrét problémákat oldhat meg. A kockákon különféle műveletek hajthatók végre, beleértve az előrejelzést és a feltételes tervezést (mi lenne, ha elemzés). Sőt, a műveleteket egyszerre hajtják végre a kockákon, azaz. a szorzat például egy hiperkocka szorzatot eredményez, amelynek minden cellája a megfelelő szorzó hiperkockák celláinak szorzata. Természetesen lehetőség van különböző dimenziószámú hiperkockákon műveletek végrehajtására.

3. Az OLAP technológia létrejöttének története

Az adatok többdimenziós tömbökön történő feldolgozásának ötlete nem új. Valójában 1962-ig nyúlik vissza, amikor Ken Iverson kiadta „A programozási nyelv” (APL) című könyvét. Az APL első gyakorlati megvalósítására a hatvanas évek végén került sor az IBM által. Az APL egy nagyon elegáns, matematikailag meghatározott nyelv többdimenziós változókkal és feldolgozott műveletekkel. Eredeti, hatékony eszköznek szánták a többdimenziós transzformációkkal való munkavégzéshez, összehasonlítva más gyakorlati programozási nyelvekkel.

Azonban az ötlet hosszú ideje nem kapott széleskörű elterjedtséget, mivel még nem jött el a grafikus felületek és a jó minőségű nyomtatóeszközök ideje, a görög karakterek megjelenítéséhez speciális képernyőkre, billentyűzetekre és nyomtatóeszközökre volt szükség. Később néha angol szavakat használtak a görög operátorok helyettesítésére, de az APL-puristák abbahagyták a kedvenc nyelvük népszerűsítésére irányuló kísérleteket. Az APL gépi erőforrásokat is felemésztett. Akkoriban drága volt a használata. A programok végrehajtása nagyon lassú volt, ráadásul a futtatásuk nagyon drága volt. Nagyon sok memóriára volt szükség, akkoriban sokkoló mennyiségben (kb. 6 MB).

Ezeknek a kezdeti hibáknak a csalódása azonban nem ölte meg az ötletet. A 70-es, 80-as években számos üzleti alkalmazásban használták. Ezen alkalmazások közül sok a modern analitikai feldolgozó rendszerek jellemzőivel rendelkezett. Így fejlesztette ki az IBM operációs rendszer az APL-hez, az úgynevezett VSPC-hez, és egyesek ideális környezetnek tartották a személyes használatra, amíg a táblázatok mindenütt megjelentek.

Az APL-t azonban túl nehéz volt használni, különösen azért, mert minden alkalommal következetlenségek voltak a nyelv és a hardver között, amelyen megpróbálták megvalósítani.

Az 1980-as években az APL elérhetővé vált személyi gépeken, de nem talált piaci felhasználásra. Az alternatíva a többdimenziós alkalmazások programozása volt más nyelvű tömbök segítségével. Ez még a professzionális programozók számára is nagyon nehéz feladat volt, és kénytelen volt megvárni a többdimenziós szoftvertermékek következő generációját.

1972-ben számos, korábban oktatási célokra használt többdimenziós szoftvertermék talált kereskedelmi felhasználásra: Express. Jelenleg is teljesen átírt formában maradt meg, de a 70-es évek eredeti koncepciói már nem aktuálisak. Ma, a 90-es években az Express az egyik legnépszerűbb OLAP technológia, és az Oracle(r) népszerűsíteni fogja, és új képességekkel bővíti.

A 80-as években több többdimenziós termék jelent meg. Az évtized elején a Stratagem nevű, később Acumate névre keresztelt termék (ma a Kenan Technologies tulajdona), amelyet a 90-es évek elejéig még népszerűsítettek, ma azonban az Expresszel ellentétben gyakorlatilag nem használják.

A Comshare System W egy más stílusú, többdimenziós termék volt. 1981-ben vezették be, és ez volt az első, amely jobban összpontosított a végfelhasználóra és a pénzügyi alkalmazások fejlesztésére. Számos olyan fogalmat vezetett be, amelyeket nem vettek át jól, mint például a teljesen nem eljárási szabályokat, a többdimenziós adatok teljes képernyős megtekintését és szerkesztését, az automatikus újraszámítást és a kötegelt integrációt relációs adatokkal. A Comshare System W azonban meglehetősen nehéz volt hardver akkoriban más termékekhez képest, és a jövőben kevesebbet használták, egyre kevesebbet adták el, és nem történt fejlesztés a terméken. Bár továbbra is elérhető UNIX-on, nem kliens-szerver, ami nem bővíti kínálatát az elemzési piacon. Az 1980-as évek végén a Comshare kiadott egy terméket DOS-ra, majd később Windowsra. Ezeket a termékeket Commander Prism-nek hívták, és ugyanazokat a fogalmakat használták, mint a System W.

A 80-as évek végének másik kreatív terméke a metafora volt. Professzionális marketingesek számára készült. Számos új fogalmat is bevezetett, amelyeket ma kezdenek széles körben elterjedni: kliens-szerver számítástechnika, többdimenziós modell használata relációs adatokon, objektum-orientált alkalmazásfejlesztés. A korabeli szabványos személyi számítógép hardver azonban nem volt képes a Metaphor futtatására, és a gyártók kénytelenek voltak kidolgozni saját szabványaikat a személyi számítógépekhez és hálózatokhoz. A Metaphor fokozatosan kezdett sikeresen működni a soros személyi gépeken, de a termék kizárólag OS/2-re készült, és saját grafikus felhasználói felülettel is rendelkezett.

A Metaphor ezután marketingszövetséget kötött az IBM-mel, amelyet később felvett. 1994 közepén az IBM úgy döntött, hogy integrálja a Metaphor technológiát (új nevén DIS) jövőbeli technológiáiba, és ezáltal leállítja egy külön vonal finanszírozását, de az ügyfelek nemtetszését fejezték ki, és a termék további támogatását követelték. A fennmaradó ügyfelek támogatása folytatódott, és az IBM újra kiadta a terméket új DIS néven, ami azonban nem tette népszerűvé. De a Metaphor kreatív, innovatív koncepciói nem merültek feledésbe, és ma már számos terméken láthatók.

A 80-as évek közepén született meg az EIS (Executive Information System) kifejezés. Az első termék, amely egyértelműen demonstrálta ezt az irányt, a Pilot's Command Center volt. Ez egy olyan termék volt, amely lehetővé tette a kollaboratív számítástechnikát, amit ma kliens-szerver számítástechnikának nevezünk. Mivel az 1980-as években a személyi számítógépek teljesítménye korlátozott volt, a termék nagyon „szerver-központú” volt, de ez az elv még ma is nagyon népszerű. A Pilot nem árulta sokáig a Command Centert, de számos olyan koncepciót bevezetett, amelyek a mai OLAP termékekben felismerhetők, beleértve az időintervallumok automatikus támogatását, a többdimenziós kliens-szerver számításokat és az elemzési folyamat egyszerűsített vezérlését (egér, érintőképernyők). stb.). Ezen koncepciók közül néhányat később újra alkalmaztak a Pilot Analysis Serverben.

Az 1980-as évek végén a táblázatok uralták a végfelhasználók számára elemzést biztosító eszközök piacát. Az első többdimenziós táblázatot a Compete vezette be. Nagyon drága termékként hozták forgalomba a szakemberek számára, de az eladók nem tudták biztosítani, hogy a termék megragadja a piacot, és a Computer Associates megszerezte a jogokat más termékekkel együtt, mint például a Supercalc és a 20/20. A CA Compete felvásárlásának fő hatása az ár jelentős csökkenése és a másolásvédelem megszüntetése volt, ami természetesen hozzájárult a forgalmazáshoz. Ez azonban nem járt sikerrel. A Verseny a Supercalc 5 alapja, de a többdimenziós aspektusát nem támogatják. A régi Compete-et még mindig használják néha, mivel egy időben jelentős erőforrásokat fektettek bele.

A Lotus volt a következő, aki megpróbált belépni a többdimenziós táblázatkezelő piacra Improv termékével, amely NeXT gépen fut. Ez biztosította legalább azt, hogy az 1-2-3 eladások ne csökkenjenek, de amikor végül megjelent Windowsra, az Excel már nagy piaci részesedéssel rendelkezett, ami megakadályozta, hogy a Lotus bármiféle változtatást hajtson végre a piac felosztásán. A Lotus a Compete-hez hasonlóan a CA-hoz hasonlóan a piac alsó szegmensébe helyezte az Improv-t, de ez nem volt feltétele a sikeres piacfejlesztésnek, és az új fejlesztések ezen a területen nem folytatódtak. Kiderült, hogy a PC-felhasználók az 1-2-3 táblázatot részesítették előnyben, és nem érdekeltek az új többváltozós képességek, hacsak nem teljesen kompatibilisek a régi táblázataikkal. Hasonlóképpen, a személyes alkalmazásként kínált kis asztali táblázatok koncepciói nem igazán bizonyultak kényelmesnek, és nem igazán ragadtak meg a valós üzleti világban. A Microsoft (r) ezt az utat követte a PivotTables hozzáadásával (az orosz kiadásban ezt a „ pivot táblák") felülmúlni. Bár kevés Excel felhasználók A szolgáltatás előnyeit valószínűleg ez az egyetlen alkalom, amikor a többváltozós elemzési lehetőségeket széles körben használják a világon, egyszerűen azért, mert olyan sok Excel-felhasználó van a világon.

4. OLAP, ROLAP, MOLAP…

Köztudott, hogy amikor Codd 1985-ben közzétette a relációs DBMS-ek felépítésére vonatkozó szabályait, azok erőteljes reakciót váltottak ki, és ezt követően általában véve erős hatást gyakoroltak a DBMS-iparra. Kevesen tudják azonban, hogy 1993-ban Codd kiadott egy munkát „OLAP for User Analysts: What It Should Be” címmel. Ebben felvázolta az online elemzés alapfogalmait, és 12 szabályt határozott meg, amelyeknek meg kell felelniük az online elemzési képességeket biztosító termékeknek.

Ezek a szabályok (az eredeti szöveget lehetőség szerint megőriztük):

1. Fogalmi többdimenziós ábrázolás. A felhasználó-elemző a vállalati világot többdimenziós természetűnek látja. Ennek megfelelően az OLAP modellnek magjában többdimenziósnak kell lennie. A többdimenziós fogalmi diagram vagy egyedi ábrázolás megkönnyíti a modellezést és elemzést, valamint a számításokat.

2. Átláthatóság. Függetlenül attól, hogy az OLAP termék a felhasználó eszközei közé tartozik-e vagy sem, ennek a ténynek átláthatónak kell lennie a felhasználó számára. Ha az OLAP-ot kliens-szerver számítástechnika biztosítja, akkor ennek a ténynek is, ha lehetséges, láthatatlannak kell lennie a felhasználó számára. Az OLAP-ot egy valóban nyitott architektúra keretében kell biztosítani, amely lehetővé teszi a felhasználó számára, hogy bárhol is legyen, egy elemző eszközön keresztül kommunikáljon a szerverrel. Ezenkívül átláthatóságot kell elérni, amikor az elemző eszköz homogén és heterogén adatbázis-környezetekkel működik együtt.

3. Elérhetőség. Az OLAP elemző felhasználónak képesnek kell lennie arra, hogy elemzéseket végezzen egy közös fogalmi séma alapján, amely egy relációs adatbázisban lévő vállalati szintű adatokat, valamint örökölt örökölt adatbázisokból származó adatokat, közös hozzáférési módszereket és közös analitikai modellt tartalmaz. Ez azt jelenti, hogy az OLAP-nak saját logikai sémáját kell biztosítania a heterogén adatbázis-környezetben való hozzáféréshez, és megfelelő átalakításokat kell végrehajtania, hogy adatokat biztosítson a felhasználónak. Sőt, előre kell ügyelni arra, hogy az adatok ténylegesen hol és hogyan, milyen fizikai rendszerezéssel kerüljenek felhasználásra. Az OLAP rendszernek csak azokhoz az adatokhoz kell hozzáférnie, amelyekre valóban szükség van, ahelyett, hogy egy általános „konyha tölcsér” megközelítést alkalmazna, amely szükségtelen bevitelt vezet be.

4. Következetes teljesítmény a jelentéskészítésben. Ha a dimenziók száma vagy az adatbázis mérete növekszik, a felhasználói elemző nem tapasztalhat jelentős teljesítménycsökkenést. A konzisztens teljesítmény kritikus fontosságú a végfelhasználói könnyű használat és az OLAP bonyolultságának korlátozása mellett. Ha a felhasználó-analitikus jelentős teljesítménybeli különbségeket tapasztal a dimenziók számának megfelelően, akkor ezeket a különbségeket hajlamos a tervezési stratégiával kompenzálni, ami miatt az adatok más módon jelennek meg, mint ahogyan az adatok ténylegesen. bemutatni kell. Az elemzési termékeket nem arra tervezték, hogy egy rendszer körül mászkáljon, hogy kompenzálja annak hiányosságait.

5. Kliens-szerver architektúra. A manapság gyorsan és analitikusan feldolgozandó adatok nagy része PC-hozzáféréssel rendelkező nagyszámítógépeken tárolódik. Ez tehát azt jelenti, hogy az OLAP termékeknek képesnek kell lenniük kliens-szerver környezetben is működni. Ebből a szempontból szükséges, hogy az elemző eszköz szerver komponense alapvetően „intelligens” legyen, hogy a különféle kliensek minimális bonyolultsággal és integrációs programozással kapcsolódhassanak a szerverhez. Az intelligens szervernek képesnek kell lennie a különböző logikai és fizikai adatbázissémák leképezésére és konszolidálására. Ez átláthatóságot biztosít, és közös fogalmi, logikai és fizikai keretet épít fel.

6. Általános többdimenziósság. Mindegyik dimenziót felépítésüktől és működési képességeiktől függetlenül kell alkalmazni. A kiválasztott méretekhez további működési képességek biztosíthatók, és mivel a méretek szimmetrikusak, egyetlen funkció biztosítható bármely mérethez. Az alapvető adatszerkezetek, képletek és jelentési formátumok nem lehetnek elfogulva semmilyen dimenzió felé.

7. Ritka mátrixok dinamikus vezérlése. A ritka mátrixok optimális kezeléséhez az OLAP-eszköz fizikai tervezését teljes mértékben hozzá kell igazítani az adott analitikai modellhez. Egy adott ritka mátrixhoz egy és csak egy optimális fizikai séma létezik. Ez a séma maximális memóriahatékonyságot és mátrixműködtetést biztosít, kivéve persze, ha a teljes adatkészlet nem fér el a memóriában. Az OLAP-eszköz mögöttes fizikai adatait a méretek bármely részhalmazához, tetszőleges sorrendben be kell állítani a nagy analitikai modelleken végzett gyakorlati műveletekhez. A fizikai hozzáférési módszereknek is dinamikusan kell változniuk, és különböző típusú mechanizmusokat kell tartalmazniuk, mint például: közvetlen számítások, B-fák és származékok, hashelés, valamint ezen mechanizmusok szükség esetén kombinálásának lehetősége. A ritkaság (az összes lehetséges cellához viszonyított üres cellák százalékában mérve) az adatterjedés egyik jellemzője. A ritkaság szabályozásának elmulasztása elérhetetlenné teheti a működési hatékonyságot. Ha egy OLAP eszköz nem tudja ellenőrizni és szabályozni az elemzett adatok értékeinek eloszlását, akkor a gyakorlatiasnak mondható, számos konszolidációs útvonalon és dimenzión alapuló modell a valóságban szükségtelen és reménytelen lehet.

8. Többfelhasználós támogatás. Gyakran több elemző felhasználónak kell együttműködnie ugyanazzal az analitikai modellel, vagy különböző modelleket kell létrehoznia ugyanazokból az adatokból. Ezért egy OLAP-eszköznek megosztási (lekérdezési és befejezési), integritási és biztonsági képességeket kell biztosítania.

9. Korlátlan keresztműveletek. A különböző összesítési szintek és konszolidációs útvonalak hierarchikus jellegük miatt függő kapcsolatokat jelentenek egy OLAP-modellben vagy alkalmazásban. Ezért magának az eszköznek magában kell foglalnia a megfelelő számításokat, és nem kell megkövetelnie az analitikus felhasználótól a számítások és műveletek újradefiniálását. Azok a számítások, amelyek nem ezekből az öröklött relációkból származnak, különböző képletekkel definiálják az alkalmazható nyelvek szerint. Egy ilyen nyelv lehetővé teheti bármilyen méretű adat számítását és manipulálását, és nem korlátozza az adatcellák közötti kapcsolatokat, és nem fordít figyelmet az egyes cellák közös adatattribútumainak számára.

10. Intuitív adatkezelés. A konszolidációs utak átirányítását, a részletezést, a nagyítást és a konszolidációs utak által szabályozott egyéb manipulációkat az analitikus modell celláira külön hatáson keresztül kell alkalmazni, és nem igényelhet menürendszert vagy egyéb többszörös műveletet a felhasználói felülettel. Az analitikus modellben meghatározott dimenziók felhasználó-elemző nézetének tartalmaznia kell mindent szükséges információ a fenti lépések végrehajtásához.

11. Rugalmas lehetőségek a jelentések fogadására. Az adatok elemzése és megjelenítése egyszerű, ha az egymással vizuálisan összehasonlítandó adatok sorai, oszlopai és cellái közel vagy bizonyos távolságra helyezkednek el. logikai függvény zajlik a vállalkozásban. A jelentéskészítő eszközöknek szintetizált adatokat vagy az adatmodellből származó információkat bármilyen lehetséges orientációban kell bemutatniuk. Ez azt jelenti, hogy a soroknak, oszlopoknak vagy oldalaknak egyszerre 0-tól N méretig kell megjelenniük, ahol N a teljes analitikai modell dimenzióinak száma. Ezenkívül az egyetlen bejegyzésben, oszlopban vagy oldalon megjelenő tartalmi dimenzióknak meg kell tudniuk mutatni a dimenzióban található elemek (értékek) bármely részhalmazát, tetszőleges sorrendben.

12. Korlátlan dimenzió és aggregációs szintek száma. Az analitikus modellben szükséges lehetséges méretek számáról végzett tanulmány kimutatta, hogy akár 19 dimenzió is használható egyidejűleg. Ezért erősen ajánlott, hogy az elemző eszköz legyen képes egyidejűleg legalább 15, de lehetőleg 20 dimenzió biztosítására. Ezenkívül az egyes közös dimenziók nem korlátozhatók a felhasználó által definiált aggregációs szintek és konszolidációs utak számában.

Valójában a mai OLAP-termékfejlesztők betartják ezeket a szabályokat, vagy legalábbis törekednek ezek betartására. Ezeket a szabályokat tekinthetjük az operatív analitikus feldolgozás elméleti alapjának, nehéz velük vitatkozni. Ezt követően a 12 szabályból számos következtetés levonható, amelyeket azonban nem fogunk idézni, hogy ne bonyolítsuk szükségtelenül a narratívát.

Nézzük meg közelebbről, miben különböznek az OLAP-termékek fizikai megvalósításukban.

Mint fentebb említettük, az OLAP azon az elgondoláson alapul, hogy többdimenziós struktúrák segítségével dolgozza fel az adatokat. Amikor azt mondjuk, hogy OLAP, akkor azt értjük, hogy logikailag az analitikai termék adatszerkezete többdimenziós. Hogy ez pontosan hogyan valósul meg, az más kérdés. Az analitikai feldolgozásnak két fő típusa van, amelyek bizonyos termékeket tartalmaznak.

MOLAP . Valójában többdimenziós (többdimenziós) OLAP. A termék nem relációs adatstruktúrán alapul, amely az adatok többdimenziós tárolását, feldolgozását és megjelenítését biztosítja. Ennek megfelelően az adatbázisokat többdimenziósnak nevezzük. Az ebbe az osztályba tartozó termékek általában többdimenziós adatbázis-kiszolgálóval rendelkeznek. Az elemzési folyamat során az adatokat kizárólag többdimenziós struktúrából választják ki. Egy ilyen szerkezet rendkívül termelékeny.

ROLAP . Relációs OLAP. Ahogy a neve is sugallja, az ilyen eszközök többdimenziós struktúráját relációs táblák valósítják meg. Az elemzési folyamat adatait pedig ennek megfelelően egy elemző eszköz választja ki a relációs adatbázisból.

Az egyes megközelítések hátrányai és előnyei általában nyilvánvalóak. A többdimenziós OLAP biztosítja jobb teljesítmény, de a struktúrák nem használhatók nagy mennyiségű adat feldolgozására, mivel a nagy méretek nagy hardver erőforrásokat igényelnek, ugyanakkor a hiperkockák ritkasága nagyon magas lehet, ezért a hardver kapacitás felhasználása nem lesz indokolt. Éppen ellenkezőleg, a relációs OLAP a tárolt adatok nagy tömbjein biztosítja a feldolgozást, mivel gazdaságosabb tárolást biztosít, ugyanakkor sebessége jelentősen elmarad a többdimenziós OLAP-tól. Hasonló érvelés vezetett az analitikai eszközök új osztályának, a HOLAP-nak az azonosításához. Ez egy hibrid operatív analitikai feldolgozás. Az osztály eszközei lehetővé teszik mindkét megközelítés – a relációs és a többdimenziós – kombinálását. Többdimenziós adatbázis-adatokhoz és relációs adatokhoz is hozzá lehet férni.

Van egy másik meglehetősen egzotikus típusú műveletelemző feldolgozás - a DOLAP. Ez az „asztali” OLAP. Olyan analitikus feldolgozásról beszélünk, ahol a hiperkockák kicsik, méreteik kicsik, az igények szerények, és az ilyen analitikai feldolgozáshoz elegendő egy asztali gép.

Az operatív analitikai feldolgozás jelentősen leegyszerűsítheti és felgyorsíthatja a vezetők előkészítésének és döntéshozatalának folyamatát. Az online analitikai feldolgozás az adatok információvá alakítását szolgálja. Alapvetően eltér a hagyományos döntéstámogatási folyamattól, amely legtöbbször a strukturált jelentések áttekintésén alapul. Analógia alapján a strukturált jelentések és az OLAP között ugyanaz a különbség, mint a villamossal történő városvezetés és a személygépkocsi vezetése között. Amikor villamoson utazik, az a síneken mozog, ami nem teszi lehetővé, hogy tisztán lássa a távoli épületeket, és még kevésbé közelítsen hozzájuk. Éppen ellenkezőleg, a személygépkocsi vezetése teljes mozgásszabadságot biztosít (természetesen be kell tartania a közlekedési szabályokat). Bármely épülethez felhajthat, és eljuthat olyan helyekre, ahol nem járnak villamosok.

A strukturált jelentések azok a sínek, amelyek akadályozzák a döntés-előkészítés szabadságát. Az OLAP az információs autópályákon való hatékony mozgás eszköze.

A kurzusmunka célja az OLAP technológia, megvalósítási koncepciójának és felépítésének megismerése.

BAN BEN modern világ számítógépes hálózatok a számítástechnikai rendszerek pedig nagy mennyiségű adat elemzését és feldolgozását teszik lehetővé.

A nagy mennyiségű információ nagymértékben megnehezíti a megoldások keresését, de sokkal pontosabb számításokat és elemzéseket tesz lehetővé. A probléma megoldására egy egész osztály áll rendelkezésére információs rendszerek az elemzés elvégzése. Az ilyen rendszereket döntéstámogató rendszereknek (DSS) (Decision Support System) nevezik.

Az elemzés elvégzéséhez a DSS-nek információt kell felhalmoznia, és rendelkeznie kell a bevitelhez és tároláshoz szükséges eszközökkel. Összességében három fő feladatot különböztethetünk meg a DSS-ben:

· adatbemenet;

· adattárolás;

· adatelemzés.

Az adatbevitel a DSS-be automatikusan történik a környezet vagy a folyamat állapotát jellemző érzékelőktől, vagy emberi kezelő által.

Ha az adatbevitel automatikusan történik érzékelőkről, akkor az adatok felhalmozódnak egy készenléti jelzéssel, amely információ megjelenésekor vagy ciklikus lekérdezéssel történik. Ha a bevitelt egy személy végzi, akkor kényelmes eszközöket kell biztosítania a felhasználók számára az adatok beviteléhez, a bevitel helyességének ellenőrzéséhez, valamint a szükséges számítások elvégzéséhez.

Több operátor egyidejű adatbevitelekor meg kell oldani az azonos adatok módosításának és párhuzamos hozzáférésének problémáit.

A DSS jelentések, táblázatok, grafikonok formájában bocsátja az elemző rendelkezésére a tanulmányozáshoz és elemzéshez szükséges adatokat, ezért az ilyen rendszerek döntéstámogató funkciókat biztosítanak.

Az OLTP-nek (On-line tranzakciófeldolgozás) nevezett adatbeviteli alrendszerek operatív adatfeldolgozást valósítanak meg. Megvalósításukhoz hagyományos adatbázis-kezelő rendszereket (DBMS) használnak.

Az elemzési alrendszer a következők alapján építhető fel:

· relációs DBMS-en és statikus lekérdezéseken alapuló információ-visszakereső alrendszerek SQL nyelv;

· működési elemzési alrendszerek. Az ilyen alrendszerek megvalósításához az operatív analitikai adatfeldolgozás OLAP technológiáját alkalmazzák, a többdimenziós adatreprezentáció fogalmát használva;

· intellektuális elemzési alrendszerek. Ez az alrendszer DataMining módszereket és algoritmusokat valósít meg.

A felhasználó szemszögéből az OLAP rendszerek olyan eszközöket biztosítanak, amelyek lehetővé teszik az információk rugalmas megtekintését a különböző szakaszokban, az összesített adatok automatikus beszerzését, a konvolúciós, lefúrási és időbeli összehasonlítás analitikai műveleteit. Mindezeknek köszönhetően az OLAP rendszerek nagy előnyökkel bíró megoldást jelentenek az adat-előkészítés területén minden típusú üzleti jelentéshez, amely magában foglalja az adatok különböző szekciókban és különböző hierarchiaszinteken történő megjelenítését, mint például értékesítési jelentések, különféle költségvetési formák, ill. mások. Az OLAP rendszereknek nagy előnye van az ilyen ábrázolásnak az adatelemzés más formáiban, beleértve az előrejelzést is.

1.2 Meghatározás OLAP-rendszerek

A komplex többdimenziós adatelemzés technológiáját OLAP-nak nevezik. Az OLAP az adattárház-szervezet kulcsfontosságú összetevője.

Az OLAP funkcionalitás többféleképpen is megvalósítható, egyszerű módon, például adatelemzéssel az irodai alkalmazásokban, és bonyolultabbakkal - szervertermékeken alapuló elosztott analitikai rendszerekkel.

Az OLAP (On-LineAnalyticalProcessing) egy operatív analitikai adatfeldolgozási technológia, amely eszközöket és módszereket használ többdimenziós adatok gyűjtésére, tárolására és elemzésére a döntéshozatali folyamatok támogatására.

Az OLAP rendszerek fő célja az analitikai tevékenységek és a felhasználói elemzők tetszőleges lekérdezésének támogatása. Az OLAP elemzés célja a felmerülő hipotézisek tesztelése.

A nagy versenyfeltételek és a külső környezet növekvő dinamikája megnövekedett igényeket támaszt a vállalatirányítási rendszerekkel szemben. A vezetéselmélet és -gyakorlat fejlődését a működési hatékonyság növelését célzó új módszerek, technológiák, modellek megjelenése kísérte. A módszerek és modellek pedig hozzájárultak az analitikai rendszerek megjelenéséhez. Oroszországban nagy a kereslet az analitikai rendszerek iránt. Az alkalmazás szempontjából ezek a rendszerek a legérdekesebbek pénzügyi szektor: bankok, biztosítási üzletág, befektetési társaságok. Az analitikai rendszerek munkájának eredményeire elsősorban azoknak van szükségük, akiknek döntéseitől a vállalat fejlődése függ: vezetők, szakértők, elemzők. Az elemző rendszerek lehetővé teszik a konszolidáció, a jelentéskészítés, az optimalizálás és az előrejelzés problémáinak megoldását. Az analitikai rendszereknek mindmáig nem volt végleges osztályozása, ahogyan az ezen a területen használt fogalmak általános definíciórendszere sem. Egy vállalkozás információs struktúrája szintek sorozatával reprezentálható, amelyek mindegyikét az információfeldolgozás és -kezelés saját módja jellemzi, és megvan a maga funkciója az irányítási folyamatban. Így az analitikai rendszerek az infrastruktúra különböző szintjein hierarchikusan helyezkednek el.

Tranzakciós rendszerek szintje

Adattárház réteg

Data mart réteg

OLAP rendszerek szintje

Analitikai alkalmazási réteg

Az OLAP rendszerek - (OnLine Analytical Processing, analitikus feldolgozás jelen időkben) - komplex többdimenziós adatelemzés technológiája. Az OLAP rendszerek ott alkalmazhatók, ahol többtényezős adatok elemzésére van szükség. vannak hatékony gyógymód elemzés és jelentéskészítés. A fent tárgyalt adattárházak, adatpiacok és OLAP rendszerek az üzleti intelligencia (BI) rendszerekhez tartoznak.

Nagyon gyakran kiderül, hogy a döntéshozók közvetlen használatának elvárásával létrehozott információs és elemző rendszerek rendkívül könnyen használhatóak, de funkcionalitásukban erősen korlátozottak. Ilyen statikus rendszerek a szakirodalomban vezetői információs rendszereknek (ISR) vagy vezetői információs rendszereknek (EIS) nevezik. Előre definiált lekérdezéseket tartalmaznak, és bár elegendőek a mindennapi áttekintéshez, nem képesek megválaszolni a rendelkezésre álló adatokkal kapcsolatos minden olyan kérdést, amely a döntések meghozatalakor felmerülhet. Egy ilyen rendszer eredménye általában többoldalas jelentések, amelyek alapos tanulmányozása után az elemzőnek új kérdéssora van. Azonban minden olyan új kérést, amelyet egy ilyen rendszer tervezésekor nem láttak előre, először formálisan le kell írni, kódolni kell a programozónak, és csak ezután kell végrehajtani. A várakozási idő ebben az esetben órák és napok is lehet, ami nem mindig elfogadható. Így a statikus DSS külső egyszerűsége, amelyért az információs és elemző rendszerek legtöbb ügyfele aktívan küzd, a rugalmasság katasztrofális elvesztéséhez vezet.



A dinamikus DSS ezzel szemben a szabályozatlan (ad hoc) elemzői adatkérések feldolgozására összpontosít. Az ilyen rendszerekkel szemben támasztott követelményekkel E. F. Codd foglalkozott a legmélyebben abban a cikkben, amely megalapozta az OLAP koncepciót. Az elemzők munkája ezekkel a rendszerekkel a lekérdezések kialakításának és eredményeinek tanulmányozásának interaktív sorozatából áll.

A dinamikus DSS azonban nem csak az online analitikai feldolgozás (OLAP) területén működhet; A felhalmozott adatokon alapuló vezetői döntések támogatása három alapvető területen végezhető.

A részletes adatok köre. Ez a legtöbb információkereső rendszer hatóköre. A legtöbb esetben a relációs DBMS-ek jól megbirkóznak az itt felmerülő feladatokkal. A relációs adatok kezelésére szolgáló nyelv általánosan elfogadott szabványa az SQL. Az információkereső rendszerek, amelyek végfelhasználói felületet biztosítanak a részletes információkeresési feladatokhoz, kiegészítésként használhatók a tranzakciós rendszerek egyedi adatbázisaihoz és egy általános adattárházhoz.

Az összesített mutatók köre. Az adattárházban gyűjtött információk átfogó áttekintése, általánosítása és aggregálása, hiperkocka ábrázolása és többdimenziós elemzése az online analitikus feldolgozó (OLAP) rendszerek feladata. Itt vagy a speciális többdimenziós DBMS-ekre összpontosíthat, vagy a relációs technológiák keretein belül maradhat. A második esetben az előre összesített adatok gyűjthetők egy csillag alakú adatbázisban, vagy menet közben is elvégezhető az információs összesítés, miközben egy relációs adatbázisban részletes táblázatokat szkennelünk.

A minták szférája. A szellemi feldolgozás adatbányászati ​​módszerekkel (IDA, Adatbányászat), melynek fő feladata a felhalmozott információkban funkcionális és logikai minták keresése, a talált anomáliákat magyarázó és/vagy bizonyos folyamatok fejlődését előrejelző modellek, szabályok felépítése.

Operatív analitikai adatfeldolgozás

Az OLAP koncepció a többdimenziós adatábrázolás elvén alapul. E. F. Codd egy 1993-as cikkében foglalkozott a relációs modell hiányosságaival, elsősorban arra mutatva rá, hogy nem lehet „több dimenzióban, azaz a vállalati elemzők számára legérthetőbb módon kombinálni, megtekinteni és elemezni az adatokat”, és meghatározta Általános követelmények olyan OLAP rendszerekre, amelyek kibővítik a relációs DBMS-ek funkcionalitását, és egyik jellemzőjük a többdimenziós elemzés.

Az OLAP termékek osztályozása az adatszolgáltatás módja szerint.

Jelenleg nagyszámú termék van a piacon, amelyek valamilyen szinten biztosítják az OLAP funkcionalitását. A leghíresebbek közül körülbelül 30 szerepel a http://www.olapreport.com/ áttekintő webszerveren. Többdimenziós fogalmi nézet biztosítása kívülről felhasználói felület a forrásadatbázishoz minden OLAP-termék három osztályba van osztva a forrásadatbázis típusa szerint.

A legelső online analitikai feldolgozó rendszerek (például Arbor Software Essbase, Oracle Expressz szerver Oracle) a MOLAP osztályba tartoztak, vagyis csak saját többdimenziós adatbázisaikkal tudtak dolgozni. Ezek a többdimenziós DBMS-ek szabadalmaztatott technológiáján alapulnak, és a legdrágábbak. Ezek a rendszerek az OLAP feldolgozás teljes ciklusát biztosítják. A szerverkomponensen kívül magukban foglalják a saját integrált kliens interfészt vagy a használatot külső programok táblázatokkal dolgozik. Az ilyen rendszerek karbantartásához speciális alkalmazottakra van szükség a rendszer telepítéséhez, karbantartásához és adatnézetek létrehozásához a végfelhasználók számára.

A relációs online analitikai feldolgozó (ROLAP) rendszerek lehetővé teszik a relációs adatbázisban tárolt adatok többdimenziós formában történő megjelenítését, így az információ egy köztes metaadatrétegen keresztül többdimenziós modellré alakítható. A ROLAP rendszerek kiválóan alkalmasak nagy tárolóhelyiségekkel való munkavégzésre. A MOLAP rendszerekhez hasonlóan jelentős karbantartást igényelnek az informatikai szakemberektől, és többfelhasználós üzemeltetést igényelnek.

Végül a hibrid rendszereket (Hybrid OLAP, HOLAP) úgy tervezték, hogy egyesítsék az előző osztályokban rejlő előnyöket és minimalizálják a hátrányokat. A Speedware Media/MR-je ebbe az osztályba tartozik. A fejlesztők szerint egyesíti a MOLAP analitikai rugalmasságát és válaszidejét a ROLAP-ban rejlő valós adatokhoz való folyamatos hozzáféréssel.

Többdimenziós OLAP (MOLAP)

Az adatok többdimenziós megjelenítésén alapuló speciális DBMS-ekben az adatok nem relációs táblák, hanem rendezett többdimenziós tömbök formájában vannak rendezve:

1) hiperkockák (az adatbázisban tárolt összes cellának azonos méretűnek kell lennie, azaz a legteljesebb mérési alapon kell lennie) ill.

2) polikockák (mindegyik változót saját mérési sorozattal tárolunk, és minden kapcsolódó feldolgozási nehézség átkerül a rendszer belső mechanizmusaira).

A többdimenziós adatbázisok online analitikai feldolgozó rendszerekben való alkalmazása a következő előnyökkel jár.

Többdimenziós DBMS-ek használatakor az adatok keresése és lekérése sokkal gyorsabb, mint egy relációs adatbázis többdimenziós fogalmi nézete esetén, mivel a többdimenziós adatbázis denormalizált, előre összesített mérőszámokat tartalmaz, és optimalizált hozzáférést biztosít a kért cellákhoz.

A többdimenziós DBMS-ek könnyen megbirkóznak a beillesztés feladataival információs modell különféle beépített funkciókat, miközben objektíven meglévő korlátozások Az SQL nyelvek megnehezítik, sőt néha lehetetlenné teszik ezeknek a feladatoknak a relációs DBMS-eken alapuló végrehajtását.

Másrészt jelentős korlátok vannak.

A többdimenziós DBMS-ek nem teszik lehetővé a nagy adatbázisokkal való munkát. Ezenkívül a denormalizálás és az előre végrehajtott összesítés miatt a többdimenziós adatbázisban lévő adatok mennyisége általában (Codd becslése szerint) 2,5-100-szor kisebb, mint az eredeti részletes adatok mennyisége.

A relációs DBMS-ekhez képest a többdimenziós DBMS-eket nagyon nem hatékonyan használják külső memória. Az esetek túlnyomó részében az információs hiperkocka nagyon ritka, és mivel az adatok rendezett formában tárolódnak, a meghatározatlan értékek csak az optimális rendezési sorrend kiválasztásával távolíthatók el, amely lehetővé teszi az adatok legnagyobbba rendezését. lehetséges összefüggő csoportok. De még ebben az esetben is csak részben oldódik meg a probléma. Ezenkívül a ritka adatok tárolásának optimális rendezési sorrendje nagy valószínűséggel nem az a sorrend lesz, amelyet leggyakrabban használnak a lekérdezésekben. Ezért a valós rendszerekben kompromisszumot kell keresni a teljesítmény és az adatbázis által elfoglalt lemezterület redundanciája között.

Következésképpen a többdimenziós DBMS használata csak az alábbi feltételek mellett indokolt.

Az elemzéshez szükséges forrásadatok mennyisége nem túl nagy (nem több, mint néhány gigabájt), vagyis az adatok összesítése meglehetősen magas.

Az információdimenziók halmaza stabil (mivel szerkezetük bármilyen változása szinte mindig megköveteli a hiperkocka teljes átstrukturálását).

A rendszer szabályozatlan kérésekre adott válaszideje a legkritikusabb paraméter.

A hiperkocka cellákon végzett keresztdimenziós számítások elvégzéséhez komplex beépített függvények széleskörű használatát igényli, beleértve az egyéni függvények írásának lehetőségét is.

Relációs OLAP (ROLAP)

A relációs adatbázisok online analitikai feldolgozó rendszerekben való közvetlen felhasználása a következő előnyökkel jár.

A legtöbb esetben a vállalati adattárházakat relációs DBMS-eszközökkel valósítják meg, és a ROLAP-eszközök közvetlenül lehetővé teszik az elemzést. Ugyanakkor a tárhely mérete nem olyan kritikus paraméter, mint a MOLAP esetében.

A probléma változó dimenziója esetén, amikor gyakran kell változtatni a mérési struktúrán, R OLAP rendszerek dinamikus dimenzióábrázolással vannak optimális megoldás, mivel bennük az ilyen módosítások nem igénylik az adatbázis fizikai átszervezését.

A relációs DBMS-ek lényegesen többet nyújtanak magas szint adatvédelem és jó lehetőségeket hozzáférési jogok differenciálása.

A ROLAP fő hátránya a többdimenziós DBMS-ekhez képest az alacsonyabb teljesítmény. A MOLAP-pal összehasonlítható teljesítmény elérése érdekében a relációs rendszerek az adatbázisséma gondos megtervezését és az indexek konfigurálását igénylik, vagyis az adatbázis-adminisztrátorok nagy erőfeszítéseit. Csak csillagsémák használatával közelítheti meg a jól hangolt relációs rendszerek teljesítménye a többdimenziós adatbázisokon alapuló rendszerekét.

Az OLAP rendszer használata lehetővé teszi a szervezetirányítás stratégiai szintjének automatizálását. Az OLAP (Online Analytical Processing – valós idejű analitikai adatfeldolgozás) egy hatékony adatfeldolgozási és kutatási technológia. Az OLAP technológiára épülő rendszerek szinte korlátlan lehetőséget biztosítanak riportok készítésére, összetett elemző számítások elvégzésére, előrejelzések és forgatókönyvek készítésére, valamint számos lehetőség kidolgozására a tervekhez.

A teljes értékű OLAP rendszerek a 90-es évek elején jelentek meg, a döntéstámogató információs rendszerek fejlődésének eredményeként. Úgy tervezték őket, hogy különböző, gyakran eltérő adatokat alakítsanak át hasznos információ. Az OLAP-rendszerek bizonyos kritériumok szerint rendezhetik az adatokat. Nem szükséges azonban, hogy a kritériumok egyértelmű jellemzőkkel rendelkezzenek.

Az OLAP rendszerek a szervezet stratégiai menedzsmentjének számos kérdésében találtak alkalmazást: üzleti teljesítménymenedzsment, stratégiai tervezés, költségvetés, fejlesztési előrejelzés, pénzügyi kimutatások készítése, munkaelemzés, a szervezet külső és belső környezetének szimulációs modellezése, adattárolás. és a jelentéstétel.

Az OLAP rendszer felépítése

Az OLAP rendszer működése többdimenziós adattömbök feldolgozásán alapul. A többdimenziós tömbök úgy vannak megtervezve, hogy a tömb minden eleme sokféle kapcsolatban álljon más elemekkel. A többdimenziós tömb létrehozásához az OLAP rendszernek forrásadatokat kell szereznie más rendszerekről (például ERP vagy CRM rendszerekről), vagy külső bemeneten keresztül. Az OLAP rendszer használója kérésének megfelelően strukturált formában megkapja a szükséges adatokat. A megadott eljárás alapján el tudjuk képzelni az OLAP rendszer felépítését.

Általában az OLAP rendszer felépítése a következő elemekből áll:

  • adatbázis . Az adatbázis az OLAP rendszer működéséhez szükséges információforrás. Az adatbázis típusa az OLAP rendszer típusától és az OLAP szerver működési algoritmusaitól függ. Jellemzően relációs adatbázisokat, többdimenziós adatbázisokat, adattárházakat stb. használnak.
  • OLAP szerver. Ez biztosítja a többdimenziós adatstruktúra, valamint az adatbázis és az OLAP rendszer felhasználói közötti kapcsolat kezelését.
  • egyedi alkalmazások . Az OLAP rendszerstruktúrának ez az eleme kezeli a felhasználói kéréseket és generálja az adatbázis elérésének eredményeit (jelentések, grafikonok, táblázatok stb.)

Az adatok rendszerezési, feldolgozási és tárolási módjától függően az OLAP rendszerek is megvalósíthatók helyi számítógépek felhasználók vagy dedikált szerverek használatával.

Az adatok tárolásának és feldolgozásának három fő módja van:

  • helyileg. Az adatok a felhasználók számítógépére kerülnek. Az adatfeldolgozás, elemzés és kezelés a helyi munkaállomásokon történik. Az OLAP rendszer ezen felépítésének jelentős hátrányai vannak az adatfeldolgozás gyorsaságából, az adatbiztonságból és a többdimenziós elemzés korlátozott használatából eredően.
  • relációs adatbázisok. Ezeket az adatbázisokat használják együtt dolgozni OLAP rendszerek CRM rendszerrel vagy ERP rendszerrel. Az adatok ezen rendszerek szerverén relációs adatbázisok vagy adattárházak formájában kerülnek tárolásra. Az OLAP szerver hozzáfér ezekhez az adatbázisokhoz, hogy létrehozza a szükséges többdimenziós struktúrákat és elemzéseket végezzen.
  • többdimenziós adatbázisok. Ebben az esetben az adatok egy speciális adattárházba szerveződnek egy dedikált szerveren. Minden adatművelet ezen a szerveren történik, amely a forrásadatokat többdimenziós struktúrákká alakítja. Az ilyen szerkezeteket ún OLAP kocka. Az OLAP-kocka létrehozásának adatforrásai relációs adatbázisok és/vagy ügyfélfájlok. Az adatszerver az adatok előzetes előkészítését és feldolgozását végzi. Az OLAP-kiszolgáló egy OLAP-kockával működik anélkül, hogy közvetlenül hozzáférne az adatforrásokhoz (relációs adatbázisok, ügyfélfájlok stb.).

Az OLAP rendszerek típusai

Az adatok tárolásának és feldolgozásának módjától függően minden OLAP rendszer három fő típusra osztható.


1. ROLAP (Relational OLAP – relációs OLAP rendszerek) – ez a típusú OLAP rendszer relációs adatbázisokkal működik. Az adatok közvetlenül egy relációs adatbázisba kerülnek. Az adatok tárolása relációs táblák formájában történik. A felhasználók a hagyományos OLAP-rendszerekhez hasonlóan többdimenziós elemzést is végezhetnek. Ez SQL-eszközök és speciális lekérdezések használatával érhető el.

A ROLAP egyik előnye, hogy képes nagy mennyiségű adatot hatékonyabban feldolgozni. A ROLAP másik előnye a képesség hatékony feldolgozás numerikus és szöveges adatokat egyaránt.

A ROLAP hátrányai közé tartozik alacsony teljesítmény(a hagyományos OLAP rendszerekhez képest), mert Az adatfeldolgozást az OLAP szerver végzi. További hátrány az SQL használatából adódó korlátozott funkcionalitás.


2. MOLAP (Multidimensional OLAP - többdimenziós OLAP rendszerek). Az ilyen típusú OLAP rendszerek a hagyományos rendszerekre utalnak. A hagyományos OLAP rendszer és más rendszerek közötti különbség az adatok előzetes előkészítésében és optimalizálásában rejlik. Ezek a rendszerek általában egy dedikált szervert használnak, amelyen a Előzetes feldolgozás adat. Az adatok generálása ben történik többdimenziós tömbök– OLAP kockák.

A MOLAP rendszerek a leghatékonyabbak az adatfeldolgozásban, mert... megkönnyítik az adatok átszervezését és strukturálását a különféle felhasználói kéréseknek megfelelően. A MOLAP elemző eszközök lehetővé teszik összetett számítások elvégzését. A MOLAP másik előnye a gyors lekérdezések generálása és eredmények elérése. Ez az OLAP kockák előzetes kialakításával érhető el.

A MOLAP rendszer hátrányai közé tartozik a feldolgozott adatok mennyiségének korlátozása és az adatredundancia, mert A többdimenziós kockák kialakításához különböző szempontok szerint az adatokat meg kell duplikálni.


3. HOLAP (Hybrid OLAP - hibrid OLAP rendszerek). A hibrid OLAP rendszerek a ROLAP és a MOLAP rendszerek kombinációja. A hibrid rendszerekben két rendszer előnyeit próbálták ötvözni: a többdimenziós adatbázisok használatát és a relációs adatbázisok kezelését. A HOLAP rendszerek lehetővé teszik nagy mennyiségű adat tárolását relációs táblákban, a feldolgozott adatok pedig előre elkészített többdimenziós OLAP kockákba kerülnek. Az ilyen típusú rendszerek előnyei az adatok skálázhatósága, a gyors adatfeldolgozás és az adatforrásokhoz való rugalmas hozzáférés.

Vannak más típusú OLAP-rendszerek is, de ezek inkább a gyártók marketingfogásai, mintsem független típusú OLAP-rendszerek.

Ezek a típusok a következők:

  • WOLAP (Web OLAP). Az OLAP rendszer nézete webes támogatás felület. Ezek az OLAP rendszerek képesek az adatbázisokhoz webes felületen keresztül hozzáférni.
  • DOLAP (asztali OLAP). Az ilyen típusú OLAP rendszer lehetővé teszi a felhasználók számára, hogy letöltsenek egy adatbázist egy helyi munkaállomásra, és helyileg dolgozzanak vele.
  • MobileOLAP. Ez az OLAP-rendszerek olyan funkciója, amely lehetővé teszi, hogy az adatbázissal távolról, mobil eszközök segítségével dolgozzon.
  • SOLAP (Térbeli OLAP). Ezt a típusú OLAP rendszert térbeli adatok feldolgozására tervezték. A földrajzi információs rendszerek és az OLAP rendszerek integrációjának eredményeként jelent meg. Ezek a rendszerek lehetővé teszik az adatok feldolgozását nem csak alfanumerikus formátumban, hanem vizuális objektumok és vektorok formájában is.

Az OLAP rendszer előnyei

Az OLAP rendszer használata lehetővé teszi a szervezet számára, hogy előre jelezze és elemezze a jelenlegi tevékenységekkel és fejlesztési kilátásokkal kapcsolatos különféle helyzeteket. Ezek a rendszerek a vállalati szintű automatizálási rendszerek kiegészítésének tekinthetők. Az OLAP rendszerek minden előnye közvetlenül függ a forrásadatok pontosságától, megbízhatóságától és mennyiségétől.

Az OLAP rendszer fő előnyei:

  • a kezdeti információk és az elemzési eredmények következetessége. Egy OLAP rendszerrel mindig lehetséges az információforrás nyomon követése és a kapott eredmények és a forrásadatok közötti logikai kapcsolat meghatározása. Az elemzési eredmények szubjektivitása csökken.
  • többváltozós elemzés elvégzése. Az OLAP-rendszer használata lehetővé teszi, hogy számos forgatókönyvet kapjon az események fejlesztésére a forrásadatok alapján. Az elemző eszközök segítségével szituációkat szimulálhat a „mi lesz, ha” elv alapján.
  • részletkezelés. A bemutatott eredmények részletessége a felhasználók igényeitől függően változhat. Nincs szükség összetett rendszerbeállítások elvégzésére és a számítások megismétlésére. A jelentés pontosan a döntéshozatalhoz szükséges információkat tartalmazhatja.
  • rejtett függőségek azonosítása. A többdimenziós kapcsolatok kiépítésével lehetővé válik a rejtett függőségek azonosítása és meghatározása különféle folyamatokban vagy helyzetekben, amelyek befolyásolják a termelési tevékenységeket.
  • egységes platform létrehozása. Az OLAP rendszer használatával lehetővé válik egy egységes platform létrehozása a vállalat összes előrejelzési és elemzési folyamatához. Különösen az OLAP rendszeradatok képezik az alapját a költségvetési előrejelzések, az értékesítési előrejelzések, a beszerzési előrejelzések, a stratégiai fejlesztési tervek stb.