OLAP tehnologija. OLAP tehnologija olap tehnologije i višedimenzionalni modeli podataka

23.02.2021 Savjet

Godine 1993. utemeljitelj relacijskog pristupa izgradnji baze podataka, Edgar Codd i njegovi partneri (Edgar Codd, matematičar i IBM-ov stipendist), objavili su članak na inicijativu Arbor Software (danas poznata tvrtka Hyperion Solutions), pod naslovom "Pružanje OLAP-a ( online analitička obrada) za analitičke korisnike", koji je formulirao 12 značajki OLAP tehnologije, koje su naknadno dopunjene s još šest. Ove odredbe postale su glavni sadržaj nove i vrlo obećavajuće tehnologije.

Glavne značajke OLAP tehnologije (Basic):

  • višedimenzionalni konceptualni prikaz podataka;
  • intuitivno rukovanje podacima;
  • dostupnost i detaljnost podataka;
  • grupno izdvajanje podataka vs. tumačenje;
  • OLAP modeli analize;
  • arhitektura klijent-poslužitelj (OLAP dostupan s radne površine);
  • transparentnost (transparentan pristup vanjskim podacima);
  • podrška za više korisnika.

Posebne značajke:

  • obrada neformaliziranih podataka;
  • spremanje OLAP rezultata: njihovo pohranjivanje odvojeno od izvornih podataka;
  • isključivanje vrijednosti koje nedostaju;
  • Rukovanje vrijednostima koje nedostaju.

Značajke prezentacije izvješća:

  • fleksibilnost u izvješćivanju;
  • standardna izvedba izvješćivanja;
  • automatsko podešavanje fizička razina ekstrakcija podataka.

Upravljanje dimenzijama:

  • univerzalnost mjerenja;
  • neograničen broj dimenzija i razina agregacije;
  • neograničen broj operacija između dimenzija.

Povijesno gledano, danas pojam "OLAP" podrazumijeva ne samo višedimenzionalni prikaz podataka od krajnjeg korisnika, već i višedimenzionalni prikaz podataka u ciljnoj bazi podataka. Upravo zbog toga su se pojmovi “Relational OLAP” (ROLAP) i “Multidimensional OLAP” (MOLAP) pojavili kao samostalni pojmovi.

OLAP servis je alat za analizu velikih količina podataka u stvarnom vremenu. Interakcijom s OLAP sustavom korisnik će moći fleksibilno pregledavati informacije, dobivati ​​proizvoljne presjeke podataka i izvoditi analitičke operacije drill-down, roll-up, end-to-end distribucije i usporedbe tijekom vremena koristeći mnoge parametre istovremeno. Sav rad s OLAP sustavom odvija se u uvjetima predmetno područje i omogućuje vam da izgradite statistički pouzdane modele poslovne situacije.

Softver OLAP je alat za operativnu analizu podataka sadržanih u skladištu. Glavna značajka je da ovi alati nisu namijenjeni za korištenje stručnjaku u području informacijske tehnologije, ne stručnjaku za statistiku, već profesionalcu u primijenjenom području menadžmenta - voditelju odjela, odjela, uprave i , konačno, redatelj. Alati su dizajnirani da omoguće analitičaru komunikaciju s problemom, a ne s računalom. Na sl. Slika 6.14 prikazuje osnovnu OLAP kocku koja vam omogućuje procjenu podataka duž tri dimenzije.


Višedimenzionalna OLAP kocka i sustav odgovarajućih matematičkih algoritama statistička obrada omogućuje analizu podataka bilo koje složenosti u bilo kojem vremenskom intervalu.

Riža. 6.14. Elementarna OLAP kocka

Imajući na raspolaganju fleksibilne mehanizme za manipulaciju podacima i vizualni prikaz (sl. 6.15, sl. 6.16), menadžer najprije iz različitih kutova ispituje podatke koji mogu (ili ne moraju) biti povezani s problemom koji se rješava.

Zatim uspoređuje različite poslovne pokazatelje međusobno, pokušavajući identificirati skrivene odnose; može pobliže, detaljnije pogledati podatke, na primjer, rastaviti ih na komponente prema vremenu, regiji ili kupcu ili, obrnuto, dodatno generalizirati prezentaciju informacija kako bi uklonio detalje koji odvlače pažnju. Nakon toga se pomoću modula za statističku procjenu i simulaciju konstruira nekoliko opcija za razvoj događaja i od njih se odabire najprihvatljivija opcija.

Riža. 6.15.

Direktor tvrtke, na primjer, može imati hipotezu da širenje rasta imovine u različitim granama tvrtke ovisi o omjeru stručnjaka s tehničkim i ekonomsko obrazovanje. Kako bi testirao ovu hipotezu, upravitelj može zatražiti od skladišta i prikazati na grafikonu omjer kamata za one podružnice čiji je rast imovine u tekućem tromjesečju smanjen za više od 10% u usporedbi s prošlom godinom, i za one koje su porasle za više od 25%. Trebao bi moći koristiti jednostavan odabir iz ponuđenog izbornika. Ako dobiveni rezultati značajno spadaju u dvije korespondentne skupine, to bi trebao biti poticaj za daljnje testiranje postavljene hipoteze.

Trenutno se ubrzano razvija smjer koji se zove dinamičko modeliranje (Dynamic Simulation), koji u potpunosti implementira gore spomenuti FASMI princip.

Koristeći dinamičko modeliranje, analitičar gradi model poslovne situacije koja se razvija tijekom vremena, prema određenom scenariju. Štoviše, rezultat takvog modeliranja može biti nekoliko novih poslovnih situacija koje generiraju stablo moguća rješenja uz procjenu vjerojatnosti i izgleda svake od njih.

Riža. 6.16. Analitički IS za ekstrakciju podataka, obradu i prezentaciju informacija

Tablica 6.3 pokazuje komparativne karakteristike statička i dinamička analiza.

dirigiranje

Puno se pisalo o OLAP-u u posljednje vrijeme. Možemo reći da postoji neki boom oko ovih tehnologija. Istina, za nas je taj bum nešto zakasnio, ali to je, naravno, povezano s općim stanjem u zemlji.

Informacijski sustavi na razini poduzeća u pravilu sadrže aplikacije namijenjene složenoj višedimenzionalnoj analizi podataka, njihove dinamike, trendova itd. Takva analiza u konačnici ima za cilj podržati donošenje odluka. Ti se sustavi često nazivaju sustavima za podršku odlučivanju.

Sustavi za podršku odlučivanju obično imaju sredstva da korisniku daju skupne podatke za različite uzorke iz izvornog skupa u obliku pogodnom za percepciju i analizu. U pravilu, takve agregatne funkcije tvore višedimenzionalni (i stoga nerelacijski) skup podataka (često zvan hiperkocka ili metakocka), čije osi sadrže parametre, a ćelije sadrže agregirane podatke ovisne o njima - i takvi podaci mogu se pohraniti i u relacijske tablice, ali u ovom slučaju govorimo o logičkoj organizaciji podataka, a ne o fizičkoj implementaciji njihove pohrane). Uzduž svake osi podaci se mogu organizirati u hijerarhiju koja predstavlja različite razine detalja. Zahvaljujući ovom modelu podataka, korisnici mogu formulirati složene upite, generirati izvješća i dobiti podskupove podataka.

Tehnologija za složenu višedimenzionalnu analizu podataka naziva se OLAP (On-Line Analytical Processing).

OLAP je ključna komponenta skladištenja podataka.

Koncept OLAP-a opisao je 1993. Edgar Codd, poznati istraživač baza podataka i autor relacijskog podatkovnog modela (vidiE.F. Codd, S.B. Codd i C.T. Salley, Pružanje OLAP-a (on-line analitička obrada) korisnicima-analitičarima: IT mandat. Tehničko izvješće, 1993).

Godine 1995., na temelju zahtjeva koje je postavio Codd, formuliran je takozvani FASMI test (Fast Analysis of Shared Multidimensional Information) koji uključuje sljedeće zahtjeve za aplikacije za višedimenzionalnu analizu:

· pružanje korisniku rezultata analize u prihvatljivom vremenu (obično ne duljem od 5 s), čak i po cijenu manje detaljne analize;

· sposobnost provedbe bilo kojeg logičkog i Statistička analiza specifičan za određenu aplikaciju i njegovo spremanje u obliku dostupnom krajnjem korisniku;

· višekorisnički pristup podacima s podrškom za odgovarajuće mehanizme zaključavanja i sredstva ovlaštenog pristupa;

· višedimenzionalni konceptualni prikaz podataka, uključujući punu podršku za hijerarhije i višestruke hijerarhije (ovo je ključni zahtjev OLAP-a);

· mogućnost pristupa svim potrebnim informacijama, bez obzira na njihov volumen i mjesto pohrane.

Treba napomenuti da se OLAP funkcionalnost može implementirati različiti putevi, počevši od najjednostavnijih alata za analizu podataka u uredskim aplikacijama i završavajući s distribuiranim analitičkim sustavima temeljenim na poslužiteljskim proizvodima. Korisnici mogu jednostavno vidjeti podatke u višedimenzionalnoj strukturi koja se odnosi na njihove probleme.

2. Što je OLAP

OLAP je skraćenica za engleski On-Line Analytical Processing - ovo nije naziv određenog proizvoda, već cijele tehnologije. Na ruskom je najprikladnije nazvati OLAP operativnom analitičkom obradom. Iako se u nekim publikacijama analitička obrada naziva i online i interaktivnom, pridjev “online” najtočnije odražava značenje OLAP tehnologije.

Razvoj upravljačkih rješenja od strane menadžera spada u područja koja je najteže automatizirati. Međutim, danas postoji mogućnost pomoći menadžeru u izradi rješenja i, što je najvažnije, značajno ubrzati proces izrade rješenja, njihov odabir i usvajanje. Za ovo možete koristiti OLAP.

Pogledajmo kako se obično odvija proces razvoja rješenja.

Povijesno gledano, najrazvijenija su rješenja za automatizaciju operativnih aktivnosti. Riječ je o transakcijskim sustavima za obradu podataka (OLTP), jednostavnije nazvanim operativnim sustavima. Ovi sustavi osiguravaju bilježenje određenih činjenica, njihovu kratkoročnu pohranu i čuvanje u arhivima. Osnovu takvih sustava čine sustavi za upravljanje relacijskim bazama podataka (RDBMS). Tradicionalni pristup je pokušaj korištenja već izgrađenih operativnih sustava za podršku donošenju odluka. Obično pokušavaju izgraditi razvijeni sustav upita operativnom sustavu i izravno koristiti izvješća dobivena nakon tumačenja za podršku odlukama. Izvješća se mogu izraditi na prilagođenoj osnovi, tj. menadžer zahtijeva izvješće, i to redovito, kada se izvješća grade na temelju postignuća određenih događaja ili vremena. Na primjer, tradicionalni proces podrške odlučivanju može izgledati ovako: menadžer odlazi do stručnjaka za informatiku i dijeli mu svoje pitanje. Zatim stručnjak odjela za informiranje sastavlja zahtjev operativnom sustavu, prima elektroničko izvješće, tumači ga i zatim ga stavlja na raspolaganje rukovodećem osoblju. Naravno, takva shema u određenoj mjeri pruža podršku odlučivanju, ali ima izuzetno nisku učinkovitost i ogroman broj nedostataka. Male količine podataka koriste se za podršku odlukama kritičnim za misiju. Postoje i drugi problemi. Ovaj proces je vrlo spor, jer je proces pisanja zahtjeva i tumačenja elektroničkog izvješća dugotrajan. Potrebno je mnogo dana, u vrijeme kada upravitelj možda treba donijeti odluku sada, odmah. Ako uzmemo u obzir da voditelja, nakon što primi izvješće, može zanimati neko drugo pitanje (recimo, pojašnjenje ili zahtijevanje razmatranja podataka u drugom kontekstu), tada bi se ovaj spori ciklus trebao ponoviti, a budući da proces analize podataka operativni sustavi dogodit će se iterativno, tada će se potrošiti još više vremena. Drugi problem je problem različitih područja djelovanja specijalista informacijska tehnologija i vođa, koji mogu razmišljati u različitim kategorijama i, kao rezultat toga, ne razumiju jedni druge. Tada će biti potrebne dodatne razjašnjavajuće iteracije, a to je opet vrijeme kojeg uvijek nedostaje. Drugi veliki problem je to što su izvješća teška za razumijevanje. Voditelj nema vremena odabrati brojke od interesa iz izvješća, pogotovo jer ih može biti previše (sjetite se ogromnih izvješća s više stranica u kojima se zapravo koristi nekoliko stranica, a ostale se koriste za svaki slučaj). Također napominjemo da posao usmenog prevođenja najčešće pada na stručnjake u informatičkim odjelima. To jest, kompetentni stručnjak je ometen rutinskim i neučinkovitim radom na crtanju dijagrama itd., Što, naravno, ne može imati povoljan učinak na njegove kvalifikacije. Osim toga, nije tajna da u lancu tumačenja postoje dobronamjernici zainteresirani za namjerno iskrivljavanje dolaznih informacija.

Navedeni nedostaci tjeraju nas na razmišljanje o ukupnoj učinkovitosti operacijskog sustava i troškovima povezanim s njegovim postojanjem, budući da se ispostavlja da troškovi izrade operativnog sustava nisu adekvatno kompenzirani učinkovitošću njegovog rada.

U stvarnosti ti problemi nisu posljedica loše kvalitete operativnog sustava ili njegove neuspješne konstrukcije. Korijeni problema leže u temeljnoj razlici između operativnih aktivnosti koje automatizira operativni sustav i aktivnosti koje razvijaju i donose odluke. Ta razlika leži u činjenici da su podaci operacijskog sustava samo zapisi određenih događaja i činjenica koje su se dogodile, ali ne i informacije u općem smislu te riječi. Informacija je nešto što smanjuje neizvjesnost u bilo kojem području. I bilo bi jako lijepo kada bi informacije smanjile nesigurnost u području donošenja odluka. Poznati E.F. jednom je govorio o nepodobnosti operativnih sustava izgrađenih na RDBMS-u za tu svrhu. Codd, pionir tehnologije sustava upravljanja relacijskim bazama podataka u 1970-ima: "Iako su sustavi upravljanja relacijskim bazama podataka dostupni korisnicima, nikada nisu bili prepoznati kao pružatelji moćnih sposobnosti sinteze, analize i konsolidacije (funkcije koje se nazivaju višedimenzionalna analiza podataka)". Govorimo konkretno o sintezi informacija, o pretvaranju podataka iz operativnih sustava u informacije, pa čak i u kvalitativne procjene. OLAP omogućuje ovu transformaciju.

OLAP se temelji na ideji višedimenzionalnog modela podataka. Ljudsko razmišljanje je višedimenzionalno po definiciji. Kada osoba postavlja pitanja, ona nameće ograničenja, formulirajući pitanja u više dimenzija, pa je proces analize u višedimenzionalnom modelu vrlo blizak stvarnosti ljudskog razmišljanja. Prema dimenzijama u višedimenzionalnom modelu iscrtavaju se čimbenici koji utječu na aktivnosti poduzeća (na primjer: vrijeme, proizvodi, podružnice poduzeća, geografija itd.). Na taj način se dobije hiperkocka (naravno, naziv nije baš uspješan, jer se pod kockom obično podrazumijeva figura jednakih bridova, što je u ovom slučaju daleko od slučaja), koja se zatim puni pokazatelji aktivnosti poduzeća (cijene, prodaja, plan, dobit, gubici itd.). Ovo se može ispuniti i stvarnim podacima iz operativnih sustava i podacima predviđanja temeljenim na povijesnim podacima. Dimenzije hiperkocke mogu biti složene, hijerarhijske i među njima se mogu uspostaviti odnosi. Tijekom procesa analize korisnik može promijeniti kut gledanja na podatke (tzv. operacija promjene logičkog prikaza), čime podatke promatra iz različitih perspektiva i rješava konkretne probleme. Na kockama se mogu izvoditi različite operacije, uključujući predviđanje i uvjetno planiranje (analiza što-ako). Štoviše, operacije se izvode istovremeno na kockama, tj. umnožak će, na primjer, rezultirati umnoškom hiperkocke, čija je svaka stanica umnožak stanica odgovarajućih hiperkocki množitelja. Naravno, moguće je izvoditi operacije na hiperkockama koje imaju različit broj dimenzija.

3. Povijest nastanka OLAP tehnologije

Ideja obrade podataka na višedimenzionalnim nizovima nije nova. Zapravo, datira iz 1962. godine, kada je Ken Iverson objavio svoju knjigu “Programski jezik” (APL). Prva praktična implementacija APL-a održana je u kasnim šezdesetima od strane IBM-a. APL je vrlo elegantan, matematički definiran jezik s višedimenzionalnim varijablama i obrađenim operacijama. Namijenjen je da bude originalan, moćan alat za rad s višedimenzionalnim transformacijama u usporedbi s drugim praktičnim programskim jezicima.

Međutim, ideja dugo vremena nije dobio široku upotrebu, jer još nije došlo vrijeme za grafička sučelja i visokokvalitetne uređaje za ispis, a prikaz grčkih znakova zahtijevao je posebne zaslone, tipkovnice i uređaje za ispis. Kasnije su se engleske riječi ponekad koristile za zamjenu grčkih operatora, ali čistunci APL-a zaustavili su pokušaje popularizacije svog omiljenog jezika. APL je također trošio resurse stroja. U to je vrijeme bilo skupo za korištenje. Programi su se vrlo sporo izvršavali, a uz to je njihovo pokretanje bilo vrlo skupo. Bilo je potrebno mnogo memorije, za to vrijeme šokantne količine (oko 6 MB).

Međutim, frustracija tih početnih pogrešaka nije ubila ideju. Korišten je u mnogim poslovnim aplikacijama 70-ih, 80-ih. Mnoge od tih aplikacija imale su značajke modernih sustava analitičke obrade. Tako se razvio IBM operacijski sustav za APL, nazvan VSPC, a neki su ga ljudi smatrali idealnim okruženjem za osobnu upotrebu sve dok proračunske tablice nisu postale sveprisutne.

Ali APL je bio pretežak za korištenje, pogotovo zato što je svaki put bilo nedosljednosti između samog jezika i hardvera na kojem se pokušavao implementirati.

U 1980-ima APL je postao dostupan na osobnim računalima, ali nije našao tržišnu primjenu. Alternativa je bila programirati višedimenzionalne aplikacije koristeći nizove na drugim jezicima. To je bio vrlo težak zadatak čak i za profesionalne programere, prisiljavajući ih da čekaju sljedeću generaciju višedimenzionalnih softverskih proizvoda.

Godine 1972. nekoliko višedimenzionalnih aplikacijskih softverskih proizvoda koji su se prethodno koristili u obrazovne svrhe našlo je komercijalnu upotrebu: Express. I sada ostaje u potpuno prepisanom obliku, ali izvorni koncepti 70-ih više nisu relevantni. Danas, u 90-ima, Express je jedna od najpopularnijih OLAP tehnologija, a Oracle(r) će je promovirati i dodati nove mogućnosti.

Više višedimenzionalnih proizvoda pojavilo se 80-ih. Početkom desetljeća pojavio se proizvod nazvan Stratagem, kasnije nazvan Acumate (danas u vlasništvu Kenan Technologies), koji se još promovirao do ranih 90-ih, ali se danas, za razliku od Expressa, praktički ne koristi.

Comshare System W bio je višedimenzionalni proizvod drugačijeg stila. Predstavljen 1981., bio je prvi koji se više usredotočio na krajnjeg korisnika i razvoj financijskih aplikacija. Uveo je mnoge koncepte koji nisu dobro usvojeni, kao što su potpuno neproceduralna pravila, pregled preko cijelog zaslona i uređivanje višedimenzionalnih podataka, automatsko ponovno izračunavanje i skupna integracija s relacijskim podacima. Međutim, Comshare System W bio je prilično težak za hardver tog vremena u usporedbi s drugim proizvodima te se manje koristio u budućnosti, prodavao sve manje i nikakva poboljšanja na proizvodu. Iako je još uvijek dostupan na UNIX-u, nije klijent-poslužitelj, što ne poboljšava njegovu ponudu na tržištu analitike. U kasnim 1980-ima, Comshare je izdao proizvod za DOS i kasnije za Windows. Ti su proizvodi nazvani Commander Prism i koristili su iste koncepte kao System W.

Drugi kreativni proizvod kasnih 80-ih zvao se Metafora. Namijenjen je profesionalnim trgovcima. Također je uveo mnoge nove koncepte koji se danas tek počinju široko koristiti: klijentsko-poslužiteljsko računalstvo, korištenje višedimenzionalnog modela na relacijskim podacima, objektno orijentirani razvoj aplikacija. Međutim, tadašnji standardni hardver osobnih računala nije mogao pokretati Metaphor, pa su dobavljači bili prisiljeni razviti vlastite standarde za osobna računala i mreže. Metaphor je postupno počeo uspješno raditi na serijskim osobnim strojevima, no proizvod je bio napravljen isključivo za OS/2 i imao je vlastito grafičko korisničko sučelje.

Metaphor je tada ušao u marketinški savez s IBM-om, koji je kasnije apsorbirao. Sredinom 1994. IBM je odlučio integrirati Metaphor tehnologiju (preimenovanu u DIS) sa svojim budućim tehnologijama i time prestati financirati zasebnu liniju, ali kupci su izrazili svoje nezadovoljstvo i zahtijevali nastavak podrške za proizvod. Nastavljena je podrška za preostale kupce, a IBM je ponovno izdao proizvod pod novim imenom DIS, što ga, međutim, nije učinilo popularnim. Ali Metaphorovi kreativni, inovativni koncepti nisu zaboravljeni i vidljivi su u mnogim proizvodima danas.

Sredinom 80-ih rođen je pojam EIS (Executive Information System). Prvi proizvod koji je jasno pokazao ovaj smjer bio je Pilotov zapovjedni centar. Bio je to proizvod koji je omogućio kolaborativno računalstvo, ono što danas nazivamo klijent-poslužitelj računalstvom. Budući da je snaga osobnih računala 1980-ih bila ograničena, proizvod je bio vrlo "usmjeren na poslužitelj", ali ovaj je princip i danas vrlo popularan. Pilot nije dugo prodavao Command Center, ali je uveo mnoge koncepte koji se mogu prepoznati u današnjim OLAP proizvodima, uključujući automatsku podršku za vremenske intervale, višedimenzionalne izračune klijent-poslužitelj i pojednostavljenu kontrolu procesa analize (miš, ekrani osjetljivi na dodir , itd.). Neki od ovih koncepata ponovno su primijenjeni kasnije u Pilot Analysis Serveru.

U kasnim 1980-ima, proračunske tablice dominirale su tržištem alata koji pružaju analizu krajnjim korisnicima. Prvu višedimenzionalnu proračunsku tablicu predstavio je Compete. Reklamirao se kao vrlo skup proizvod za profesionalce, ali dobavljači nisu uspjeli osigurati da proizvod osvoji tržište, a Computer Associates je stekao prava na njega zajedno s drugim proizvodima uključujući Supercalc i 20/20. Glavni učinak akvizicije CA Compete bilo je oštro smanjenje cijene i uklanjanje zaštite od kopiranja, što je naravno pridonijelo njegovoj distribuciji. Međutim, nije bilo uspješno. Compete je osnova Supercalca 5, ali se ne promiče njegov višedimenzionalni aspekt. Stari Compete još uvijek se ponekad koristi zbog činjenice da su u njega svojevremeno uložena znatna sredstva.

Lotus je bio sljedeći koji je pokušao ući na tržište višedimenzionalnih proračunskih tablica sa svojim proizvodom Improv, koji radi na NeXT stroju. To je osiguralo, u najmanju ruku, da prodaja 1-2-3 neće pasti, ali kada je konačno objavljen za Windows, Excel je već imao veliki tržišni udio, sprječavajući Lotus da napravi bilo kakve promjene u tržišnoj distribuciji. Lotus je, kao i CA s Competeom, preselio Improv u donji dio tržišta, ali to nije bio uvjet za uspješnu tržišnu promociju, a novi razvoji na ovom području nisu se nastavljali. Ispostavilo se da korisnici osobnih računala preferiraju proračunske tablice 1-2-3 i nisu bili zainteresirani za nove multivarijatne mogućnosti osim ako nisu u potpunosti kompatibilne s njihovim starim proračunskim tablicama. Isto tako, koncepti malih proračunskih tablica za stolna računala koji se nude kao osobne aplikacije nisu se baš pokazali prikladnima niti su prihvaćeni u stvarnom poslovnom svijetu. Microsoft (r) slijedio je ovaj put dodajući zaokretne tablice (u ruskom izdanju ovo se zove " stožerne tablice") u Excel. Iako malobrojni Korisnici programa Excel koristio ovom značajkom, ovo je vjerojatno jedini put da se mogućnosti multivarijatne analize naširoko koriste u svijetu, jednostavno zato što postoji toliko mnogo korisnika programa Excel u svijetu.

4. OLAP, ROLAP, MOLAP…

Dobro je poznato da su, kada je Codd objavio svoja pravila za izgradnju relacijskih DBMS-ova 1985. godine, izazvala snažnu reakciju i potom imala snažan utjecaj na industriju DBMS-a općenito. Međutim, malo ljudi zna da je 1993. godine Codd objavio rad pod naslovom “OLAP za korisničke analitičare: što bi trebao biti”. U njemu je iznio osnovne koncepte online analitike i definirao 12 pravila koja moraju ispunjavati proizvodi koji pružaju mogućnosti online analitike.

Ovo su pravila (izvorni tekst je sačuvan kad god je to moguće):

1. Konceptualni višedimenzionalni prikaz. Korisnik-analitičar vidi svijet poduzeća kao višedimenzionalan po prirodi. Sukladno tome, OLAP model mora biti višedimenzionalan u svojoj srži. Višedimenzionalni konceptualni dijagram ili prilagođeni prikaz olakšava modeliranje i analizu, kao i izračune.

2. Transparentnost. Bez obzira je li OLAP proizvod dio korisničkih alata ili ne, ta činjenica mora biti transparentna korisniku. Ako OLAP pruža klijentsko-poslužiteljsko računalstvo, tada bi i ta činjenica, ako je moguće, trebala biti nevidljiva korisniku. OLAP mora biti osiguran u kontekstu istinski otvorene arhitekture, dopuštajući korisniku, gdje god se nalazio, da putem analitičkog alata komunicira s poslužiteljem. Nadalje, transparentnost treba postići kada analitički alat komunicira s homogenim i heterogenim okruženjima baze podataka.

3. Dostupnost. Korisnik OLAP analitičara mora biti u mogućnosti izvoditi analize temeljene na zajedničkoj konceptualnoj shemi koja sadrži podatke za cijelo poduzeće u relacijskoj bazi podataka kao i podatke iz naslijeđenih naslijeđenih baza podataka, zajedničkih metoda pristupa i zajedničkog analitičkog modela. To znači da OLAP mora osigurati vlastitu logičku shemu za pristup u heterogenom okruženju baze podataka i izvršiti odgovarajuće transformacije za pružanje podataka korisniku. Štoviše, potrebno je unaprijed voditi računa o tome gdje će se i kako te kakve vrste fizičke organizacije podataka zapravo koristiti. OLAP sustav bi trebao pristupati samo podacima koji su stvarno potrebni, umjesto usvajanja općeg pristupa "kuhinjskog lijevka" koji uvodi nepotreban unos.

4. Dosljedna izvedba u razvoju izvješća. Ako se broj dimenzija ili veličina baze podataka poveća, korisnički analitičar ne bi trebao doživjeti nikakvo značajno smanjenje performansi. Konzistentna izvedba je ključna uz zadržavanje jednostavnosti korištenja za krajnjeg korisnika i ograničavanje složenosti OLAP-a. Ako korisnik-analitičar iskusi značajne razlike u izvedbi prema broju dimenzija, tada će nastojati kompenzirati te razlike strategijom dizajna, što će uzrokovati da se podaci prikazuju na različite načine od načina na koji podaci zapravo treba predstaviti. Trošenje vremena na puzanje po sustavu kako bi se kompenzirale njegove nedostatke nije ono za što su analitički proizvodi dizajnirani.

5. Arhitektura klijent-poslužitelj. Većina podataka koje je danas potrebno brzo i analitički obraditi pohranjuje se na glavnim računalima s pristupom računalu. To stoga znači da OLAP proizvodi moraju moći raditi u okruženju klijent-poslužitelj. S ove točke gledišta, potrebno je da poslužiteljska komponenta analitičkog alata bude bitno "inteligentna" kako bi se različiti klijenti mogli spojiti na poslužitelj uz minimalnu složenost i integracijsko programiranje. Inteligentni poslužitelj mora biti u stanju mapirati i konsolidirati različite logičke i fizičke sheme baze podataka. To će osigurati transparentnost i izgraditi zajednički konceptualni, logički i fizički okvir.

6. Opća višedimenzionalnost. Svaka se dimenzija mora primijeniti bez obzira na njezinu strukturu i operativne mogućnosti. Dodatne operativne mogućnosti mogu se pružiti odabranim dimenzijama, a budući da su dimenzije simetrične, jedna se funkcija može pružiti bilo kojoj dimenziji. Osnovne strukture podataka, formule i formati izvješća ne bi trebali biti pristrani prema bilo kojoj dimenziji.

7. Dinamička kontrola rijetkih matrica. Fizički dizajn OLAP alata mora biti u potpunosti prilagođen specifičnom analitičkom modelu za optimalno upravljanje rijetkim matricama. Za svaku danu rijetku matricu postoji jedna i samo jedna optimalna fizikalna shema. Ova shema osigurava maksimalnu učinkovitost memorije i operativnost matrice, osim ako, naravno, cijeli skup podataka ne stane u memoriju. Temeljni fizički podaci OLAP alata moraju biti konfigurirani na bilo koji podskup dimenzija, bilo kojim redoslijedom, za praktične operacije na velikim analitičkim modelima. Metode fizičkog pristupa također bi se trebale dinamički mijenjati i sadržavati različite vrste mehanizama, kao što su: izravni izračuni, B-stabla i izvedenice, raspršivanje i mogućnost kombiniranja tih mehanizama ako je potrebno. Rijetkost (mjerena kao postotak praznih ćelija u odnosu na sve moguće ćelije) jedna je od karakteristika širenja podataka. Neuspjeh u reguliranju rijetkosti može učiniti operativnu učinkovitost nedostižnom. Ako OLAP alat ne može kontrolirati i regulirati distribuciju vrijednosti analiziranih podataka, model koji tvrdi da je praktičan, temeljen na mnogim putovima i dimenzijama konsolidacije, može u stvarnosti biti nepotreban i beznadan.

8. Podrška za više korisnika. Često više analitičkih korisnika treba surađivati ​​s istim analitičkim modelom ili stvarati različite modele iz istih podataka. Stoga, OLAP alat mora omogućiti dijeljenje (upiti i dovršetak), cjelovitost i sigurnosne mogućnosti.

9. Neograničene križne operacije. Različite razine skupljanja i putovi konsolidacije, zbog svoje hijerarhijske prirode, predstavljaju ovisne odnose u OLAP modelu ili aplikaciji. Stoga bi sam alat trebao podrazumijevati odgovarajuće izračune, a ne zahtijevati od analitičkog korisnika da redefinira te izračune i operacije. Izračuni koji ne proizlaze iz ovih naslijeđenih odnosa zahtijevaju definiciju različitim formulama prema nekom primjenjivom jeziku. Takav jezik može omogućiti izračune i manipulaciju podacima bilo koje dimenzije i ne ograničava odnose između podatkovnih ćelija niti obraća pozornost na broj zajedničkih podatkovnih atributa specifičnih ćelija.

10. Intuitivna manipulacija podacima. Preusmjeravanje staza konsolidacije, detaljiziranje, povećanje i druge manipulacije regulirane stazama konsolidacije trebale bi se primijeniti kroz odvojeni utjecaj na ćelije analitičkog modela i ne bi trebale zahtijevati korištenje sustava izbornika ili drugih višestrukih radnji s korisničkim sučeljem. Pogled korisnika-analitičara na dimenzije definirane u analitičkom modelu mora sadržavati sve potrebne informacije za izvođenje gore navedenih koraka.

11. Fleksibilne opcije za primanje izvješća. Analiza i prezentacija podataka je jednostavna kada se redovi, stupci i ćelije podataka koji će se međusobno vizualno uspoređivati ​​nalaze blizu jedni drugih ili na određenoj udaljenosti logička funkcija koji se odvijaju u poduzeću. Alati za izvješćivanje moraju prikazati sintetizirane podatke ili informacije koje proizlaze iz modela podataka u bilo kojoj mogućoj orijentaciji. To znači da redovi, stupci ili stranice moraju prikazivati ​​od 0 do N dimenzija odjednom, gdje je N broj dimenzija cijelog analitičkog modela. Osim toga, svaka dimenzija sadržaja prikazana u jednom postu, stupcu ili stranici također mora moći prikazati bilo koji podskup elemenata (vrijednosti) sadržanih u dimenziji, bilo kojim redoslijedom.

12. Neograničena dimenzija i broj razina agregacije. Studija o mogućem broju potrebnih dimenzija potrebnih u analitičkom modelu pokazala je da se može koristiti do 19 dimenzija istovremeno. Stoga se snažno preporučuje da analitički alat bude sposoban pružati najmanje 15 dimenzija istovremeno, a po mogućnosti 20. Štoviše, svaka od uobičajenih dimenzija ne bi trebala biti ograničena u broju razina agregacije i putova konsolidacije koje definira korisnik-analitičar.

Zapravo, današnji razvijači OLAP proizvoda slijede ova pravila ili ih se barem trude slijediti. Ta se pravila mogu smatrati teorijskim temeljem operativne analitičke obrade, s njima je teško raspravljati. Naknadno su iz 12 pravila izvučeni mnogi korolari, koje, međutim, nećemo citirati, kako ne bismo nepotrebno komplicirali pripovijest.

Pogledajmo pobliže kako se OLAP proizvodi razlikuju u svojoj fizičkoj implementaciji.

Kao što je gore navedeno, OLAP se temelji na ideji obrade podataka pomoću višedimenzionalnih struktura. Kada kažemo OLAP, mislimo da je logično da je struktura podataka analitičkog proizvoda višedimenzionalna. Druga je stvar kako se to točno provodi. Postoje dvije glavne vrste analitičke obrade, koje uključuju određene proizvode.

MOLAP . Zapravo višedimenzionalni (višedimenzionalni) OLAP. Proizvod se temelji na nerelacijskoj strukturi podataka koja omogućuje višedimenzionalnu pohranu, obradu i prezentaciju podataka. Sukladno tome, baze podataka se nazivaju višedimenzionalnima. Proizvodi u ovoj klasi obično imaju višedimenzionalni poslužitelj baze podataka. Tijekom procesa analize podaci se biraju isključivo iz višedimenzionalne strukture. Takva je struktura vrlo produktivna.

ROLAP . Relacijski OLAP. Kao što naziv implicira, višedimenzionalna struktura u takvim alatima implementirana je relacijskim tablicama. A podaci u procesu analize, sukladno tome, odabiru se analitičkim alatom iz relacijske baze podataka.

Nedostaci i prednosti svakog pristupa općenito su očiti. Višedimenzionalni OLAP pruža bolje performanse, ali strukture se ne mogu koristiti za obradu velikih količina podataka, budući da će velike dimenzije zahtijevati velike hardverske resurse, au isto vrijeme, prorijeđenost hiperkocki može biti vrlo velika i stoga korištenje hardverskog kapaciteta neće biti opravdano. Naprotiv, relacijski OLAP omogućuje obradu velikih nizova pohranjenih podataka, jer je moguće osigurati ekonomičniju pohranu, ali je u isto vrijeme značajno inferioran u brzini od višedimenzionalnog OLAP-a. Slično razmišljanje dovelo je do identifikacije nove klase analitičkih alata - HOLAP. Ovo je hibridna operativna analitička obrada. Alati ove klase omogućuju vam kombiniranje oba pristupa - relacijski i višedimenzionalni. Pristup se može ostvariti i višedimenzionalnim podacima baze podataka i relacijskim podacima.

Postoji još jedna prilično egzotična vrsta operativne analitičke obrade - DOLAP. Ovo je "stolni" OLAP. Riječ je o takvoj analitičkoj obradi gdje su hiperkocke male, dimenzije male, potrebe skromne, a za takvu analitičku obradu dovoljan je osobni stroj na desktopu.

Operativno analitička obrada može značajno pojednostaviti i ubrzati proces pripreme i donošenja odluka rukovodećeg osoblja. Online analitička obrada služi za pretvaranje podataka u informaciju. Temeljito se razlikuje od tradicionalnog procesa podrške odlučivanju koji se najčešće temelji na pregledu strukturiranih izvješća. Analogno tome, razlika između strukturiranih izvješća i OLAP-a je ista kao između vožnje po gradu tramvajem i vožnje osobnim automobilom. Kad se vozite tramvajem, on se kreće po tračnicama, što vam ne dopušta da jasno vidite udaljene zgrade, a još manje da im se približite. Naprotiv, vožnja osobnim automobilom daje vam potpunu slobodu kretanja (naravno, morate poštovati prometna pravila). Možete se odvesti do bilo koje zgrade i doći do mjesta gdje tramvaji ne voze.

Strukturirana izvješća su tračnice koje ometaju slobodu u pripremi odluka. OLAP je vozilo za učinkovito kretanje informacijskim autocestama.

Svrha kolegija je proučavanje OLAP tehnologije, koncepta njene implementacije i strukture.

U moderni svijet računalne mreže a računalni sustavi omogućuju analizu i obradu velikih količina podataka.

Velika količina informacija uvelike komplicira potragu za rješenjima, ali omogućuje dobivanje mnogo preciznijih izračuna i analiza. Za rješavanje ovog problema postoji cijeli razred informacijski sustavi izvođenje analize. Takvi sustavi nazivaju se sustavi za podršku odlučivanju (DSS) (Decision Support System).

Da bi izvršio analizu, DSS mora akumulirati informacije, imati sredstva za njihov unos i pohranu. Ukupno možemo razlikovati tri glavna zadatka koja se rješavaju u DSS-u:

· unos podataka;

· Pohrana podataka;

· Analiza podataka.

Unos podataka u DSS provodi se automatski sa senzora koji karakteriziraju stanje okoliša ili procesa ili ljudski operater.

Ako se unos podataka vrši automatski sa senzora, tada se podaci skupljaju signalom spremnosti koji se javlja kada se informacija pojavi ili cikličkim prozivanjem. Ako unos provodi osoba, ona mora korisnicima osigurati prikladna sredstva za unos podataka, provjeravajući njihovu ispravnost unosa, kao i obavljanje potrebnih izračuna.

Kod istovremenog unosa podataka od strane više operatora potrebno je riješiti probleme izmjene i paralelnog pristupa istim podacima.

DSS analitičaru daje podatke u obliku izvješća, tablica, grafikona za proučavanje i analizu, zbog čega ovakvi sustavi pružaju funkcije podrške odlučivanju.

Podsustavi za unos podataka, nazvani OLTP (On-line transakcijska obrada), implementiraju operativnu obradu podataka. Za njihovu implementaciju koriste se konvencionalni sustavi za upravljanje bazama podataka (DBMS).

Podsustav analize može se izgraditi na temelju:

· podsustavi analize traženja informacija temeljeni na relacijskim DBMS-ovima i korištenju statičkih upita SQL jezik;

· podsustavi operativne analize. Za implementaciju takvih podsustava koristi se tehnologija operativne analitičke obrade podataka OLAP, koristeći koncept višedimenzionalnog prikaza podataka;

· podsustavi intelektualne analize. Ovaj podsustav implementira DataMining metode i algoritme.

Sa stajališta korisnika, OLAP sustavi pružaju alate za fleksibilan pregled informacija u različitim odjeljcima, automatsko dobivanje agregiranih podataka, izvođenje analitičkih operacija konvolucije, bušenja i usporedbe tijekom vremena. Zahvaljujući svemu tome, OLAP sustavi su rješenje s velikim prednostima u području pripreme podataka za sve vrste poslovnog izvješćivanja, što uključuje prezentaciju podataka u različitim dijelovima i različitim razinama hijerarhije, poput izvješća o prodaji, raznih oblika proračuna i drugi. OLAP sustavi imaju velike prednosti ovakvog prikaza u drugim oblicima analize podataka, uključujući i predviđanje.

1.2 Definicija OLAP-sustavi

Tehnologija za složenu višedimenzionalnu analizu podataka naziva se OLAP. OLAP je ključna komponenta organizacije skladišta podataka.

Funkcionalnost OLAP-a može se implementirati na različite načine, kako jednostavne, poput analize podataka u uredskim aplikacijama, tako i one složenije - distribuirani analitički sustavi temeljeni na poslužiteljskim proizvodima.

OLAP (On-LineAnalyticalProcessing) je tehnologija za operativnu analitičku obradu podataka koja koristi alate i metode za prikupljanje, pohranu i analizu višedimenzionalnih podataka za podršku procesima donošenja odluka.

Glavna svrha OLAP sustava je podrška analitičkim aktivnostima i proizvoljnim upitima korisnika analitičara. Svrha OLAP analize je testiranje novonastalih hipoteza.

Uvjeti velike konkurencije i rastuće dinamike vanjskog okruženja diktiraju povećane zahtjeve prema sustavima upravljanja poduzećem. Razvoj teorije i prakse upravljanja pratila je pojava novih metoda, tehnologija i modela usmjerenih na povećanje učinkovitosti poslovanja. Metode i modeli pridonijeli su, pak, nastanku analitičkih sustava. Potražnja za analitičkim sustavima u Rusiji je velika. Sa stajališta primjene ovi su sustavi najzanimljiviji u financijski sektor: banke, osiguranje, investicijska društva. Rezultati rada analitičkih sustava potrebni su prije svega ljudima o čijim odlukama ovisi razvoj poduzeća: menadžerima, stručnjacima, analitičarima. Analitički sustavi omogućuju vam rješavanje problema konsolidacije, izvještavanja, optimizacije i predviđanja. Do danas ne postoji konačna klasifikacija analitičkih sustava, kao što ne postoji niti opći sustav definicija pojmova koji se koriste u ovom području. Informacijska struktura poduzeća može se prikazati nizom razina od kojih je svaka karakterizirana vlastitim načinom obrade i upravljanja informacijama te ima svoju funkciju u procesu upravljanja. Stoga će analitički sustavi biti smješteni hijerarhijski na različitim razinama ove infrastrukture.

Razina transakcijskih sustava

Sloj skladišta podataka

Data mart sloj

Razina OLAP sustava

Analitički aplikacijski sloj

OLAP sustavi - (OnLine Analytical Processing, analitička obrada u današnje vrijeme) - tehnologija su za složenu višedimenzionalnu analizu podataka. OLAP sustavi su primjenjivi tamo gdje postoji zadatak analize multifaktorskih podataka. su učinkovit pravni lijek analiza i generiranje izvješća. Gore spomenuta skladišta podataka, prodavaonice podataka i OLAP sustavi pripadaju sustavima poslovne inteligencije (BI).

Vrlo često se informacijski i analitički sustavi stvoreni s očekivanjem izravne upotrebe od strane donositelja odluka pokažu iznimno jednostavnima za korištenje, ali ozbiljno ograničenom funkcionalnošću. Takav statički sustavi nazivaju se u literaturi Executive Information Systems (ISR), ili Executive Information Systems (EIS). Sadrže unaprijed definirane skupove upita i, iako su dovoljni za svakodnevni pregled, ne mogu odgovoriti na sva pitanja o dostupnim podacima koja se mogu pojaviti prilikom donošenja odluka. Rezultat takvog sustava, u pravilu, su izvješća na više stranica, nakon čijeg pažljivog proučavanja analitičar ima novi niz pitanja. Međutim, svaki novi zahtjev koji nije bio predviđen prilikom projektiranja ovakvog sustava mora biti prvo formalno opisan, kodiran od strane programera, a tek onda izvršen. Vrijeme čekanja u ovom slučaju može biti satima i danima, što nije uvijek prihvatljivo. Tako se vanjska jednostavnost statičkog DSS-a, za koju se većina kupaca informacijskih i analitičkih sustava aktivno bori, pretvara u katastrofalan gubitak fleksibilnosti.



Dinamički DSS, naprotiv, fokusiran je na obradu nereguliranih (ad hoc) zahtjeva analitičara za podacima. Zahtjeve za takve sustave najdublje je razmotrio E. F. Codd u članku koji je postavio temelje za OLAP koncept. Rad analitičara s ovim sustavima sastoji se od interaktivnog slijeda formiranja upita i proučavanja njihovih rezultata.

Ali dinamički DSS može djelovati ne samo u području online analitičke obrade (OLAP); podrška donošenju upravljačkih odluka na temelju akumuliranih podataka može se izvoditi u tri osnovna područja.

Opseg detaljnih podataka. Ovo je opseg većine sustava za pretraživanje informacija. U većini slučajeva, relacijski DBMS-ovi dobro se nose sa zadacima koji se ovdje pojavljuju. Općeprihvaćeni standard za jezik za rukovanje relacijskim podacima je SQL. Sustavi za pronalaženje informacija koji pružaju sučelje krajnjem korisniku u zadacima traženja detaljnih informacija mogu se koristiti kao dodaci nad pojedinačnim bazama podataka transakcijskih sustava i nad općim skladištem podataka.

Opseg agregatnih pokazatelja. Sveobuhvatan uvid u informacije prikupljene u skladištu podataka, njihova generalizacija i agregacija, prikaz hiperkocke i višedimenzionalna analiza zadaća su sustava online analitičke obrade (OLAP). Ovdje se možete fokusirati na posebne višedimenzionalne DBMS-ove ili ostati u okviru relacijskih tehnologija. U drugom slučaju, unaprijed agregirani podaci mogu se prikupiti u bazi podataka u obliku zvijezde ili se agregacija informacija može izvršiti u hodu dok se skeniraju detaljne tablice u relacijskoj bazi podataka.

Sfera uzoraka. Intelektualna obrada se provodi metodama rudarenja podataka (IDA, rudarenje podataka) čiji su glavni zadaci traženje funkcionalnih i logičkih obrazaca u akumuliranim informacijama, izgradnja modela i pravila koji objašnjavaju pronađene anomalije i/ili predviđaju razvoj određenih procesa.

Operativna analitička obrada podataka

OLAP koncept temelji se na principu višedimenzionalnog prikaza podataka. U članku iz 1993. godine E. F. Codd se osvrnuo na nedostatke relacijskog modela, prvenstveno ističući nemogućnost “kombiniranja, pregleda i analize podataka u smislu višestrukih dimenzija, odnosno na najrazumljiviji način za korporativne analitičare”, te definirao Opći zahtjevi do OLAP sustava koji proširuju funkcionalnost relacijskih DBMS-ova i uključuju višedimenzionalnu analizu kao jednu od svojih karakteristika.

Podjela OLAP proizvoda prema načinu prikaza podataka.

Trenutačno postoji veliki broj proizvoda na tržištu koji pružaju OLAP funkcionalnost u jednom ili drugom stupnju. Oko 30 najpoznatijih navedeno je na web poslužitelju za recenzije http://www.olapreport.com/. Pružanje višedimenzionalnog konceptualnog pogleda izvana korisničko sučelje prema izvornoj bazi podataka, svi OLAP proizvodi podijeljeni su u tri klase prema vrsti izvorne baze podataka.

Prvi online sustavi analitičke obrade (na primjer, Arbor Software's Essbase, Oracle Express poslužitelj Oracle) pripadali su klasi MOLAP, odnosno mogli su raditi samo s vlastitim višedimenzionalnim bazama podataka. Temelje se na vlasničkim tehnologijama za višedimenzionalne DBMS-ove i najskuplji su. Ovi sustavi pružaju puni ciklus OLAP obrade. Oni ili uključuju, uz komponentu poslužitelja, vlastito integrirano klijentsko sučelje ili koriste vanjski programi rad s proračunskim tablicama. Za održavanje takvih sustava potrebno je posebno osoblje zaposlenika koji će instalirati, održavati sustav i kreirati prikaze podataka za krajnje korisnike.

Sustavi relacijske mrežne analitičke obrade (ROLAP) omogućuju da podaci pohranjeni u relacijskoj bazi podataka budu predstavljeni u višedimenzionalnom obliku, osiguravajući transformaciju informacija u višedimenzionalni model kroz posredni sloj metapodataka. ROLAP sustavi dobro su prilagođeni za rad s velikim skladišnim prostorima. Poput MOLAP sustava, oni zahtijevaju značajno održavanje od strane stručnjaka za informacijsku tehnologiju i uključuju višekorisnički rad.

Konačno, hibridni sustavi (Hybrid OLAP, HOLAP) dizajnirani su tako da kombiniraju prednosti i minimiziraju nedostatke svojstvene prethodnim klasama. Speedware Media/MR spada u ovu klasu. Prema programerima, on kombinira analitičku fleksibilnost i brzinu odgovora MOLAP-a sa stalnim pristupom stvarnim podacima koji su svojstveni ROLAP-u.

Višedimenzionalni OLAP (MOLAP)

U specijaliziranim DBMS-ovima koji se temelje na višedimenzionalnom predstavljanju podataka, podaci nisu organizirani u obliku relacijskih tablica, već u obliku uređenih višedimenzionalnih nizova:

1) hiperkocke (sve ćelije pohranjene u bazi moraju imati istu dimenziju, odnosno biti u najpotpunijoj mjernoj osnovi) ili

2) polikocke (svaka se varijabla pohranjuje s vlastitim skupom mjerenja, a sve pridružene poteškoće obrade prenose se na interne mehanizme sustava).

Korištenje višedimenzionalnih baza podataka u sustavima online analitičke obrade ima sljedeće prednosti.

Pri korištenju višedimenzionalnih DBMS-ova, pretraživanje i dohvaćanje podataka puno je brže nego kod višedimenzionalnog konceptualnog prikaza relacijske baze podataka, budući da je višedimenzionalna baza podataka denormalizirana, sadrži unaprijed agregirane mjere i pruža optimiziran pristup traženim ćelijama.

Višedimenzionalni DBMS-ovi lako se nose sa zadacima uključivanja u informacijski model razne ugrađene funkcije, dok objektivno postojeća ograničenja SQL jezici čine obavljanje ovih zadataka na temelju relacijskih DBMS-ova prilično teškim, a ponekad i nemogućim.

S druge strane, postoje značajna ograničenja.

Višedimenzionalni DBMS ne dopuštaju rad s velikim bazama podataka. Osim toga, zbog denormalizacije i prethodno izvršene agregacije, obujam podataka u višedimenzionalnoj bazi podataka u pravilu odgovara (prema Coddovoj procjeni) 2,5-100 puta manji od volumena izvornih detaljnih podataka.

U usporedbi s relacijskim DBMS-ovima, višedimenzionalni DBMS-ovi se koriste vrlo neučinkovito vanjska memorija. U velikoj većini slučajeva informacijska hiperkocka vrlo je rijetka, a budući da su podaci pohranjeni u uređenom obliku, nedefinirane vrijednosti mogu se ukloniti samo odabirom optimalnog redoslijeda sortiranja, koji vam omogućuje organiziranje podataka u najveće moguće susjedne grupe. Ali čak iu ovom slučaju problem je samo djelomično riješen. Osim toga, optimalni redoslijed sortiranja za pohranjivanje rijetkih podataka najvjerojatnije neće biti redoslijed koji se najčešće koristi u upitima. Stoga je u stvarnim sustavima potrebno tražiti kompromis između performansi i redundancije diskovnog prostora koji baza podataka zauzima.

Posljedično, korištenje višedimenzionalnog DBMS-a je opravdano samo pod sljedećim uvjetima.

Količina izvornih podataka za analizu nije prevelika (ne više od nekoliko gigabajta), odnosno, razina agregacije podataka je prilično visoka.

Skup informacijskih dimenzija je stabilan (budući da svaka promjena u njihovoj strukturi gotovo uvijek zahtijeva potpuno restrukturiranje hiperkocke).

Vrijeme odgovora sustava na neregulirane zahtjeve najkritičniji je parametar.

Zahtijeva opsežnu upotrebu složenih ugrađenih funkcija za izvođenje međudimenzionalnih izračuna na ćelijama hiperkocke, uključujući mogućnost pisanja prilagođenih funkcija.

Relacijski OLAP (ROLAP)

Izravna uporaba relacijskih baza podataka u sustavima online analitičke obrade ima sljedeće prednosti.

U većini slučajeva, korporativna skladišta podataka implementirana su pomoću relacijskih DBMS alata, a ROLAP alati omogućuju analizu izravno na njima. U isto vrijeme, veličina pohrane nije tako kritičan parametar kao u slučaju MOLAP-a.

U slučaju varijabilne dimenzije problema, kada se promjene u mjernoj strukturi moraju raditi prilično često, R OLAP sustavi s dinamičkim prikazom dimenzija su optimalno rješenje, budući da u njima takve izmjene ne zahtijevaju fizičku reorganizaciju baze podataka.

Relacijski DBMS-ovi pružaju znatno više visoka razina zaštita podataka i dobre prilike razlikovanje prava pristupa.

Glavni nedostatak ROLAP-a u usporedbi s višedimenzionalnim DBMS-ovima je niža izvedba. Kako bi pružili performanse usporedive s MOLAP-om, relacijski sustavi zahtijevaju pažljivo dizajniranje sheme baze podataka i konfiguraciju indeksa, odnosno puno truda od strane administratora baze podataka. Samo korištenjem zvjezdanih shema performanse dobro podešenih relacijskih sustava mogu se približiti performansama sustava temeljenih na višedimenzionalnim bazama podataka.

Korištenje OLAP sustava omogućuje vam automatizaciju strateške razine upravljanja organizacijom. OLAP (Online Analytical Processing - analitička obrada podataka u stvarnom vremenu) moćna je tehnologija za obradu podataka i istraživanje. Sustavi izgrađeni na temelju OLAP tehnologije pružaju gotovo neograničene mogućnosti za izradu izvješća, izvođenje složenih analitičkih izračuna, izradu prognoza i scenarija te razvoj mnogih opcija za planove.

Punopravni OLAP sustavi pojavili su se početkom 90-ih, kao rezultat razvoja informacijskih sustava za podršku odlučivanju. Osmišljeni su za pretvaranje različitih, često različitih podataka u korisna informacija. OLAP sustavi mogu organizirati podatke prema nekom skupu kriterija. Međutim, nije nužno da kriteriji imaju jasne karakteristike.

OLAP sustavi našli su svoju primjenu u mnogim pitanjima strateškog upravljanja organizacijom: upravljanje poslovnim rezultatima, strateško planiranje, budžetiranje, predviđanje razvoja, izrada financijskih izvještaja, analiza rada, simulacijsko modeliranje vanjskog i unutarnjeg okruženja organizacije, pohrana podataka. i izvješćivanje.

Struktura OLAP sustava

Rad OLAP sustava temelji se na obradi višedimenzionalnih nizova podataka. Višedimenzionalni nizovi dizajnirani su na takav način da svaki element niza ima mnogo veza s drugim elementima. Da bi formirao višedimenzionalni niz, OLAP sustav mora dobiti izvorne podatke iz drugih sustava (na primjer, ERP ili CRM sustava), ili putem vanjskog unosa. Korisnik OLAP sustava dobiva potrebne podatke u strukturiranom obliku u skladu sa svojim zahtjevom. Na temelju navedenog postupka možemo zamisliti strukturu OLAP sustava.

Općenito, struktura OLAP sustava sastoji se od sljedećih elemenata:

  • baza podataka . Baza podataka je izvor informacija za rad OLAP sustava. Vrsta baze podataka ovisi o vrsti OLAP sustava i algoritmima rada OLAP poslužitelja. Obično se koriste relacijske baze podataka, višedimenzionalne baze podataka, skladišta podataka itd.
  • OLAP poslužitelj. Omogućuje upravljanje višedimenzionalnom strukturom podataka i odnosom između baze podataka i korisnika OLAP sustava.
  • prilagođene aplikacije . Ovaj element strukture OLAP sustava upravlja zahtjevima korisnika i generira rezultate pristupa bazi podataka (izvještaji, grafikoni, tablice, itd.)

Ovisno o načinu organiziranja, obrade i pohranjivanja podataka, mogu se implementirati OLAP sustavi lokalna računala korisnicima ili pomoću namjenskih poslužitelja.

Postoje tri glavna načina za pohranu i obradu podataka:

  • lokalno. Podaci se smještaju na računala korisnika. Obrada, analiza i upravljanje podacima obavlja se na lokalnim radnim stanicama. Ova struktura OLAP sustava ima značajne nedostatke koji se odnose na brzinu obrade podataka, sigurnost podataka i ograničenu upotrebu višedimenzionalne analize.
  • relacijske baze podataka. Ove baze podataka služe za raditi zajedno OLAP sustavi s CRM sustavom ili ERP sustavom. Podaci se pohranjuju na poslužitelju ovih sustava u obliku relacijskih baza podataka ili skladišta podataka. OLAP poslužitelj pristupa tim bazama podataka kako bi formirao potrebne višedimenzionalne strukture i izvršio analizu.
  • višedimenzionalne baze podataka. U tom slučaju podaci su organizirani u obliku posebnog skladišta podataka na namjenskom poslužitelju. Sve operacije s podacima provode se na ovom poslužitelju, koji transformira izvorne podatke u višedimenzionalne strukture. Takve se strukture nazivaju OLAP kocka. Izvori podataka za formiranje OLAP kocke su relacijske baze podataka i/ili klijentske datoteke. Poslužitelj podataka vrši prethodnu pripremu i obradu podataka. OLAP poslužitelj radi s OLAP kockom bez izravnog pristupa izvorima podataka (relacijske baze podataka, klijentske datoteke itd.).

Vrste OLAP sustava

Ovisno o načinu pohranjivanja i obrade podataka, svi OLAP sustavi mogu se podijeliti u tri glavne vrste.


1. ROLAP (Relational OLAP - relacijski OLAP sustavi) - ova vrsta OLAP sustava radi s relacijskim bazama podataka. Podacima se pristupa izravno u relacijsku bazu podataka. Podaci se pohranjuju u obliku relacijskih tablica. Korisnici imaju mogućnost obavljanja višedimenzionalne analize kao u tradicionalnim OLAP sustavima. To se postiže korištenjem SQL alata i posebnih upita.

Jedna od prednosti ROLAP-a je mogućnost učinkovitije obrade velikih količina podataka. Još jedna prednost ROLAP-a je sposobnost učinkovita obrada i numeričke i tekstualne podatke.

Nedostaci ROLAP-a uključuju niske performanse(u usporedbi s tradicionalnim OLAP sustavima), jer Obradu podataka provodi OLAP poslužitelj. Još jedan nedostatak je ograničena funkcionalnost zbog upotrebe SQL-a.


2. MOLAP (Multidimensional OLAP – višedimenzionalni OLAP sustavi). Ova vrsta OLAP sustava odnosi se na tradicionalne sustave. Razlika između tradicionalnog OLAP sustava i drugih sustava je u preliminarnoj pripremi i optimizaciji podataka. Ovi sustavi obično koriste namjenski poslužitelj na kojem se Preliminarna obrada podaci. Podaci se generiraju u višedimenzionalni nizovi– OLAP kocke.

MOLAP sustavi su najučinkovitiji u obradi podataka, jer... oni olakšavaju reorganizaciju i strukturu podataka kako bi odgovarali različitim zahtjevima korisnika. MOLAP analitički alati omogućuju izvođenje složenih izračuna. Još jedna prednost MOLAP-a je mogućnost brzog generiranja upita i dobivanja rezultata. To se postiže preliminarnim formiranjem OLAP kocki.

Nedostaci MOLAP sustava su ograničenje količine obrađenih podataka i redundancija podataka, jer Za formiranje višedimenzionalnih kocki, u različitim aspektima, podaci se moraju duplicirati.


3. HOLAP (Hybrid OLAP – hibridni OLAP sustavi). Hibridni OLAP sustavi su kombinacija ROLAP i MOLAP sustava. U hibridnim sustavima pokušali su spojiti prednosti dvaju sustava: korištenje višedimenzionalnih baza podataka i upravljanje relacijskim bazama podataka. HOLAP sustavi omogućuju pohranu velike količine podataka u relacijske tablice, a obrađeni podaci smješteni su u unaprijed izgrađene višedimenzionalne OLAP kocke. Prednosti ovakvog sustava su skalabilnost podataka, brza obrada podataka i fleksibilan pristup izvorima podataka.

Postoje i druge vrste OLAP sustava, ali oni su više marketinški trik proizvođača nego neovisna vrsta OLAP sustava.

Ove vrste uključuju:

  • WOLAP (Web OLAP). Pogled na OLAP sustav sa web podrška sučelje. Ovi OLAP sustavi imaju mogućnost pristupa bazama podataka putem web sučelja.
  • DOLAP (OLAP za radnu površinu). Ova vrsta OLAP sustava omogućuje korisnicima preuzimanje baze podataka na lokalnu radnu stanicu i rad s njom lokalno.
  • MobileOLAP. Ovo je funkcija OLAP sustava koja vam omogućuje daljinski rad s bazom podataka pomoću mobilnih uređaja.
  • SOLAP (Prostorni OLAP). Ova vrsta OLAP sustava namijenjena je za obradu prostornih podataka. Nastao je kao rezultat integracije geografskih informacijskih sustava i OLAP sustava. Ovi sustavi omogućuju obradu podataka ne samo u alfanumeričkom formatu, već iu obliku vizualnih objekata i vektora.

Prednosti OLAP sustava

Korištenje OLAP sustava daje organizaciji mogućnost predviđanja i analize različitih situacija vezanih uz trenutne aktivnosti i perspektive razvoja. Ovi se sustavi mogu smatrati dodatkom sustavima automatizacije na razini poduzeća. Sve prednosti OLAP sustava izravno ovise o točnosti, pouzdanosti i količini izvornih podataka.

Glavne prednosti OLAP sustava su:

  • dosljednost početnih informacija i rezultata analize. S OLAP sustavom uvijek je moguće ući u trag izvoru informacija i utvrditi logičku vezu između dobivenih rezultata i izvornih podataka. Subjektivnost rezultata analize je smanjena.
  • provođenje multivarijantne analize. Korištenje OLAP sustava omogućuje dobivanje mnogih scenarija za razvoj događaja na temelju skupa izvornih podataka. Pomoću alata za analizu možete simulirati situacije na temelju načela "što će se dogoditi ako".
  • upravljanje detaljima. Pojedinosti prikazanih rezultata mogu varirati ovisno o potrebama korisnika. Nema potrebe provoditi složene postavke sustava i ponavljati izračune. Izvješće može sadržavati upravo one podatke potrebne za donošenje odluka.
  • identificiranje skrivenih ovisnosti. Izgradnjom višedimenzionalnih veza postaje moguće identificirati i utvrditi skrivene ovisnosti u različitim procesima ili situacijama koje utječu na proizvodne aktivnosti.
  • stvaranje jedinstvene platforme. Korištenjem OLAP sustava moguće je stvoriti jedinstvenu platformu za sve procese predviđanja i analize u poduzeću. Konkretno, podaci OLAP sustava temelj su za izradu proračunskih predviđanja, predviđanja prodaje, predviđanja nabave, strateških razvojnih planova itd.