Analitički sustavi OLAP. OLAP sustavi Olap analiza koristi

23.02.2021 Vijesti

Glavna razlika između činjenica i informacija je u tome što podatke primamo i uzimamo u obzir te ih možemo koristiti u korist. Grubo rečeno, informacije su analizirani i sistematizirani podaci. Zahvaljujući pravodobno dobivenim informacijama, mnoge tvrtke uspijevaju preživjeti i financijsku krizu i najžešću konkurenciju. Nije dovoljno prikupiti činjenice i imati sve potrebne podatke. Također ih morate znati analizirati. Kako bismo olakšali ljudima koji moraju donositi važne poslovne odluke, razvijeni su različiti sustavi podrške. Upravo u tu svrhu razni složeni sustavi, što vam omogućuje analizu velikih količina heterogenih podataka i njihovo pretvaranje u informacije korisne za poslovnog korisnika. Novo područje poslovne analitike ima za cilj poboljšati kontrolu procesa poslovnih sustava korištenjem skladištenja podataka i tehnologije.

Tržište poslovnih informacijskih sustava danas nudi raznolik izbor rješenja koja pomažu poduzeću organizirati upravljačko računovodstvo, osigurati operativno upravljanje proizvodnjom i prodajom te ostvariti učinkovitu interakciju s kupcima i dobavljačima.

Zasebnu nišu na tržištu poslovnih sustava zauzimaju analitički softverski proizvodi namijenjeni podršci donošenja odluka na strateškoj razini upravljanja poduzećem. Glavna razlika između takvih alata i operativnih sustava upravljanja je u tome što potonji osiguravaju upravljanje poduzećem u "funkcionarskom načinu rada", odnosno implementaciju dobro definiranog proizvodnog programa, dok analitički sustavi na strateškoj razini pomažu upravi poduzeća u donošenju odluka u "način razvoja".

Razmjeri provedenih promjena mogu varirati od dubokog restrukturiranja do djelomičnog ažuriranja tehnologije na pojedinim proizvodnim mjestima, ali u svakom slučaju donositelji odluka razmatraju razvojne alternative o kojima ovisi dugoročna sudbina poduzeća.

Koliko god informacijski sustav poduzeća bio snažan i razvijen, on ne može pomoći u rješavanju ovih problema, prvo jer je konfiguriran za stacionarne, ustaljene poslovne procese, a drugo, ne sadrži i ne može sadržavati informacije za donošenje odluka o novim područjima poslovanje, nove tehnologije, nove organizacijske odluke.

Zahvaljujući OLAP (On-Line Analytical Processing) tehnologiji obrade i analize podataka, svaka organizacija može gotovo trenutno (unutar pet sekundi) dobiti podatke potrebne za rad. OLAP se može ukratko definirati s pet ključne riječi.

BRZO (Fast) - to znači da vrijeme traženja i pružanja potrebnih informacija ne traje više od pet sekundi. Najjednostavniji zahtjevi obrađuju se u sekundi, a nekoliko složenih zahtjeva ima vrijeme obrade dulje od dvadeset sekundi. Za postizanje ovog rezultata koriste se različite metode, od posebnih oblika pohrane podataka do opsežnih predizračunavanja. Na taj način možete dobiti izvješće u minuti za koje je prije bila potrebno nekoliko dana za pripremu.

ANALIZA (Analytical) kaže da sustav može izvršiti bilo koju analizu, kako statističku tako i logičku, a zatim je pohranjuje u pristupačnom obliku.

DIJELJENO znači da sustav pruža potrebnu privatnost do razine ćelije

MULTIDIMENZIONALNOST (Multidimensional) je glavna karakteristika OLAP-a. Sustav mora u potpunosti podržavati hijerarhije i višestruke hijerarhije, budući da je to najlogičniji način analize poslovnih i organizacijskih aktivnosti.

INFORMACIJA. Prave informacije moraju biti dostavljene tamo gdje su potrebne.

Tijekom rada organizacije uvijek se gomilaju podaci vezani uz njezino područje djelovanja, koji su ponekad pohranjeni na potpuno različitim mjestima, a njihovo objedinjavanje je teško i dugotrajno. Upravo kako bi se ubrzalo prikupljanje podataka za testiranje novonastalih poslovnih hipoteza, razvijena je tehnologija interaktivne analitičke obrade podataka ili OLAP. Glavna svrha takvih OLAP sustava je brzo odgovoriti na proizvoljne zahtjeve korisnika. Ova potreba često se javlja prilikom razvoja nekog važnog poslovnog projekta, kada je razvojnom programeru potrebna radna hipoteza koja se pojavila. Najčešće, informacije koje su potrebne korisniku trebaju biti predstavljene u obliku neke vrste ovisnosti - na primjer, kako obujam prodaje ovisi o kategoriji proizvoda, o prodajnoj regiji, o dobu godine i tako dalje. Zahvaljujući OLAP-u, on je u mogućnosti odmah dobiti potrebne podatke u željenom izgledu za odabrano razdoblje.

Interaktivna OLAP tehnologija omogućuje transformaciju ogromnih gomila izvješća i brda podataka u korisne i točne informacije koje će pomoći zaposleniku da donese informiranu poslovnu ili financijsku odluku u pravom trenutku.

Osim toga, zahvaljujući OLAP-u, povećava se učinkovitost obrade, a korisnik može primiti velike količine sortiranih (agregiranih) informacija gotovo trenutno. Zahvaljujući OLAP-u, korisnik može jasno vidjeti koliko učinkovito njegova organizacija posluje, ima mogućnost brzog i fleksibilnog odgovora na vanjske promjene te ima mogućnost minimiziranja financijskih gubitaka svoje organizacije. OLAP pruža točne informacije koje poboljšavaju kvalitetu donesenih odluka.

Jedina mana sustava poslovne analize je njihova visoka cijena. Stvaranje pohrane osobnih podataka zahtijeva i vrijeme i mnogo novca.

Korištenje OLAP tehnologije u poslovanju omogućuje brzo dobivanje potrebnih informacija, koje se na zahtjev korisnika mogu prikazati u uobičajenom obliku - izvješća, grafikona ili tablice.

Postupci integracije sustava za poslovne strukture temelje se na korištenju zajedničkih ERP, CRM i SCM rješenja. U mnogim slučajevima sustave isporučuju različiti proizvođači, a uvezeni podaci moraju proći harmonizaciju podataka i biti prikazani kao heterogeni podaci. U poslovnom okruženju postoji nedvosmislen zahtjev - cjelovita analiza podataka, što podrazumijeva pregled konsolidiranih izvješća s različitih gledišta.

Različiti proizvođači imaju različite mehanizme izvješćivanja podataka. Procedura heterogene reprezentacije uključuje izdvajanje, transformiranje i učitavanje (ETL). Na primjer, u Microsoftu SQL poslužitelj 2005 Analysis Services, problem konsolidacije podataka implementiran je korištenjem Data Source Views - vrste izvora podataka koji opisuju modele analitičke prezentacije.

Poslovne aplikacije temeljene na OLAP tehnologijama, primjeri proizvoda. Najčešće primjene OLAP tehnologija su:

Analiza podataka.

Zadatak za koji su izvorno korišteni i ostali najpopularniji OLAP alati. Višedimenzionalni model podataka, mogućnost analize značajnih količina podataka i brz odgovor na zahtjeve čine sličnih sustava nezaobilazan za analizu prodaje, marketinških aktivnosti, distribucije i drugih poslova s ​​velikom količinom početnih podataka.

Primjeri proizvoda: Microsoft Excel Pivot Tables, Microsoft Analysis Services, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.

Financijsko planiranje-proračun.

Višedimenzionalni model omogućuje simultani unos podataka i njihovu jednostavnu analizu (na primjer, planiranje analize činjenica). Stoga, brojni moderni CPM (Corporate Performance Management) proizvodi koriste OLAP% modele. Važan zadatak je višedimenzionalni obrnuti izračun (backsolve, breakback, writeback), koji vam omogućuje izračunavanje potrebnih promjena u detaljnim ćelijama kada se promijeni agregirana vrijednost. To je alat za analizu što ako, tj. za igranje raznih opcija za događaje tijekom planiranja.

Primjeri proizvoda: Microsoft PerformancePint, Oracle EPB, Oracle OFA, Oracle Hyperion Planning, SAP SEM, Cognos Enterprise Planning, Geac.

Financijska konsolidacija.

Konsolidacija podataka u skladu s međunarodnim računovodstvenim standardima, uzimajući u obzir vlasničke udjele, različite valute i interni promet, hitan je zadatak u vezi sa sve strožim zahtjevima inspekcijskih tijela (SOX, Basel II) i izlaska kompanija na burzu. OLAP tehnologije omogućuju vam ubrzanje izračuna konsolidiranih izvješća i povećanje transparentnosti cijelog procesa.

Primjeri proizvoda: Oracle FCH, Oracle Hyperion FM, Cognos Controller.

Tehnologije skladištenja podataka i on-line analitičke obrade (OLAP).
važni su elementi podrške poslovnom odlučivanju, koji sve više postaju sastavni dio svake industrije. Korištenje OLAP tehnologija kao alata za poslovnu analitiku daje veću kontrolu i pravovremen pristup strateškim
informacije koje olakšavaju učinkovito donošenje odluka.
To pruža mogućnost simulacije prognoza iz stvarnog života i učinkovitijeg korištenja resursa. OLAP omogućuje organizaciji da brže odgovori na zahtjeve tržišta.

Bibliografija:

1. Erik Thomsen. OLAP rješenja: Izgradnja višedimenzionalnih informacijskih sustava, drugo izdanje. Wiley Computer Publishing John Wiley & Sons, Inc., 2002.

2. Bijela knjiga OLAP vijeća, http://www.olapcouncil.org/research/whtpaply.htm

3. Gerd Stumme i Bernhard Ganter. Analiza formalnog koncepta _ Matematičke osnove.

Uvod

U današnje vrijeme gotovo niti jedna organizacija ne može bez sustava za upravljanje bazama podataka, posebno među onima koji su tradicionalno usmjereni na interakciju s korisnicima. Banke, osiguravajuća društva, zrakoplovne i druge prijevozničke tvrtke, lanci supermarketa, telekomunikacijske i marketinške tvrtke, organizacije koje se bave uslužnim sektorom i drugi - svi skupljaju i pohranjuju gigabajte podataka o kupcima, proizvodima i uslugama u svojim bazama podataka. Vrijednost takvih informacija je neosporna. Takve baze podataka nazivaju se operativnim ili transakcijskim jer ih karakterizira veliki broj malih transakcija, odnosno operacija pisanja-čitanja. Računalni sustavi sustavi koji bilježe transakcije i zapravo pristupaju transakcijskim bazama podataka obično se nazivaju sustavi za online obradu transakcija (OLTP - On-Line Transactional Processing) ili računovodstveni sustavi.

Računovodstveni sustavi su konfigurirani i optimizirani za rad maksimalna količina transakcije u kratkim vremenskim razdobljima. Obično su pojedinačne transakcije vrlo male i nepovezane jedna s drugom. Međutim, svaki zapis podataka koji karakterizira interakciju s klijentom (poziv službi podrške, gotovinska transakcija, narudžba iz kataloga, posjet web stranici tvrtke itd.) može se koristiti za dobivanje kvalitativno novih informacija, odnosno za kreiranje izvještava i analizira aktivnosti poduzeća .

Raspon analitičkih funkcija u računovodstvenim sustavima obično je vrlo ograničen. Sheme koje se koriste u OLTP aplikacijama otežavaju stvaranje čak i jednostavnih izvješća jer su podaci često raspoređeni u više tablica i zahtijevaju složene operacije spajanja da bi se agregirali. Općenito, pokušaj stvaranja složenih izvješća zahtijeva puno procesorske snage i rezultira gubitkom performansi.

Osim toga, računovodstveni sustavi pohranjuju podatke koji se stalno mijenjaju. Kako se transakcije prikupljaju, ukupne vrijednosti se mijenjaju vrlo brzo, tako da dvije analize koje se provode unutar nekoliko minuta jedna od druge mogu dati različite rezultate. Najčešće se analiza provodi na kraju izvještajnog razdoblja, inače slika može biti iskrivljena. Osim toga, podaci potrebni za analizu mogu se pohraniti u nekoliko sustava.

Neke analize zahtijevaju strukturne promjene koje nisu izvedive u trenutnom radnom okruženju. Na primjer, morate saznati što će se dogoditi ako tvrtka uvede nove proizvode. Takva se istraživanja ne mogu provoditi na živoj bazi. Posljedično, učinkovita analiza rijetko se može provesti izravno u računovodstvenom sustavu.

Sustavi za podršku odlučivanju obično imaju sredstva da korisniku daju skupne podatke za različite uzorke iz izvornog skupa u obliku pogodnom za percepciju i analizu. Tipično, takve agregatne funkcije tvore višedimenzionalni (i stoga nerelacijski) skup podataka (često se naziva hiperkocka ili metakocka), čije osi sadrže parametre, a ćelije sadrže agregirane podatke koji o njima ovise - a takvi podaci također mogu biti pohranjeni u relacijske tablice. Uzduž svake osi podaci se mogu organizirati u hijerarhiju koja predstavlja različite razine detalja. Zahvaljujući ovom modelu podataka, korisnici mogu formulirati složene upite, generirati izvješća i dobiti podskupove podataka.

Upravo je to dovelo do interesa za sustave podrške odlučivanju, koji su postali glavno područje primjene OLAP-a (On-Line Analytical Processing, operativna analitička obrada, operativna analiza podataka), pretvarajući “rudu” OLTP sustava u gotov “proizvod” koji menadžeri i analitičari mogu izravno koristiti. Ova metoda omogućuje analitičarima, menadžerima i rukovoditeljima da steknu uvid u akumulirane podatke putem brzog i dosljednog pristupa širokom rasponu prikaza informacija.

Svrha kolegija je ispitati OLAP tehnologiju.

višedimenzionalna analitička obrada podataka

Glavni dio

1 Osnovne informacije o OLAP-u

OLAP koncept temelji se na principu višedimenzionalnog prikaza podataka. Edgar Codd je skovao termin OLAP 1993. Razmotrivši nedostatke relacijski model, prije svega je ukazao na nemogućnost „kombiniranja, pregleda i analize podataka sa stajališta više dimenzija, odnosno na korporativnim analitičarima najrazumljiviji način“, te definirao opće zahtjeve za OLAP sustave koji proširuju funkcionalnosti relacijskih DBMS-ova i uključuju višedimenzionalnu analizu kao jednu od svojih karakteristika.

U velikom broju publikacija akronim OLAP označava ne samo višedimenzionalni prikaz podataka, već i pohranu samih podataka u višedimenzionalnu bazu podataka. Općenito govoreći, to nije točno, jer sam Codd primjećuje da su "Relacijske baze podataka bile, jesu i bit će najprikladnija tehnologija za pohranjivanje poslovnih podataka. Potreba nije za novom tehnologijom baze podataka, već za alatima za analizu koji nadopunjuju funkcije postojeći DBMS-ovi i dovoljno fleksibilni da omoguće i automatiziraju različite vrste rudarenja svojstvene OLAP-u." Takva zbrka dovodi do opreka poput "OLAP ili ROLAP", što nije sasvim točno, budući da ROLAP (relacijski OLAP) na konceptualnoj razini podržava sve funkcionalnosti definirane pojmom OLAP. Čini se poželjnijim koristiti poseban izraz MOLAP za OLAP temeljen na višedimenzionalnim DBMS-ovima. Prema Coddu, višedimenzionalni konceptualni pogled je višestruka perspektiva koja se sastoji od nekoliko neovisnih dimenzija duž kojih se specifični skupovi podataka mogu analizirati. Simultana analiza u više dimenzija definira se kao multivarijatna analiza. Svaka dimenzija uključuje područja konsolidacije podataka, koja se sastoje od niza uzastopnih razina generalizacije, pri čemu svaka viša razina odgovara višem stupnju agregacije podataka za odgovarajuću dimenziju. Da, mjerenje.

Izvođač se može odrediti smjerom konsolidacije, koji se sastoji od razina generalizacije "poduzeće - odjel - odjel - zaposlenik". Dimenzija vremena može čak uključiti dva smjera konsolidacije - "godina - tromjesečje - mjesec - dan" i "tjedan - dan", budući da je računanje vremena po mjesecu i po tjednu nekompatibilno. U tom slučaju postaje moguće proizvoljno odabrati željenu razinu detalja informacija za svaku od dimenzija. Operacija bušenja odgovara kretanju od viših prema nižim stupnjevima konsolidacije; naprotiv, operacija smotanja znači kretanje s nižih razina na više.

Codd je identificirao 12 pravila koja moraju biti zadovoljena softver OLAP klasa.

1.2 Zahtjevi za alate za online analitičku obradu

Višedimenzionalni konceptualni pogled. Konceptualni prikaz podatkovnog modela u OLAP proizvodu mora biti višedimenzionalne prirode, to jest, omogućiti analitičarima izvođenje intuitivnih operacija "slice and dice", rotacije i zakretanja smjerova konsolidacije. Transparentnost. Korisnik ne mora znati koji se specifični alati koriste za pohranu i obradu podataka, kako su podaci organizirani ili odakle dolaze.

Pristupačnost. Analitičar mora biti u stanju izvršiti analizu unutar okvira zajedničkog konceptualnog okvira, ali podaci mogu ostati pod kontrolom naslijeđenih DBMS-ova dok su povezani sa zajedničkim analitičkim modelom. To jest, OLAP alat mora prekriti svoju logičku shemu na fizičkim skupovima podataka, izvodeći sve transformacije potrebne za pružanje jedinstvenog, dosljednog i holističkog prikaza korisničkih informacija.

Dosljedna izvedba izvješćivanja. Kako se broj dimenzija i veličina baze podataka povećava, analitičari ne bi trebali iskusiti nikakvo smanjenje performansi. Održiva izvedba neophodna je za održavanje jednostavnosti korištenja i oslobađanja od složenosti koja je potrebna da bi se OLAP doveo do krajnjeg korisnika.

Klijent - poslužiteljska arhitektura (Client-Server Architecture). Većina podataka koji zahtijevaju brzu analitičku obradu pohranjena je u glavnim računalima i iz njih se dohvaća osobnih računala. Stoga je jedan od zahtjeva sposobnost OLAP proizvoda da rade u okruženju klijent-poslužitelj. Glavna ideja ovdje je da poslužiteljska komponenta OLAP alata mora biti dovoljno inteligentna i imati sposobnost izgradnje zajedničke konceptualne sheme sažimanjem i konsolidacijom različitih logičkih i fizičkih shema poslovnih baza podataka kako bi se osigurao transparentan učinak.

Generička dimenzionalnost. Sve dimenzije podataka moraju biti jednake. dodatne karakteristike može se pružiti pojedinačnim dimenzijama, ali budući da su sve simetrične, ova dodatna funkcionalnost može se pružiti bilo kojoj dimenziji. Temeljna struktura podataka, formule i formati izvješća ne bi se trebali oslanjati ni na jednu dimenziju.

Rukovanje dinamičkom rijetkom matricom. OLAP alat mora osigurati optimalnu obradu rijetkih matrica. Brzina pristupa mora se održavati bez obzira na lokaciju podatkovnih ćelija i biti konstantna za modele s različitim brojem dimenzija i različitom rijetkošću podataka.

Podrška za više korisnika. Često nekoliko analitičara mora raditi istovremeno s jednim analitičkim modelom ili stvarati različite modele na temelju istih korporativnih podataka. Alat OLAP mora im omogućiti istovremeni pristup i osigurati integritet i sigurnost podataka.

Neograničena podrška za međudimenzionalne operacije. Izračuni i manipulacija podacima duž bilo kojeg broja dimenzija ne smiju zabranjivati ​​niti ograničavati bilo kakve odnose između podatkovnih ćelija. Transformacije koje zahtijevaju proizvoljnu definiciju moraju biti specificirane u funkcionalno potpunom jeziku formula.

Intuitivna manipulacija podacima. Preorijentacija smjerova konsolidacije, detaljiziranje podataka u stupcima i recima, agregacija i druge manipulacije svojstvene strukturi hijerarhije smjerova konsolidacije trebaju se izvoditi u najprikladnijem, prirodnijem i najudobnijem korisničkom sučelju.

Fleksibilni mehanizam izvješćivanja. Mora biti podržan razne načine vizualizaciju podataka, odnosno izvještaje treba prezentirati u bilo kojoj mogućoj orijentaciji.

Neograničene dimenzije i razine agregacije. Strogo se preporučuje da svaki ozbiljan OLAP alat pretpostavi najmanje petnaest, a po mogućnosti dvadeset dimenzija u analitičkom modelu.

2 Komponente OLAP sustava

2.1 Poslužitelj. Klijent. Internet

OLAP vam omogućuje brzu i učinkovitu analizu velikih količina podataka. Podaci se pohranjuju u višedimenzionalnom obliku koji najbliže odražava prirodno stanje poslovnih podataka u stvarnom svijetu. OLAP također pruža korisnicima mogućnost bržeg i lakšeg prikupljanja podataka. Pomoću njega mogu prodreti u sadržaj tih podataka ako je potrebno kako bi dobili detaljnije informacije.

OLAP sustav sastoji se od mnogo komponenti. Na najvišoj razini prezentacije sustav uključuje izvor podataka, OLAP poslužitelj i klijenta. Izvor podataka predstavlja izvor iz kojeg se preuzimaju podaci za analizu. Podaci iz izvora se prenose ili kopiraju na OLAP poslužitelj, gdje se sistematiziraju i pripremaju za brže generiranje odgovora na upite. Klijent je korisničko sučelje za OLAP poslužitelj. Ovaj dio članka opisuje funkcije svake komponente i značaj cijelog sustava kao cjeline. Izvori. Izvor u OLAP sustavima je poslužitelj koji dostavlja podatke za analizu. Ovisno o području korištenja OLAP proizvoda, izvor može biti skladište podataka, naslijeđena baza podataka koja sadrži zajedničke podatke, skup tablica koje kombiniraju financijske podatke ili bilo koja kombinacija gore navedenog. Sposobnost OLAP proizvoda da radi s podacima iz različitih izvora vrlo je važna. Zahtijevanje jednog formata ili jedne baze podataka u kojoj su pohranjeni svi izvorni podaci nije prikladno za administratore baze podataka. Osim toga, ovaj pristup smanjuje fleksibilnost i snagu OLAP proizvoda. Administratori i korisnici vjeruju da su OLAP proizvodi koji mogu dohvatiti podatke ne samo iz višestrukih izvora, već i višestrukih izvora fleksibilniji i korisniji od onih sa strožim zahtjevima.

poslužitelj. Aplikacijski dio OLAP sustava je OLAP poslužitelj. Ova komponenta obavlja sav posao (ovisno o modelu sustava) i pohranjuje sve informacije kojima je omogućen aktivan pristup. Arhitekturu poslužitelja ravnaju različiti koncepti. Konkretno, glavna funkcionalna karakteristika OLAP proizvoda je korištenje višedimenzionalne (MMDB) ili relacijske (RDB) baze podataka za pohranu podataka. Skupni/prethodno skupni podaci

Implementacija brzih upita je imperativ za OLAP. Ovo je jedno od osnovnih načela OLAP-a - sposobnost intuitivnog manipuliranja podacima zahtijeva brzo pronalaženje informacija. Općenito, što se više izračuna mora napraviti da bi se dobila informacija, to je odgovor sporiji. Stoga, kako bi se vrijeme implementacije upita održalo kratkim, dijelovi informacija kojima se inače najčešće pristupa, ali koji također zahtijevaju izračun, podliježu preliminarnoj agregaciji. To jest, oni se broje i zatim pohranjuju u bazu podataka kao novi podaci. Primjer vrste podataka koji se mogu izračunati unaprijed su zbirni podaci - na primjer, podaci o prodaji za mjesece, tromjesečja ili godine, za koje su stvarni uneseni podaci dnevne brojke.

Različiti dobavljači imaju različite metode za odabir parametara, zahtijevajući prethodno zbrajanje i broj unaprijed izračunatih vrijednosti. Pristup agregacije utječe i na bazu podataka i na vrijeme izvršenja upita. Ako se izračunava više vrijednosti, povećava se vjerojatnost da će korisnik zatražiti vrijednost koja je već izračunata, a time će se smanjiti vrijeme odgovora jer neće morati zahtijevati izračunavanje izvorne vrijednosti. Međutim, ako izračunate sve moguće vrijednosti, to nije Najbolja odluka- u ovom slučaju se veličina baze podataka značajno povećava, što će ju učiniti neupravljivom, a vrijeme agregacije će biti predugo. Osim toga, kada se numeričke vrijednosti dodaju u bazu podataka ili ako se promijene, ove informacije moraju se odraziti na unaprijed izračunate vrijednosti koje ovise o novim podacima. Stoga ažuriranje baze podataka također može trajati dugo u slučaju velikog broja unaprijed izračunatih vrijednosti. Budući da baza podataka obično radi offline tijekom agregacije, poželjno je da vrijeme agregacije ne bude predugo.

Klijent. Klijent je upravo ono što se koristi za predstavljanje i manipuliranje podacima u bazi podataka. Klijent može biti vrlo jednostavan – u obliku tablice koja uključuje takve OLAP mogućnosti kao što su npr. rotacija podataka (pivoting) i produbljivanje u podatke (drilling), te predstavljati specijalizirani, ali jednako jednostavan preglednik izvješća ili biti takav ili moćan alat, kao prilagođena aplikacija dizajnirana za složenu manipulaciju podacima. Internet je novi oblik klijent. Osim toga, nosi pečat novih tehnologija; Mnoga se internetska rješenja značajno razlikuju po svojim mogućnostima općenito, a posebno kao OLAP rješenje. U ovaj odjeljak Raspravljaju se različita funkcionalna svojstva svakog tipa klijenta.

Unatoč činjenici da je poslužitelj “kičma” OLAP rješenja, klijent nije ništa manje važan. Poslužitelj može pružiti snažnu osnovu za olakšavanje manipulacije podacima, ali ako je klijent složen ili ograničen u funkcionalnosti, korisnik neće moći u potpunosti iskoristiti moćni poslužitelj. Kupac je toliko važan da mnogi dobavljači usmjeravaju svoje napore isključivo na razvoj kupaca. Sve što je uključeno u ove aplikacije je standardni izgled sučelja, unaprijed definirane funkcije i struktura, te brza rješenja za više-manje standardne situacije. Primjerice, popularni su financijski paketi. Unaprijed izgrađene financijske aplikacije profesionalcima omogućuju korištenje poznatih financijskih alata bez potrebe za dizajniranjem strukture baze podataka ili uobičajenih obrazaca i izvješća. Alat za upite/generator izvješća. Alat za upite ili generator izvješća nudi jednostavan pristup OLAP podacima. Imaju grafičko sučelje jednostavno za korištenje i omogućuju korisnicima stvaranje izvješća povlačenjem i ispuštanjem objekata u izvješće. Dok tradicionalni generator izvješća pruža korisniku mogućnost brze izrade formatiranih izvješća, generatori izvješća s omogućenim OLAP-om stvaraju ažurna izvješća. Konačni proizvod je izvješće koje ima mogućnost bušenja podataka do razine detalja, rotiranja (pivot) izvješća, podrške hijerarhijama itd. Dodaci (dodaci) proračunskih tablica.

Danas mnoge poslovne linije koriste proračunske tablice za izvođenje različitih oblika analize korporativnih podataka. Na neki način, to je idealan alat za izradu izvješća i pregled podataka. Analitičar može stvoriti makronaredbe koje manipuliraju podacima u određenom smjeru, a predložak se može dizajnirati tako da kada se unesu podaci, formule izračunavaju točne vrijednosti, eliminirajući potrebu za opetovanim unosom jednostavnih izračuna.

No, sve to rezultira "plošnim" izvješćem, što znači da ga je jednom izrađeno teško sagledati s različitih aspekata. Na primjer, grafikon prikazuje informacije za određeno vremensko razdoblje, recimo mjesec. A ako netko želi vidjeti dnevne podatke (za razliku od mjesečnih podataka), morat će se izraditi potpuno novi grafikon. Postoje novi skupovi podataka koje treba definirati, nove oznake koje treba dodati grafikonu i mnoge druge jednostavne, ali dugotrajne promjene koje treba napraviti. Osim toga, postoji niz područja u kojima se mogu pogriješiti, što ukupno smanjuje pouzdanost. Kada se tablici doda OLAP, moguće je izraditi jedan grafikon i zatim njime manipulirati na različite načine kako bi se korisniku pružile informacije koje su mu potrebne bez opterećenja stvaranja svih mogućih pogleda. Internet kao klijent. Najnoviji član obitelji OLAP klijenata je Internet. Mnogo je prednosti generiranja OLAP izvješća putem Interneta. Najznačajniji je nedostatak potrebe za specijaliziranim softverom za pristup informacijama. To tvrtki štedi puno vremena i novca.

Svaki Internet proizvod je specifičan. Neki olakšavaju stvaranje web stranica, ali imaju manju fleksibilnost. Drugi vam omogućuju stvaranje prikaza podataka i njihovo spremanje kao statične HTML datoteke. Sve to omogućuje pregled podataka putem interneta, ali ništa više. Uz njihovu pomoć nemoguće je aktivno manipulirati podacima.

Postoji još jedna vrsta proizvoda - interaktivna i dinamična, koja takve proizvode pretvara u potpuno funkcionalne alate. Korisnici mogu proučavati podatke, zaokretati, ograničavati mjerenja itd. Prije nego što odaberete internetsku implementaciju, važno je razumjeti što funkcionalnost potrebno od web rješenja, a zatim odredite koji će proizvod najbolje implementirati tu funkcionalnost.

Prijave. Aplikacije su vrsta klijenta koji koristi OLAP baze podataka. Oni su identični gore opisanim alatima za upite i generatorima izvješća, ali dodatno donose veću funkcionalnost proizvoda. Aplikacija je općenito moćnija od alata za upite.

Razvoj. Obično pružatelji OLAP-a pružaju razvojno okruženje za korisnike za stvaranje vlastitih prilagođenih aplikacija. Razvojno okruženje u cjelini je grafičko sučelje koje podržava objektno orijentirani razvoj aplikacija. Osim toga, većina dobavljača nudi API koji se može koristiti za integraciju OLAP baza podataka s drugim aplikacijama.

2.2 OLAP klijenti

OLAP klijenti s ugrađenim OLAP motorom instalirani su na osobnim računalima korisnika. Ne zahtijevaju poslužitelj za računalstvo i nemaju nikakvu administraciju. Takvi klijenti omogućuju korisniku da se prilagodi svojim postojećim bazama podataka; U pravilu se stvara rječnik koji skriva fizičku strukturu podataka iza svog opisa predmeta, razumljivog stručnjaku. Nakon toga, OLAP klijent izvršava proizvoljne upite i prikazuje rezultate u OLAP tablici. U ovoj tablici, pak, korisnik može manipulirati podacima i primati stotine različitih izvješća na ekranu ili na papiru. OLAP klijenti dizajnirani za rad s RDBMS-ovima omogućuju vam analizu podataka koji su već dostupni u korporaciji, na primjer, pohranjeni u OLTP bazi podataka. Međutim, njihova druga svrha može biti brzo i jeftino stvaranje skladišta ili kioska podataka - u ovom slučaju, programeri organizacije trebaju samo stvoriti skupove zvjezdanih tablica u relacijskim bazama podataka i procedurama učitavanja podataka. Najdugotrajniji dio posla - pisanje sučelja s brojnim opcijama za prilagođene upite i izvješća - implementira se u OLAP klijent u samo nekoliko sati. Za svladavanje takvog programa krajnjem korisniku treba oko 30 minuta. OLAP klijente isporučuju sami programeri baza podataka, kako multidimenzionalnih tako i relacijskih. To su SAS Corporate Reporter, koji je gotovo standardni proizvod u smislu praktičnosti i ljepote, Oracle Discoverer, set programa MS Pivot Services i Pivot Table, itd. Mnogi programi dizajnirani za rad s MS OLAP uslugama isporučuju se kao dio Kampanja “OLAP to the Masses” koju provodi Microsoft Corporation. U pravilu su to poboljšane verzije Pivot Table i namijenjene su za korištenje u MS Officeu ili web pregledniku. Riječ je o proizvodima tvrtki Matryx, Knosys itd., koji su zbog svoje jednostavnosti, jeftinosti i učinkovitosti stekli golemu popularnost na Zapadu.

3 Klasifikacija OLAP proizvoda

3.1 Višedimenzionalni OLAP

Trenutačno postoji veliki broj proizvoda na tržištu koji pružaju OLAP funkcionalnost u jednom ili drugom stupnju. Pružanje višedimenzionalnog konceptualnog pogleda izvana korisničko sučelje prema izvornoj bazi podataka, svi OLAP proizvodi podijeljeni su u tri klase prema vrsti izvorne baze podataka.

1. Prvi online sustavi analitičke obrade (na primjer, Essbase iz Arbor Software-a, Oracle Express Server iz Oracle-a) pripadali su MOLAP klasi, odnosno mogli su raditi samo sa svojim vlastitim višedimenzionalnim bazama podataka. Temelje se na vlasničkim tehnologijama za višedimenzionalne DBMS-ove i najskuplji su. Ovi sustavi pružaju puni ciklus OLAP obrade. Oni ili uključuju, uz komponentu poslužitelja, vlastito integrirano klijentsko sučelje ili koriste vanjski programi rad s proračunskim tablicama. Za održavanje takvih sustava potrebno je posebno osoblje zaposlenika koji će instalirati, održavati sustav i kreirati prikaze podataka za krajnje korisnike.

2. Sustavi relacijske mrežne analitičke obrade (ROLAP) omogućuju da podaci pohranjeni u relacijskoj bazi podataka budu predstavljeni u višedimenzionalnom obliku, osiguravajući transformaciju informacija u višedimenzionalni model kroz posredni sloj metapodataka. Ova klasa uključuje MicroStrategyjev DSS Suite, Informixov MetaCube, Information Advantageov DecisionSuite i druge. Programski paket InfoVisor, razvijen u Rusiji, na Ivanovskom državnom energetskom sveučilištu, također je sustav ove klase. ROLAP sustavi dobro su prilagođeni za rad s velikim skladišnim prostorima. Poput MOLAP sustava, oni zahtijevaju značajno održavanje od strane stručnjaka za informacijsku tehnologiju i uključuju višekorisnički rad.

3. Konačno, hibridni sustavi (Hybrid OLAP, HOLAP) dizajnirani su tako da kombiniraju prednosti i minimiziraju nedostatke svojstvene prethodnim klasama. Speedware Media/MR spada u ovu klasu. Prema programerima, on kombinira analitičku fleksibilnost i brzinu odgovora MOLAP-a sa stalnim pristupom stvarnim podacima koji su svojstveni ROLAP-u.

Osim navedenih alata, postoji još jedna klasa - alati za generiranje upita i izvješća za stolna računala, dopunjeni OLAP funkcijama ili integrirani s vanjskim alatima koji obavljaju takve funkcije. Ovi dobro razvijeni sustavi dohvaćaju podatke iz izvornih izvora, transformiraju ih i smještaju u dinamičku višedimenzionalnu bazu podataka koja radi na klijentskoj stanici krajnjeg korisnika. Glavni predstavnici ove klase su BusinessObjects iz istoimene tvrtke, BrioQuery iz Brio Technology i PowerPlay iz Cognosa. Pregled nekih OLAP proizvoda nalazi se u dodatku.

U specijaliziranim DBMS-ovima koji se temelje na višedimenzionalnom predstavljanju podataka, podaci nisu organizirani u obliku relacijskih tablica, već u obliku uređenih višedimenzionalnih nizova:

1) hiperkocke (sve ćelije pohranjene u bazi moraju imati istu dimenziju, odnosno biti u najpotpunijoj mjernoj osnovi) ili

2) polikocke (svaka se varijabla pohranjuje s vlastitim skupom mjerenja, a sve pridružene poteškoće obrade prenose se na interne mehanizme sustava).

Korištenje višedimenzionalnih baza podataka u sustavima online analitičke obrade ima sljedeće prednosti.

1. U slučaju korištenja višedimenzionalnog DBMS-a, pretraživanje i dohvaćanje podataka puno je brže nego kod višedimenzionalnog konceptualnog prikaza relacijske baze podataka, budući da je višedimenzionalna baza denormalizirana, sadrži unaprijed agregirane indikatore i pruža optimiziran pristup traženim ćelijama.

2. Višedimenzionalni DBMS-ovi lako se nose sa zadacima uključivanja različitih ugrađenih funkcija u informacijski model, dok objektivno postojeća ograničenja SQL jezika čine izvršavanje ovih zadataka na temelju relacijskih DBMS-ova prilično teškim, a ponekad i nemogućim.

S druge strane, postoje značajna ograničenja.

1. Višedimenzionalni DBMS ne dopuštaju rad s velikim bazama podataka. Osim toga, zbog denormalizacije i prethodno izvršene agregacije, obujam podataka u višedimenzionalnoj bazi podataka u pravilu odgovara (prema Coddovoj procjeni) 2,5-100 puta manji od volumena izvornih detaljnih podataka.

2. Višedimenzionalni DBMS-ovi, u usporedbi s relacijskima, vrlo neučinkovito koriste vanjsku memoriju. U velikoj većini slučajeva informacijska hiperkocka vrlo je rijetka, a budući da su podaci pohranjeni u uređenom obliku, nedefinirane vrijednosti mogu se ukloniti samo odabirom optimalnog redoslijeda sortiranja, koji vam omogućuje organiziranje podataka u najveće moguće susjedne grupe. Ali čak iu ovom slučaju problem je samo djelomično riješen. Osim toga, optimalni redoslijed sortiranja za pohranjivanje rijetkih podataka najvjerojatnije neće biti redoslijed koji se najčešće koristi u upitima. Stoga je u stvarnim sustavima potrebno tražiti kompromis između performansi i redundancije diskovnog prostora koji baza podataka zauzima.

Posljedično, korištenje višedimenzionalnog DBMS-a je opravdano samo pod sljedećim uvjetima.

1. Količina početnih podataka za analizu nije prevelika (ne više od nekoliko gigabajta), odnosno, razina agregacije podataka je prilično visoka.

2. Skup informacijskih dimenzija je stabilan (budući da svaka promjena u njihovoj strukturi gotovo uvijek zahtijeva potpuno restrukturiranje hiperkocke).

3. Vrijeme odgovora sustava na neregulirane zahtjeve najkritičniji je parametar.

4. Zahtijeva opsežnu upotrebu složenih ugrađenih funkcija za izvođenje međudimenzionalnih izračuna na ćelijama hiperkocke, uključujući mogućnost pisanja prilagođenih funkcija.

Izravna uporaba relacijskih baza podataka u sustavima online analitičke obrade ima sljedeće prednosti.

1. U većini slučajeva korporativna skladišta podataka implementirana su pomoću relacijskih DBMS-ova, a ROLAP alati omogućuju analizu izravno na njima. U isto vrijeme, veličina pohrane nije tako kritičan parametar kao u slučaju MOLAP-a.

2. U slučaju varijabilne dimenzije problema, kada je potrebno često mijenjati mjernu strukturu, optimalno rješenje su ROLAP sustavi s dinamičkim prikazom dimenzija, jer takve izmjene ne zahtijevaju fizičku reorganizaciju baze podataka.

3. Relacijski DBMS pružaju znatno više visoka razina zaštitu podataka i dobre mogućnosti za razlikovanje prava pristupa.

Glavni nedostatak ROLAP-a u usporedbi s višedimenzionalnim DBMS-ovima je niža izvedba. Kako bi pružili performanse usporedive s MOLAP-om, relacijski sustavi zahtijevaju pažljivo dizajniranje sheme baze podataka i konfiguraciju indeksa, odnosno puno truda od strane administratora baze podataka. Samo korištenjem zvjezdanih shema performanse dobro podešenih relacijskih sustava mogu se približiti performansama sustava temeljenih na višedimenzionalnim bazama podataka.

Radovi su u cijelosti posvećeni opisu zvjezdane sheme i preporukama za njezinu upotrebu. Ideja je da postoje tablice za svaku dimenziju, a sve činjenice su smještene u jednu tablicu, indeksiranu višestrukim ključem koji se sastoji od ključeva pojedinačnih dimenzija (Dodatak A). Svaka zraka zvjezdanog dijagrama specificira, prema Codd-ovoj terminologiji, smjer konsolidacije podataka duž odgovarajuće dimenzije.

U složenim problemima s dimenzijama na više razina ima smisla okrenuti se proširenjima sheme zvijezda - shemi konstelacije (shema konstelacije činjenica) i shemi pahulje (shema pahuljice). U tim se slučajevima izrađuju zasebne tablice činjenica za moguće kombinacije razina sažetka razna mjerenja(Dodatak B). To omogućuje bolje performanse, ali često dovodi do redundantnosti podataka i značajne složenosti strukture baze podataka, koja sadrži ogroman broj tablica činjenica.

Povećanje broja tablica činjenica u bazi podataka može proizaći ne samo iz mnoštva razina različitih dimenzija, već i iz činjenice da, općenito, činjenice imaju različite skupove dimenzija. Prilikom apstrahiranja od pojedinačnih mjerenja, korisnik mora dobiti projekciju najpotpunije hiperkocke, a vrijednosti pokazatelja u njoj nisu uvijek rezultat elementarnog zbrajanja. Dakle, s velikim brojem neovisnih dimenzija, potrebno je održavati mnogo tablica činjenica koje odgovaraju svakoj mogućoj kombinaciji dimenzija odabranih u upitu, što također dovodi do rasipne upotrebe vanjska memorija, povećavajući vrijeme učitavanja podataka u bazu podataka zvjezdane sheme iz vanjski izvori i administrativne poteškoće.

Proširenja SQL jezika djelomično rješavaju ovaj problem (naredbe GROUP BY CUBE, GROUP BY ROLLUP i GROUP BY GROUPING SETS); osim toga, predlaže se mehanizam za pronalaženje kompromisa između redundantnosti i performansi, preporučujući stvaranje tablica činjenica ne za sve moguće kombinacije dimenzija, ali samo za one čije se vrijednosti ćelija ne mogu dobiti korištenjem naknadne agregacije više puni stolovičinjenice (Dodatak B).

U svakom slučaju, ako višedimenzionalni model implementiran kao relacijska baza podataka, trebali biste stvoriti duge i "uske" tablice činjenica i relativno male i "široke" tablice dimenzija. Tablice činjenica sadrže numeričke vrijednosti ćelija hiperkocke, a preostale tablice definiraju višedimenzionalnu osnovu mjerenja koja ih sadrži. Neke informacije mogu se dobiti korištenjem dinamičke agregacije podataka raspoređenih preko normaliziranih struktura bez zvijezda, iako treba imati na umu da upiti koji uključuju agregaciju u visoko normaliziranoj strukturi baze podataka mogu biti prilično spori.

Fokusiranje na reprezentaciju višedimenzionalnih informacija pomoću zvjezdastih relacijskih modela omogućuje nam da se riješimo problema optimizacije pohranjivanja rijetkih matrica, što je akutno za višedimenzionalne DBMS (gdje se problem rijetkosti rješava posebnim izborom sheme). Iako se za pohranjivanje svake ćelije koristi cijeli zapis koji, osim samih vrijednosti, uključuje i sekundarne ključeve - poveznice na dimenzijske tablice, nepostojeće vrijednosti jednostavno nisu uključene u tablicu činjenica.

Zaključak

Nakon razmatranja problematike rada i primjene OLAP tehnologije, tvrtke se suočavaju s pitanjima čiji će odgovori omogućiti odabir proizvoda koji najbolje zadovoljava potrebe korisnika.

Ovo su sljedeća pitanja:

Odakle dolaze podaci? – Podaci koji se analiziraju mogu se nalaziti na različitim mjestima. Moguće je da će ih OLAP baza podataka primiti iz skladišta podataka poduzeća ili iz OLTP sustava. Ako OLAP proizvod već ima mogućnost pristupa nekom izvoru podataka, smanjuju se procesi kategorizacije i čišćenja podataka.

Koje manipulacije korisnik izvodi na podacima? -
Nakon što korisnik pristupi bazi podataka i počne s analizom, važno je da može manipulirati podacima na odgovarajući način. Ovisno o potrebama korisnika, može biti da je potreban moćan generator izvješća ili mogućnost stvaranja i ugošćavanja dinamičkih web stranica. Međutim, može biti poželjno da korisnik ima na raspolaganju sredstvo za jednostavno i brzo kreiranje vlastitih aplikacija.

Kolika je ukupna količina podataka? - Ovo je najvažniji faktor kod definiranja OLAP baze podataka. Relacijski OLAP proizvodi mogu rukovati velikim količinama podataka bolje od višedimenzionalnih. Ako količina podataka ne zahtijeva korištenje relacijske baze podataka, višedimenzionalni proizvod može se koristiti s jednakim uspjehom.

Tko je korisnik? - Prilikom definiranja klijenta OLAP sustava važna je razina vještina korisnika. Nekim korisnicima je ugodnije integrirati OLAP s tablicom, dok će drugi više voljeti namjensku aplikaciju. Ovisno o kvalifikacijama korisnika, također se odlučuje o pitanju provođenja obuke. Velika tvrtka može biti spremna platiti obuku korisnika, manja tvrtka to može odbiti. Klijent bi trebao biti takav da se korisnici osjećaju samouvjereno i da ga mogu učinkovito koristiti.

Danas je većina svjetskih kompanija prešla na korištenje OLAP-a kao temeljne tehnologije za pružanje informacija donositeljima odluka. Stoga je temeljno pitanje treba li se i dalje koristiti proračunske tablice kao primarna platforma za izvješćivanje, proračun i predviđanje. Tvrtke se moraju zapitati jesu li spremne izgubiti konkurentsku prednost korištenjem netočnih, irelevantnih i nepotpunih informacija prije nego što dovoljno sazriju da razmotre alternativne tehnologije.

Također, zaključno, treba napomenuti da analitičke mogućnosti OLAP tehnologija povećavaju korisnost podataka pohranjenih u korporativnom informacijskom skladištu, omogućujući tvrtki učinkovitiju interakciju sa svojim klijentima.

Glosar

Koncept Definicija
1 BI alati Alati i tehnologije koji se koriste za pristup informacijama. Uključuje OLAP tehnologije, rudarenje podataka i kompleksna analiza; alati za krajnje korisnike i ad hoc alati za upite, nadzorne ploče za praćenje poslovanja i generatori korporativnih izvješća.
2 On-line analitička obrada, OLAP (Operational Analytical Processing) Tehnologija za analitičku obradu informacija u stvarnom vremenu, uključujući sastavljanje i dinamičko objavljivanje izvješća i dokumenata.
3 Slice and Dice (Uzdužni i poprečni presjeci, doslovno - "rezanje na kriške i kocke") Izraz koji se koristi za opisivanje složene funkcije analize podataka koju pružaju OLAP alati. Dohvaćanje podataka iz višedimenzionalne kocke s određenim vrijednostima i određenim relativnim rasporedom dimenzija.
4 Data Pivot Proces rotiranja tablice podataka, odnosno pretvaranje stupaca u retke i obrnuto.
5 Izračunati član Mjerni element čija je veličina određena veličinama drugih elemenata (na primjer, u matematičkim ili logičkim primjenama). Izračunati element može biti dio OLAP poslužitelja ili ga može opisati korisnik tijekom interaktivne sesije. Izračunati element je svaki element koji nije upisan, ali je izračunat.
6 Globalni poslovni modeli Vrsta skladišta podataka koja omogućuje pristup informacijama koje su distribuirane kroz različite sustave poduzeća i pod kontrolom su različitih odjela ili odjela s različitim bazama podataka i modelima podataka. Ovu vrstu skladišta podataka teško je izgraditi zbog potrebe kombiniranja napora korisnika iz različitih odjela za razvoj zajedničkog modela podataka za skladište.
7 rudarenje podataka Tehničke tehnike pomoću programskih alata namijenjene su takvom korisniku koji u pravilu ne može unaprijed reći što točno traži, već može samo naznačiti određene obrasce i smjerove traženja.
8 Klijent/poslužitelj Tehnološki pristup koji se sastoji u podjeli procesa na zasebne funkcije. Poslužitelj obavlja nekoliko funkcija - upravljanje komunikacijama, pružanje održavanja baze podataka itd. Klijent obavlja pojedinačne korisničke funkcije - pružanje odgovarajućih sučelja, izvođenje navigacije preko ekrana, pružanje funkcija pomoći itd.
9 Višedimenzionalna baza podataka, MDBS i MDBMS Snažna baza podataka koja korisnicima omogućuje analizu velikih količina podataka. Baza podataka s posebnom organizacijom pohrane - kocke, pružanje velika brzina rad s podacima pohranjenim kao zbirka činjenica, dimenzija i unaprijed izračunatih agregata.
10 Bušiti u dubinu Metoda ispitivanja detaljnih podataka koja se koristi za analizu razine sažetka podataka. Razine "produbljivanja" ovise o razini detalja podataka u [ran.
11 Centralno skladište

1. Baza podataka koja sadrži podatke prikupljene iz operativni sustavi organizacije. Ima strukturu pogodnu za analizu podataka. Dizajniran za podršku donošenju odluka i stvaranje jedinstvenog informacijski prostor korporacije.

2. Metoda automatizacije koja pokriva sve informacijske sustave kojima se upravlja s jednog mjesta.

1 Golitsina O.L., Maksimov N.V., Popov I.I. Baze podataka: Udžbenik. – M.: FORUM: INFRA-M, 2003. – 352 str.

2 Datum K. Uvod u sustave baza podataka. – M.: Nauka, 2005 – 246 str.

3 Elmanova N.V., Fedorov A.A. Uvod u Microsoft OLAP tehnologije. – M.: Dialog-MEPhI, 2004. – 312 str.

4 Karpova T.S. Baze podataka: modeli, razvoj, implementacija. – St. Petersburg: Peter, 2006. – 304 str.

5 Korovkin S. D., Levenets I. A., Ratmanova I. D., Starykh V. A., Shchavelev L. V. Rješenje problema složene operativne analize informacija iz skladišta podataka // DBMS. - 2005. - br. 5-6. - 47-51 s.

6 Krechetov N., Ivanov P. Proizvodi za rudarenje podataka ComputerWeek-Moscow. - 2003. - br. 14-15. - 32-39 s.

7 Przhiyalkovsky V. V. Kompleksna analiza podataka velikog volumena: nove perspektive za kompjuterizaciju // DBMS. - 2006. - br. 4. - 71-83 str.

8 Sakharov A. A. Koncept izgradnje i implementacije informacijskih sustava usmjerenih na analizu podataka // DBMS. - 2004. - br. 4. - 55-70 str.

9 Ullman J. Osnove sustava baza podataka. – M.: Financije i statistika, 2003. – 312 str.

10 Hubbard J. Automatizirani dizajn baze podataka. – M.: Mir, 2007. – 294 str.


Korovkin S. D., Levenets I. A., Ratmanova I. D., Starykh V. A., Shchavelev L. V. Rješenje problema složene operativne analize informacija iz skladišta podataka // DBMS. - 2005. - br. 5-6. - 47-51 s.

Ullman J. Osnove sustava baza podataka. – M.: Financije i statistika, 2003. – 312 str.

Barseghyan A.A., Kupriyanov M.S. Tehnologije analize podataka: DataMining, VisualMining, TextMining, Olap. – St. Petersburg: BHV-Petersburg, 2007. – 532 str.

Elmanova N.V., Fedorov A.A. Uvod u Microsoft OLAP tehnologije. – M.: Dialog-MEPhI, 2004. – 312 str.

Datum K. Uvod u sustave baza podataka. – M.: Nauka, 2005 – 246 str.

Golitsina O.L., Maksimov N.V., Popov I.I. Baze podataka: Udžbenik. – M.: FORUM: INFRA-M, 2003. – 352 str.

Sakharov A. A. Koncept izgradnje i implementacije informacijskih sustava usmjerenih na analizu podataka // DBMS. - 2004. - br. 4. - 55-70 str.

Przhiyalkovsky V. V. Kompleksna analiza podataka velikog volumena: nove perspektive za kompjuterizaciju // DBMS. - 2006. - br. 4. - 71-83 str.

skladišta podataka formiraju se na temelju snimaka operativnih baza podataka snimljenih u dužem vremenskom razdoblju informacijski sistem a moguće i razne vanjske izvore. Skladišta podataka koriste tehnologije baze podataka, OLAP, duboku analizu podataka i vizualizaciju podataka.

Glavne karakteristike skladišta podataka.

  • sadrži povijesne podatke;
  • pohranjuje detaljne informacije, te djelomično i potpuno sažete podatke;
  • podaci su uglavnom statični;
  • ad hoc, nestrukturiran i heuristički način obrade podataka;
  • srednji i niski intenzitet obrade transakcija;
  • nepredvidiv način korištenja podataka;
  • namijenjen za analizu;
  • usmjeren na predmetna područja;
  • podrška donošenju strateških odluka;
  • opslužuje relativno mali broj zaposlenih u menadžmentu.

Pojam OLAP (On-Line Analytical Processing) koristi se za opis modela za prikaz podataka i, sukladno tome, tehnologije za njihovu obradu u skladištima podataka. OLAP koristi višedimenzionalni prikaz agregiranih podataka za pružanje brz pristup da strateški važna informacija u svrhu dubinske analize. OLAP aplikacije moraju imati sljedeća osnovna svojstva:

  • višedimenzionalni prezentacija podataka;
  • podrška za složene izračune;
  • ispravno uvažavanje faktora vremena.

Prednosti OLAP-a:

  • promocija produktivnost proizvodno osoblje, programeri aplikacijski programi. Pravovremeni pristup strateškim informacijama.
  • pružajući dovoljno mogućnosti korisnicima da naprave vlastite promjene u shemi.
  • OLAP aplikacije oslanjaju se na skladišta podataka i OLTP sustave, primajući od njih trenutne podatke, što omogućuje spremanje kontrola integriteta korporativni podaci.
  • smanjenje opterećenja OLTP sustava i skladišta podataka.

OLAP i OLTP. Karakteristike i glavne razlike

OLAP OLTP
Pohrana podataka treba uključivati ​​i interne korporativne podatke i eksterne podatke glavni izvor informacija koje ulaze u operativnu bazu su aktivnosti korporacije, a analiza podataka zahtijeva uključivanje vanjskih izvora informacija (primjerice, statistička izvješća)
Obim analitičkih baza podataka barem je za red veličine veći od obujma operativnih. provoditi pouzdane analize i prognoze pohrana podataka morate imati informacije o aktivnostima korporacije i tržišnim uvjetima tijekom nekoliko godina Za brzu obradu potrebni su podaci za zadnjih nekoliko mjeseci
Pohrana podataka mora sadržavati jedinstveno prezentirane i konzistentne informacije koje su što bliže sadržaju operativnih baza podataka. Komponenta je potrebna za izdvajanje i "čišćenje" informacija iz različitih izvora. U mnogim velikim korporacijama istovremeno postoji (zbog povijesnih razloga) nekoliko operativnih informacijskih sustava s vlastitim bazama podataka. Operativne baze podataka mogu sadržavati semantički ekvivalentne informacije predstavljene u različite formate, s različitim naznakama vremena dolaska, ponekad čak i kontradiktornim
Skup upita za analitičku bazu podataka ne može se predvidjeti. skladišta podataka postoje kako bi odgovorili na ad hoc zahtjeve analitičara. Možete samo računati na činjenicu da zahtjevi neće dolaziti prečesto i da će uključivati ​​velike količine informacija. Veličina analitičke baze podataka potiče korištenje upita s agregatima (zbroj, minimum, maksimum, Prosječna vrijednost itd.) Sustavi za obradu podataka stvoreni su za rješavanje specifičnih problema. Informacije iz baze podataka biraju se često iu malim obrocima. Obično je skup upita operativnoj bazi podataka poznat već tijekom projektiranja
Uz malu varijabilnost analitičkih baza podataka (samo pri učitavanju podataka), redoslijed nizova ispada razumnim, više brze metode indeksiranje za masovno uzorkovanje, pohranjivanje unaprijed agregiranih podataka Sustavi za obradu podataka po svojoj su prirodi vrlo varijabilni, što je uzeto u obzir u korištenom DBMS-u (normalizirana struktura baze podataka, redovi pohranjeni bez reda, B-stabla za indeksiranje, transakcijski)
Podaci analitičke baze podataka toliko su kritični za korporaciju da je potrebna veća granularnost zaštite (individualna prava pristupa određenim recima i/ili stupcima tablice) Za sustave za obradu podataka to je obično dovoljno zaštita informacija na razini stola

Coddova pravila za OLAP sustave

Godine 1993. Codd je objavio OLAP za korisničke analitičare: što bi trebao biti. U njemu je iznio osnovne koncepte online analitike i definirao 12 pravila koja moraju ispunjavati proizvodi koji pružaju mogućnosti online analitike.

  1. Konceptualni višedimenzionalni prikaz. OLAP model mora biti višedimenzionalan u svojoj srži. Višedimenzionalni konceptualni dijagram ili prilagođeni prikaz olakšava modeliranje i analizu, kao i izračune.
  2. Transparentnost. Korisnik je u mogućnosti dobiti sve potrebne podatke iz OLAP motora, a da niti ne zna odakle oni dolaze. Bez obzira na to je li OLAP proizvod dio korisničkih alata ili ne, ova činjenica korisniku bi trebala biti nevidljiva. Ako OLAP pruža klijentsko-poslužiteljsko računalstvo, tada bi i ta činjenica, ako je moguće, trebala biti nevidljiva korisniku. OLAP mora biti osiguran u kontekstu istinski otvorene arhitekture, dopuštajući korisniku, gdje god se nalazio, da putem analitičkog alata komunicira s poslužiteljem. Uz to, transparentnost bi također trebala biti postignuta kada analitički alat komunicira s homogenim i heterogenim okruženjima baza podataka.
  3. Dostupnost. OLAP mora osigurati svoje logički sklop za pristup u heterogenom okruženju baze podataka i izvođenje odgovarajućih transformacija za pružanje podataka korisniku. Štoviše, potrebno je unaprijed voditi računa o tome gdje će se i kako te kakve vrste fizičke organizacije podataka zapravo koristiti. OLAP sustav bi trebao pristupati samo podacima koji su stvarno potrebni, a ne primjenjivati ​​opći princip "kuhinjskog lijevka" koji podrazumijeva nepotreban unos.
  4. Konstantno izvođenje prilikom izrade izvješća. Izvođenje mogućnost generiranja izvješća ne bi trebala značajno pasti kako se povećava broj dimenzija i veličina baze podataka.
  5. Arhitektura klijent-poslužitelj. Zahtijeva da proizvod nije samo klijent-poslužitelj, već i da poslužiteljska komponenta bude dovoljno inteligentna da omogući povezivanje različitih klijenata uz minimalan napor i programiranje.
  6. Opća višedimenzionalnost. Sve dimenzije moraju biti jednake, svaka dimenzija mora biti ekvivalentna iu strukturi iu operativnim sposobnostima. Istina, dopuštene su dodatne operativne mogućnosti za pojedinačna mjerenja (navodno se podrazumijeva vrijeme), ali takva dodatne funkcije moraju biti osigurani za svako mjerenje. Ne bi trebalo biti tako da osnovno strukture podataka, računalni ili izvještajni formati bili su specifičniji za jednu dimenziju.
  7. Dinamička kontrola rijetke matrice. OLAP sustavi moraju automatski prilagoditi svoju fizičku shemu ovisno o vrsti modela, količini podataka i rijetkosti baze podataka.
  8. Podrška za više korisnika. OLAP alat mora pružiti mogućnosti dijeljenje(upit i završetak), cjelovitost i sigurnost.
  9. Neograničene križne operacije. Za sva mjerenja moraju biti dopuštene sve vrste operacija.
  10. Intuitivna manipulacija podacima. Manipulacija podacima provedena je izravnim radnjama na ćelijama u načinu pregledavanja bez korištenja izbornika i višestrukih operacija.
  11. Fleksibilne mogućnosti izvješćivanja. Dimenzije trebaju biti postavljene u izvješće onako kako to korisnik treba.
  12. Neograničen

4. Klasifikacija OLAP proizvoda.

5. Principi rada OLAP klijenata.

7. Područja primjene OLAP tehnologija.

8. Primjer korištenja OLAP tehnologija za analizu u prodaji.

1. Mjesto OLAP-a u informacijskoj strukturi poduzeća.

Pojam „OLAP“ neraskidivo je povezan s pojmom „skladište podataka“ (Data Warehouse).

Podaci u skladište dolaze iz operativnih sustava (OLTP sustava) koji su namijenjeni automatizaciji poslovnih procesa. Osim toga, repozitorij se može nadopunjavati iz vanjskih izvora, kao što su statistička izvješća.

Svrha repozitorija je pružiti “sirovi materijal” za analizu na jednom mjestu iu jednostavnoj, razumljivoj strukturi.

Postoji još jedan razlog koji opravdava pojavu zasebnog skladišnog prostora - složeni analitički upiti za operativnim informacijama usporavaju trenutni rad tvrtke, dugotrajno blokiraju tablice i oduzimaju resurse poslužitelja.

Repozitorij ne mora nužno značiti gigantsku akumulaciju podataka - glavna stvar je da je pogodan za analizu.

Centralizacija i prikladno strukturiranje nisu sve što je potrebno analitičaru. I dalje mu treba alat za gledanje i vizualizaciju informacija. Tradicionalnim izvješćima, čak i onima izgrađenim na jednom repozitoriju, nedostaje jedna stvar - fleksibilnost. Ne mogu se "zaokrenuti", "proširiti" ili "skupiti" da bi se dobio željeni prikaz podataka. Kad bi barem imao alat koji bi mu omogućio jednostavno i praktično proširivanje i sažimanje podataka! OLAP djeluje kao takav alat.

Iako OLAP nije nužan atribut skladišta podataka, sve se više koristi za analizu informacija akumuliranih u skladištu.

Mjesto OLAP-a u informacijskoj strukturi poduzeća (slika 1).

Slika 1. MjestoOLAP u informacijskoj strukturi poduzeća

Operativni podaci prikupljaju se iz različitih izvora, čiste, integriraju i pohranjuju u relacijsku pohranu. Štoviše, već su dostupni za analizu pomoću različitih alata za izvješćivanje. Zatim se podaci (cijeli ili djelomično) pripremaju za OLAP analizu. Mogu se učitati u posebnu OLAP bazu podataka ili pohraniti u relacijsku pohranu. Njegov najvažniji element su metapodaci, odnosno informacije o strukturi, smještaju i transformaciji podataka. Zahvaljujući njima, osigurana je učinkovita interakcija različitih komponenti za pohranu.

Ukratko, OLAP možemo definirati kao skup alata za višedimenzionalnu analizu podataka akumuliranih u skladištu.

2. Operativna analitička obrada podataka.

OLAP koncept temelji se na principu višedimenzionalnog prikaza podataka. E. F. Codd se 1993. godine osvrnuo na nedostatke relacijskog modela, prvenstveno ističući nemogućnost "spajanja, pregleda i analize podataka u smislu više dimenzija, odnosno na najrazumljiviji način analitičarima poduzeća", te je definirao opće zahtjeve za OLAP sustave koji proširuju funkcionalnost relacijskih DBMS-ova i uključuju višedimenzionalnu analizu kao jednu od njegovih karakteristika.

Prema Coddu, višedimenzionalni konceptualni pogled je višestruka perspektiva koja se sastoji od nekoliko neovisnih dimenzija duž kojih se specifični skupovi podataka mogu analizirati.

Simultana analiza u više dimenzija definira se kao multivarijatna analiza. Svaka dimenzija uključuje područja konsolidacije podataka, koja se sastoje od niza uzastopnih razina generalizacije, pri čemu svaka viša razina odgovara višem stupnju agregacije podataka za odgovarajuću dimenziju.

Dakle, dimenzija izvođača može se odrediti smjerom konsolidacije, koji se sastoji od razina generalizacije “poduzeće - odjel - odjel - zaposlenik”. Dimenzija vremena može čak uključiti dva smjera konsolidacije - "godina - tromjesečje - mjesec - dan" i "tjedan - dan", budući da je računanje vremena po mjesecu i po tjednu nekompatibilno. U tom slučaju postaje moguće proizvoljno odabrati željenu razinu detalja informacija za svaku od dimenzija.

Operacija spuštanja (bušenje) odgovara kretanju od viših stupnjeva konsolidacije do nižih; naprotiv, operacija podizanja (namotavanje) znači kretanje s nižih razina na više (slika 2).


Slika 2.Dimenzije i smjerovi konsolidacije podataka

3. Zahtjevi za online alate za analitičku obradu.

Višedimenzionalni pristup nastao je gotovo istovremeno i usporedno s relacijskim. Međutim, tek od sredine devedesetih, odnosno od
1993, interes za MDBMS počeo se širiti. Upravo se ove godine pojavio novi programski članak jednog od utemeljitelja relacijskog pristupa E. Codda, u kojem je formulirao 12 osnovnih zahtjeva za sredstva provedbe OLAP(Stol 1).

Stol 1.

Višedimenzionalni prikaz podataka

Alati moraju podržavati konceptualno višedimenzionalni pogled na podatke.

Transparentnost

Korisnik ne mora znati koji se specifični alati koriste za pohranu i obradu podataka, kako su podaci organizirani i odakle dolaze.

Dostupnost

Sami alati moraju odabrati i kontaktirati najbolji izvor podataka kako bi generirali odgovor na zadani zahtjev. Alati moraju moći automatski mapirati vlastitu logiku u različite heterogene izvore podataka.

Dosljedna izvedba

Izvedba bi trebala biti gotovo neovisna o broju dimenzija u upitu.

Podrška za arhitekturu klijent-poslužitelj

Alati moraju raditi u arhitekturi klijent-poslužitelj.

Jednakost svih dimenzija

Niti jedna dimenzija ne smije biti osnovna, sve moraju biti jednake (simetrične).

Dinamička obrada rijetkih matrica

Nedefinirane vrijednosti moraju se pohraniti i rukovati njima na najučinkovitiji mogući način.

Podrška za višekorisnički način rada s podacima

Alati moraju omogućiti rad više od jednog korisnika.

Podržava operacije temeljene na različitim dimenzijama

Sve višedimenzionalne operacije (kao što je agregacija) moraju se jednoobrazno i ​​dosljedno primijeniti na bilo koji broj bilo koje dimenzije.

Lakoća manipulacije podacima

Alati bi trebali imati najprikladnije, prirodnije i najudobnije korisničko sučelje.

Napredni alati za prezentaciju podataka

Alati moraju podržavati različite načine vizualizacije (prezentacije) podataka.

Neograničen broj dimenzija i razina agregacije podataka

Ne bi trebalo biti ograničenja u broju podržanih dimenzija.

Pravila za ocjenjivanje softverskih proizvoda klase OLAP

Skup ovih zahtjeva, koji je poslužio kao stvarna definicija OLAP-a, treba smatrati smjernicom, a pojedine proizvode ocjenjivati ​​prema stupnju u kojem se približavaju savršenom ispunjavanju svih zahtjeva.

Coddova definicija kasnije je revidirana u takozvani FASMI test, koji zahtijeva da OLAP aplikacija pruža mogućnost brze analize zajedničkih višedimenzionalnih informacija.

Prisjećanje na Coddovih 12 pravila previše je opterećujuće za većinu ljudi. Ispostavilo se da definiciju OLAP-a možemo sažeti sa samo pet ključnih riječi: Fast Analysis of Shared Multidimensional Information - ili, skraćeno - FASMI (u prijevodu s engleskog:F ast A analiza od S hared M ultradimenzionalni ja informacija).

Ova je definicija prvi put formulirana početkom 1995. godine i od tada je nije bilo potrebno revidirati.

BRZO ( brzo) - znači da bi sustav trebao moći pružiti većinu odgovora korisnicima unutar približno pet sekundi. Istodobno, najjednostavniji zahtjevi obrađuju se u roku od jedne sekunde i vrlo malo - više od 20 sekundi. Istraživanja su pokazala da krajnji korisnici doživljavaju proces neuspješnim ako se rezultati ne dobiju nakon 30 sekundi.

Na prvi pogled može se činiti iznenađujućim da prilikom primanja izvještaja u minuti za koji su ne tako davno bili potrebni dani, korisniku vrlo brzo postane dosadno čekanje, a projekt se pokaže puno manje uspješnim nego u slučaju instant odgovor, čak i po cijenu manje detaljne analize.

ANALIZAznači da se sustav može nositi s bilo kojom logičkom i statističkom analizom karakterističnom za ovu aplikaciju, te osigurava njegovo očuvanje u obliku dostupnom krajnjem korisniku.

Nije toliko važno provodi li se analiza u vlastitim alatima dobavljača ili u povezanom vanjskom softverskom proizvodu kao što je proračunska tablica, samo da se sve potrebne funkcionalnosti analize moraju pružiti na intuitivan način za krajnje korisnike. Alati za analizu mogu uključivati ​​određene postupke, kao što je analiza vremenskih nizova, raspodjela troškova, prijenosi valuta, ciljana pretraživanja, modifikacija višedimenzionalnih struktura, neproceduralno modeliranje, otkrivanje izuzetaka, ekstrakcija podataka i druge operacije ovisne o aplikaciji. Takve se mogućnosti uvelike razlikuju među proizvodima, ovisno o ciljnoj orijentaciji.

PODIJELJENO znači da sustav implementira sve zahtjeve zaštite privatnosti (možda do razine ćelije) i, ako je potreban višestruki pristup pisanju, osigurava da su izmjene blokirane na odgovarajućoj razini. Ne zahtijevaju sve aplikacije povratno upisivanje podataka. Međutim, broj takvih aplikacija raste, a sustav mora biti u stanju obraditi višestruke izmjene na pravovremen i siguran način.

MULTIDIMENZIONALNO (Višedimenzionalno) - ovo je ključni zahtjev. Kad biste jednom riječju morali definirati OLAP, odabrali biste nju. Sustav mora pružiti višedimenzionalni konceptualni pogled na podatke, uključujući punu podršku za hijerarhije i višestruke hijerarhije, jer je to očito najlogičniji način za analizu poslovanja i organizacija. Ne postoji minimalni broj dimenzija koje se moraju obraditi, jer to također ovisi o aplikaciji, a većina OLAP proizvoda ima dovoljan broj dimenzija za tržišta na koja ciljaju.

INFORMACIJA - ovo je sve. Potrebne informacije mora se dobiti tamo gdje je potrebno. Međutim, puno ovisi o primjeni. Snaga raznih proizvoda mjeri se koliko ulaznih podataka mogu obraditi, ali ne i koliko gigabajta mogu pohraniti. Snaga proizvoda uvelike varira - najveći OLAP proizvodi mogu obraditi barem tisuću puta više podataka od najmanjih. Postoje mnogi čimbenici koje treba uzeti u obzir u tom smislu, uključujući dupliciranje podataka, zahtjeve za RAM-om, korištenje diskovnog prostora, metriku performansi, integraciju sa spremištima informacija itd.

FASMI test je razumna i razumljiva definicija ciljeva koje OLAP želi postići.

4. KlasifikacijaOLAP-proizvodi.

Dakle, bit OLAP-a leži u činjenici da su početne informacije za analizu prikazane u obliku višedimenzionalne kocke, te je moguće proizvoljno manipulirati njome i dobiti potrebne informacijske presjeke – izvješća. U ovom slučaju krajnji korisnik vidi kocku kao višedimenzionalnu dinamičku tablicu koja automatski sažima podatke (činjenice) u različitim dijelovima (dimenzijama), te omogućuje interaktivno upravljanje izračunima i formom izvješća. Provedba ovih operacija je osigurana OLAP -auto (ili auto OLAP izračuni).

Danas su u svijetu razvijeni mnogi proizvodi koji prodaju OLAP - tehnologije. Kako bi se lakše snalazili među njima, koriste se klasifikacije OLAP -proizvodi: prema načinu pohranjivanja podataka za analizu i prema lokaciji OLAP -automobili. Pogledajmo pobliže svaku kategoriju OLAP proizvodi.

Klasifikacija prema načinu pohranjivanja podataka

Višedimenzionalne kocke izgrađene su na temelju izvornih i skupnih podataka. I izvorni i skupni podaci za kocke mogu se pohraniti u relacijske i višedimenzionalne baze podataka. Stoga se trenutno koriste tri metode pohrane podataka: MOLAP (višedimenzionalni OLAP), ROLAP (relacijski OLAP) i HOLAP (hibridni OLAP) ). Odnosno, OLAP -proizvodi prema načinu pohrane podataka dijele se u tri slične kategorije:

1. U slučaju MOLAP-a , izvorni i skupni podaci pohranjuju se u višedimenzionalnu bazu podataka ili u višedimenzionalnu lokalnu kocku.

2. U ROLAP-u -izvorni podaci o proizvodima pohranjuju se u relacijske baze podataka ili u ravne lokalne tablice na poslužitelju datoteka. Skupni podaci mogu se smjestiti u servisne tablice u istoj bazi podataka. Konverzija podataka iz relacijske baze podataka u višedimenzionalne kocke događa se na zahtjev OLAP alati.

3. U slučaju korištenja HOLAP arhitekture, izvorni podaci ostaju u relacijskoj bazi podataka, a agregati se smještaju u višedimenzionalnu. Izgradnja OLAP -kocka izvedena na upit OLAP - alati temeljeni na relacijskim i višedimenzionalnim podacima.

Klasifikacija prema lokaciji OLAP-automobili.

Na ovoj osnovi OLAP -proizvodi se dijele na OLAP poslužitelji i OLAP klijenti:

· U OLAP poslužitelju - sredstva za izračun i pohranjivanje agregatnih podataka obavlja poseban proces - poslužitelj. Klijentska aplikacija prima samo rezultate upita prema višedimenzionalnim kockama koje su pohranjene na poslužitelju. Neki OLAP -poslužitelji podržavaju pohranu podataka samo u relacijskim bazama podataka, neki samo u višedimenzionalnim. Mnogi moderni OLAP - poslužitelji podržavaju sve tri metode pohrane podataka:MOLAP, ROLAP i HOLAP.

MOLAP.

MOLAP je Višedimenzionalna on-line analitička obrada, odnosno Multidimensional OLAP.To znači da poslužitelj koristi višedimenzionalnu bazu podataka (MDB) za pohranu podataka. Smisao korištenja MBD-a je očit. Može učinkovito pohraniti podatke koji su višedimenzionalne prirode, pružajući sredstvo za brzo servisiranje upita baze podataka. Podaci se prenose iz izvora podataka u višedimenzionalnu bazu podataka, a baza podataka se zatim agregira. Predizračun je ono što ubrzava OLAP upite jer su podaci sažetka već izračunati. Vrijeme upita postaje funkcija isključivo vremena potrebnog za pristup jednom podatku i izvođenje izračuna. Ova metoda podržava koncept da se posao obavlja jednom, a rezultati se zatim koriste uvijek iznova. Višedimenzionalne baze podataka su relativno nova tehnologija. Upotreba MBD-a ima iste nedostatke kao i većina novih tehnologija. Naime, one nisu toliko stabilne kao relacijske baze podataka (RDB), te nisu u istoj mjeri optimizirane. ostalo slabost MDB leži u nemogućnosti korištenja većine višedimenzionalnih baza podataka u procesu agregacije podataka, pa je potrebno vrijeme nove informacije postao dostupan za analizu.

ROLAP.

ROLAP je Relacijska on-line analitička obrada, odnosno relacijski OLAP.Izraz ROLAP znači da se OLAP poslužitelj temelji na relacijskoj bazi podataka. Izvorni podaci unose se u relacijsku bazu podataka, obično u shemi zvijezde ili pahuljice, što pomaže smanjiti vrijeme dohvaćanja. Poslužitelj pruža višedimenzionalni model podataka pomoću optimiziranih SQL upita.

Postoji niz razloga za odabir relacijske umjesto višedimenzionalne baze podataka. RDB je dobro uspostavljena tehnologija s mnogo mogućnosti za optimizaciju. Korištenje u stvarnom svijetu rezultiralo je profinjenijim proizvodom. Osim toga, RDB-ovi podržavaju veće količine podataka od MDB-ova. Oni su upravo dizajnirani za takve količine. Glavni argument protiv RDB-a je složenost upita potrebnih za dobivanje informacija velika baza podatke pomoću SQL-a. Neiskusni SQL programer mogao bi lako opteretiti vrijedne resurse sustava pokušavajući izvršiti neki sličan upit, koji je puno lakše izvršiti u MDB-u.

Skupni/prethodno skupni podaci.

Implementacija brzih upita je imperativ za OLAP. Ovo je jedno od osnovnih načela OLAP-a - sposobnost intuitivnog manipuliranja podacima zahtijeva brzo pronalaženje informacija. Općenito, što se više izračuna mora napraviti da bi se dobila informacija, to je odgovor sporiji. Stoga, kako bi se vrijeme implementacije upita održalo kratkim, dijelovi informacija kojima se inače najčešće pristupa, ali koji također zahtijevaju izračun, podliježu preliminarnoj agregaciji. To jest, oni se broje i zatim pohranjuju u bazu podataka kao novi podaci. Primjer vrste podataka koji se mogu izračunati unaprijed su zbirni podaci - na primjer, podaci o prodaji za mjesece, tromjesečja ili godine, za koje su stvarni uneseni podaci dnevne brojke.

Različiti dobavljači imaju različite metode za odabir parametara, zahtijevajući prethodno zbrajanje i broj unaprijed izračunatih vrijednosti. Pristup agregacije utječe i na bazu podataka i na vrijeme izvršenja upita. Ako se izračunava više vrijednosti, povećava se vjerojatnost da će korisnik zatražiti vrijednost koja je već izračunata, a time će se smanjiti vrijeme odgovora jer neće morati zahtijevati izračunavanje izvorne vrijednosti. Međutim, ako izračunate sve moguće vrijednosti - to nije najbolje rješenje - u ovom slučaju veličina baze podataka značajno se povećava, što će je učiniti neupravljivom, a vrijeme agregacije će biti predugo. Osim toga, kada se numeričke vrijednosti dodaju u bazu podataka ili ako se promijene, ove informacije moraju se odraziti na unaprijed izračunate vrijednosti koje ovise o novim podacima. Stoga ažuriranje baze podataka također može trajati dugo u slučaju velikog broja unaprijed izračunatih vrijednosti. Budući da baza podataka obično radi offline tijekom agregacije, poželjno je da vrijeme agregacije ne bude predugo.

OLAP - klijent je drugačije strukturiran. Konstrukcija višedimenzionalne kocke i OLAP -izračuni se izvode u memoriji klijentskog računala.OLAP -klijenti se također dijele na ROLAP i MOLAP.A neki mogu podržavati obje opcije pristupa podacima.

Svaki od ovih pristupa ima svoje prednosti i nedostatke. Suprotno uvriježenom mišljenju o prednostima poslužiteljskih alata u odnosu na klijentske alate, u nizu slučajeva korištenje OLAP - klijent može biti učinkovitiji i isplativiji za korištenje korisnicima OLAP poslužitelji.

Razvoj analitičkih aplikacija korištenjem klijentskih OLAP alata je brz proces i ne zahtijeva posebnu obuku. Korisnik koji poznaje fizičku implementaciju baze podataka može samostalno razviti analitičku aplikaciju, bez angažmana informatičara.

Kada koristite OLAP poslužitelj, trebate naučiti 2 različita sustava, ponekad od različitih dobavljača - za stvaranje kocki na poslužitelju i za razvoj klijentske aplikacije.

OLAP klijent pruža jedinstveno vizualno sučelje za opisivanje kocki i postavljanje korisničkih sučelja za njih.

Dakle, u kojim slučajevima korištenje OLAP klijenta može biti učinkovitije i profitabilnije za korisnike od korištenja OLAP poslužitelja?

· Ekonomska isplativost primjene OLAP -server se javlja kada su količine podataka vrlo velike i neodoljive OLAP -klijent, inače je uporaba potonjeg opravdanija. U ovom slučaju OLAP -Klijent kombinira karakteristike visokih performansi i niske cijene.

· Snažna računala za analitičare – još jedan argument u prilog OLAP -klijenti. Prilikom korištenja OLAP -poslužitelji ne koriste ovaj kapacitet.

Među prednostima OLAP klijenata su sljedeće:

· Troškovi implementacije i održavanja OLAP - klijent je znatno niži od troškova za OLAP poslužitelj.

· Korištenje OLAP - za klijenta s ugrađenim strojem prijenos podataka preko mreže obavlja se jednom. Radeći OLAP - operacije novih tokova podataka se ne generiraju.

5. Principi rada OLAP-klijenti.

Pogledajmo proces kreiranja OLAP aplikacije pomoću klijentskog alata (Slika 1).

Slika 1.Izrada OLAP aplikacije pomoću ROLAP klijentskog alata

Princip rada ROLAP klijenata je preliminarni opis semantičkog sloja iza kojeg se krije fizička struktura izvornih podataka. U ovom slučaju izvori podataka mogu biti: lokalne tablice, RDBMS. Popis podržanih izvora podataka određuje određeni softverski proizvod. Nakon toga, korisnik može samostalno manipulirati objektima u koje razumije pojmove predmetno područje za izradu kocki i analitičkih sučelja.

Princip rada klijenta OLAP poslužitelja je drugačiji. U OLAP poslužitelju, prilikom izrade kocki, korisnik manipulira fizičkim opisima baze podataka. U isto vrijeme, prilagođeni opisi se kreiraju u samoj kocki. Klijent OLAP poslužitelja je konfiguriran samo za kocku.

Prilikom stvaranja semantičkog sloja, izvori podataka - tablice Prodaja i Dogovor - opisuju se izrazima koje krajnji korisnik može razumjeti i pretvaraju u "Proizvode" i "Ponude". Polje “ID” iz tablice “Proizvodi” preimenovano je u “Kôd”, a “Naziv” u “Proizvod” itd.

Zatim se kreira poslovni objekt Prodaja. Poslovni objekt je ravni stol na temelju kojeg se oblikuje višedimenzionalna kocka. Prilikom kreiranja poslovnog objekta, tablice “Proizvodi” i “Transakcije” su spojene poljem “Kod” proizvoda. Budući da sva polja tablice nisu potrebna za prikaz u izvješću, poslovni objekt koristi samo polja “Stavka”, “Datum” i “Iznos”.

U našem primjeru na temelju poslovnog objekta “Prodaja” kreiran je izvještaj o prodaji proizvoda po mjesecima.

Prilikom rada s interaktivnim izvješćem, korisnik može postaviti uvjete filtriranja i grupiranja istim jednostavnim pokretima miša. U ovom trenutku ROLAP klijent pristupa podacima u predmemorij. Klijent OLAP poslužitelja generira novi upit višedimenzionalnoj bazi podataka. Na primjer, primjenom filtra po proizvodu u izvješću o prodaji, možete dobiti izvješće o prodaji proizvoda koji nas zanimaju.

Sve postavke OLAP aplikacije mogu se pohraniti u posebnom repozitoriju metapodataka, u aplikaciji ili u višedimenzionalnom repozitoriju sustava baze podataka.Implementacija ovisi o specifičnom softverskom proizvodu.

Sve što je uključeno u ove aplikacije je standardni izgled sučelja, predefinirane funkcije i struktura te brza rješenja za više ili manje standardne situacije. Primjerice, popularni su financijski paketi. Unaprijed izgrađene financijske aplikacije profesionalcima omogućuju korištenje poznatih financijskih alata bez potrebe za dizajniranjem strukture baze podataka ili uobičajenih obrazaca i izvješća.

Internet je novi oblik klijenta. Osim toga, nosi pečat novih tehnologija; gomila Internetska rješenja značajno razlikuju u svojim mogućnostima općenito, a posebno kao OLAP rješenja. Mnogo je prednosti generiranja OLAP izvješća putem Interneta. Najznačajniji je nedostatak potrebe za specijaliziranim softverom za pristup informacijama. To tvrtki štedi puno vremena i novca.

6. Odabir arhitekture OLAP aplikacije.

Pri implementaciji informacijsko-analitičkog sustava važno je ne pogriješiti u odabiru arhitekture OLAP aplikacije. Doslovan prijevod pojma On-Line analitičkog procesa - "online analitička obrada" - često se shvaća doslovno u smislu da se podaci koji ulaze u sustav brzo analiziraju. To je pogrešno mišljenje - učinkovitost analize ni na koji način nije povezana sa stvarnim vremenom ažuriranja podataka u sustavu. Ova se karakteristika odnosi na vrijeme odgovora OLAP sustava na zahtjeve korisnika. Pritom, analizirani podaci često predstavljaju snimku informacija “od jučer” ako se, primjerice, podaci u skladištima ažuriraju jednom dnevno.

U ovom kontekstu, prijevod OLAP-a kao "interaktivna analitička obrada" je točniji. Sposobnost analize podataka u interaktivnom načinu je ono što razlikuje OLAP sustave od sustava za pripremu reguliranih izvješća.

Još jedna značajka interaktivne obrade u formulaciji osnivača OLAP-a E. Codda je mogućnost “kombiniranja, pregleda i analize podataka sa stajališta više dimenzija, tj. na najrazumljiviji način za korporativne analitičare”. Sam Codd terminom OLAP označava isključivo specifičan način prezentiranja podataka na konceptualnoj razini – višedimenzionalno. Na fizičkoj razini podaci se mogu pohraniti u relacijske baze podataka, ali u stvarnosti OLAP alati obično rade s višedimenzionalnim bazama podataka u kojima su podaci organizirani u hiperkocku (slika 1).

Slika 1. OLAP– kocka (hiperkocka, metakocka)

Štoviše, relevantnost ovih podataka određena je trenutkom kada se hiperkocka napuni novim podacima.

Očito, vrijeme potrebno za stvaranje višedimenzionalne baze podataka značajno ovisi o količini podataka koji se u nju učitaju, stoga je razumno ograničiti ovu količinu. Ali kako izbjeći sužavanje mogućnosti analize i lišavanje korisnika pristupa svim informacijama od interesa? Postoje dva alternativna puta: Analiziraj pa postavi upit i Upitaj pa analiziraj.

Sljedbenici prvog puta predlažu učitavanje generaliziranih informacija u višedimenzionalnu bazu podataka, na primjer, mjesečnih, tromjesečnih i godišnjih rezultata za odjele. A ako je potrebno detaljizirati podatke, od korisnika se traži da generira izvješće pomoću relacijske baze podataka koja sadrži traženi odabir, na primjer, po danu za određeni odjel ili po mjesecima i zaposlenicima odabranog odjela.

Zagovornici drugog puta, naprotiv, predlažu da korisnik prije svega odluči o podacima koje će analizirati i učitati ih u mikrokocku – malu višedimenzionalnu bazu podataka. Oba se pristupa razlikuju na konceptualnoj razini i imaju svoje prednosti i nedostatke.

Prednosti drugog pristupa uključuju "svježinu" informacija koje korisnik dobiva u obliku višedimenzionalnog izvješća - "mikrokocke". Mikrokocka se formira na temelju informacija koje su upravo zatražene iz trenutne relacijske baze podataka. Rad s mikrokockom odvija se u interaktivnom načinu - dobivanje kriški informacija i njihovo detaljiziranje unutar mikrokocke provodi se trenutno. Drugima pozitivna stvar je da dizajn strukture i punjenje mikrokocke provodi korisnik “u hodu”, bez sudjelovanja administratora baze podataka. Međutim, pristup također pati od ozbiljnih nedostataka. Korisnik ne vidi širu sliku i mora unaprijed odlučiti o smjeru svog istraživanja. U suprotnom, tražena mikrokocka može biti premala i ne sadržavati sve podatke od interesa, pa će korisnik morati zatražiti novu mikrokocku, pa novu, pa još jednu i još jednu. Pristup Query then analyze implementira alat BusinessObjects istoimene tvrtke i alate platforme Contour tvrtkeIntersoft Laboratorija.

S pristupom Analyse then query, količina podataka učitanih u višedimenzionalnu bazu podataka može biti prilično velika; popunjavanje se mora provesti u skladu s propisima i može potrajati prilično dugo. No, svi ovi nedostaci kasnije se isplate kada korisnik ima pristup gotovo svim potrebnim podacima u bilo kojoj kombinaciji. Pristup izvornim podacima u relacijskoj bazi podataka provodi se samo u krajnjoj nuždi, kada su potrebni detaljni podaci, primjerice, o određenom računu.

Na rad jedne višedimenzionalne baze podataka praktički ne utječe broj korisnika koji joj pristupaju. Oni samo čitaju tamo dostupne podatke, za razliku od pristupa Query then analizirati, u kojem broj mikrokocki u ekstremnom slučaju može rasti istom brzinom kao i broj korisnika.

Ovakav pristup povećava opterećenje IT servisa koji su, osim relacijskih, prisiljeni održavati i višedimenzionalne baze podataka.Ove službe su odgovorne za pravodobno automatsko ažuriranje podaci u višedimenzionalnim bazama podataka.

Najistaknutiji predstavnici pristupa “Analiziraj pa pitaj” su PowerPlay i Impromptu alati tvrtke Cognos.

Odabir pristupa i alata koji ga implementira ovisi prvenstveno o cilju kojem se teži: uvijek morate balansirati između proračunskih ušteda i poboljšanja kvalitete usluge za krajnje korisnike. Treba uzeti u obzir da u strateškom planu izgradnja informacijsko-analitičkih sustava ide za ciljem postizanja konkurentske prednosti, a ne izbjegavanja troškova automatizacije. Primjerice, korporativni informacijsko-analitički sustav može pružiti potrebne, pravovremene i pouzdane informacije o poduzeću, čijom će se objavom za potencijalne investitore osigurati transparentnost i predvidljivost poduzeća, što će neizbježno postati uvjetom njegove investicijske atraktivnosti.

7. Područja primjene OLAP tehnologija.

OLAP je primjenjiv gdje god postoji zadatak analize multivarijantnih podataka. Općenito, s obzirom na podatkovnu tablicu koja ima barem jedan opisni stupac (dimenzija) i jedan numerički stupac (mjere ili činjenice), OLAP alat obično će biti učinkovit alat za analizu i izvješćivanje.

Pogledajmo neka područja primjene OLAP tehnologija preuzetih iz stvarnog života.

1. Prodaja.

Na temelju analize prodajne strukture rješavaju se pitanja potrebna za donošenje upravljačkih odluka: o promjeni asortimana robe, cijena, zatvaranju i otvaranju trgovina, poslovnica, raskidu i potpisivanju ugovora s trgovcima, provođenju ili prekidu reklamnih kampanja i sl.

2. Nabava.

Zadatak je suprotan analizi prodaje. Mnoga poduzeća kupuju komponente i materijale od dobavljača. Trgovačka poduzeća kupuju robu za preprodaju. Mnogo je mogućih zadataka pri analizi nabave, od planiranja Novac na temelju prošlih iskustava, do kontrola nad menadžerima, odabir dobavljača.

3. Cijene.

Analiza tržišnih cijena usko je povezana s analizom nabave. Svrha ove analize je optimizacija troškova i odabir najprofitabilnijih ponuda.

4. Marketing.

Pod marketinškom analizom podrazumijevamo samo područje analize kupaca odnosno klijenata-potrošača usluga. Svrha ove analize je pravilno pozicioniranje proizvoda, identificiranje skupina kupaca za ciljano oglašavanje i optimizacija asortimana. Zadaća OLAP-a u ovom slučaju je dati korisniku alat za brzo, brzinom misli, dobiti odgovore na pitanja koja se intuitivno pojavljuju tijekom analize podataka.

5. Skladište.

Analiza strukture skladišnih stanja po vrstama robe, skladištima, analiza roka trajanja robe, analiza pošiljaka po primateljima i mnoge druge vrste analiza koje su važne za poduzeće moguće su ako organizacija ima skladišno računovodstvo.

6. Novčani tok.

Ovo je cijelo područje analize koje ima mnogo škola i metoda. OLAP tehnologija može poslužiti kao alat za implementaciju ili poboljšanje ovih tehnika, ali ne kao zamjena za njih. Gotovinski promet bezgotovinskih i gotovinskih sredstava analizira se po poslovanju, ugovornim stranama, valutama i vremenu u cilju optimizacije tokova, osiguranja likvidnosti i dr. Sastav mjerenja uvelike ovisi o karakteristikama poslovanja, industrije i metodologije.

7. Proračun.

Jedno od najplodnijih područja primjene OLAP tehnologija. Ni jedan za ništa moderni sustav proračun se ne smatra potpunim bez prisutnosti OLAP alata za proračunsku analizu. Većina proračunskih izvješća lako se gradi na temelju OLAP sustava. Ujedno, izvješća odgovaraju na vrlo širok spektar pitanja: analizu strukture rashoda i prihoda, usporedbu rashoda za pojedine stavke u različitim odjelima, analizu dinamike i kretanja rashoda za pojedine stavke, analizu troškova i dobiti.

8. Računi.

Klasična bilanca koja se sastoji od broja računa i sadrži ulazna stanja, promet i izlazna stanja može se savršeno analizirati u OLAP sustavu. Osim toga, OLAP sustav može automatski i vrlo brzo izračunati konsolidirana stanja organizacije s više podružnica, stanja za mjesec, kvartal i godinu, agregirana stanja po hijerarhiji računa te analitička stanja na temelju analitičkih karakteristika.

9. Financijsko izvješćivanje.

Tehnološki konstruiran sustav izvješćivanja nije ništa drugo nego skup imenovanih indikatora s datumskim vrijednostima koje je potrebno grupirati i sažeti u različite odjeljke kako bi se dobila specifična izvješća. Kada je to slučaj, onda je prikaz i ispis izvještaja najlakše i najjeftinije implementirati u OLAP sustavima. U svakom slučaju, interni sustav izvješćivanja poduzeća nije tako konzervativan i može se restrukturirati kako bi se uštedio novac inženjerski radovi za izradu izvješća i dobivanje mogućnosti višedimenzionalne operativne analize.

10. Posjećenost stranice.

Datoteka dnevnika internetskog poslužitelja višedimenzionalna je po prirodi, što znači da je prikladna za OLAP analizu. Činjenice su: broj posjeta, broj pogodaka, vrijeme provedeno na stranici i drugi podaci dostupni u dnevniku.

11. Obim proizvodnje.

Ovo je još jedan primjer Statistička analiza. Tako je moguće analizirati količine uzgojenog krumpira, topljenog čelika i proizvedene robe.

12. Potrošnja potrošnog materijala.

Zamislite tvornicu koja se sastoji od desetaka radionica u kojima se troše rashladna sredstva, tekućine za ispiranje, ulja, krpe, brusni papir - stotine vrsta potrošnog materijala. Za točno planiranje i optimizaciju troškova potrebna je temeljita analiza stvarne potrošnje potrošnog materijala.

13. Korištenje prostorija.

Druga vrsta statističke analize. Primjeri: analiza radnog opterećenja učionica, unajmljene zgrade i prostori, korištenje konferencijskih dvorana itd.

14. Promet osoblja u poduzeću.

Analiza fluktuacije osoblja u poduzeću po granama, odjelima, zanimanjima, stupnju obrazovanja, spolu, dobi, vremenu.

15. Prijevoz putnika.

Analiza broja prodanih karata i iznosa po sezoni, smjeru, vrsti vagona (klasa), vrsti vlaka (zrakoplov).

Ovaj popis nije ograničen na područja primjene OLAP - tehnologije. Na primjer, razmotrite tehnologiju OLAP - analize iz područja prodaje.

8. Primjer korištenja OLAP -tehnologije za analizu u području prodaje.

Dizajniranje višedimenzionalnog prikaza podataka za OLAP -analiza počinje formiranjem mjerne karte. Na primjer, pri analizi prodaje može biti preporučljivo identificirati pojedinačne dijelove tržišta (u razvoju, stabilne, velike i male potrošače, vjerojatnost novih potrošača itd.) i procijeniti količine prodaje prema proizvodu, teritoriju, kupcu, tržišnom segmentu , kanal prodaje i veličine narudžbi. Ti pravci tvore koordinatnu mrežu višedimenzionalnog prikaza prodaje – strukture njezinih dimenzija.

Budući da se aktivnosti svakog poduzeća odvijaju kroz vrijeme, prvo pitanje koje se postavlja prilikom analize je pitanje dinamike razvoja poslovanja. Ispravna organizacija vremenske osi omogućit će nam da kvalitativno odgovorimo na ovo pitanje. Obično je vremenska os podijeljena na godine, kvartale i mjesece. Moguća je još veća fragmentacija na tjedne i dane. Struktura vremenske dimenzije formira se uzimajući u obzir učestalost prijema podataka; također može biti određena učestalošću traženja informacija.

Dimenzija Grupe proizvoda osmišljena je tako da što je moguće preciznije odražava strukturu prodanih proizvoda. Pritom je važno održati određenu ravnotežu kako bi se, s jedne strane, izbjegle pretjerane pojedinosti (broj grupa bi trebao biti vidljiv), as druge strane, da se ne bi propustio značajan segment tržišta.

Dimenzija “Kupci” odražava strukturu prodaje prema teritorijalnoj i geografskoj osnovi. Svaka dimenzija može imati vlastitu hijerarhiju, na primjer, u ovoj dimenziji to može biti struktura: Zemlje – Regije – Gradovi – Klijenti.

Da biste analizirali izvedbu odjela, trebali biste izraditi vlastito mjerenje. Na primjer, možemo razlikovati dvije razine hijerarhije: odjele i odjele uključene u njih, što bi se trebalo odražavati u dimenziji "Odjeli".

Zapravo, dimenzije “Vrijeme”, “Proizvodi”, “Kupci” prilično u potpunosti definiraju prostor predmetnog područja.

Dodatno, korisno je podijeliti ovaj prostor na uvjetna područja, na temelju izračunatih karakteristika, na primjer, raspona volumena transakcije u vrijednosnom smislu. Tada se cjelokupno poslovanje može podijeliti na niz troškovnih raspona u kojima se odvija. U ovom primjeru možemo se ograničiti na sljedeće pokazatelje: iznos prodaje robe, broj prodane robe, iznos prihoda, broj transakcija, broj kupaca, obujam kupnje od proizvođača.

OLAP - kocka za analizu će izgledati ovako (slika 2):


Slika 2.OLAP– kocka za analizu obima prodaje

Upravo se taj trodimenzionalni niz u OLAP terminima naziva kocka. Zapravo, sa stajališta striktne matematike, takav niz neće uvijek biti kocka: prava kocka mora imati isti broj elemenata u svim dimenzijama, ali OLAP kocke nemaju takvo ograničenje. OLAP kocka ne mora biti trodimenzionalna. Može biti dvodimenzionalan i višedimenzionalan, ovisno o problemu koji se rješava. Ozbiljni OLAP proizvodi dizajnirani su za oko 20 dimenzija. Jednostavnije aplikacije za stolna računala podržavaju oko 6 dimenzija.

Ne moraju se popuniti svi elementi kocke: ako nema informacija o prodaji proizvoda 2 kupcu 3 u trećem kvartalu, vrijednost u odgovarajućoj ćeliji jednostavno neće biti određena.

Međutim, sama kocka nije prikladna za analizu. Ako je još uvijek moguće adekvatno zamisliti ili prikazati trodimenzionalnu kocku, onda sa šestero- ili devetnaestodimenzionalni situacija je puno gora. Stoga se prije upotrebe obične dvodimenzionalne tablice izvlače iz višedimenzionalne kocke. Ova operacija se zove "rezanje" kocke. Analitičar, takoreći, uzima i "reže" dimenzije kocke prema oznakama koje ga zanimaju. Na taj način analitičar dobiva dvodimenzionalni isječak kocke (izvješće) i s njim radi. Struktura izvješća prikazana je na slici 3.

Slika 3.Struktura analitičkog izvješća

Izrežemo našu OLAP kocku i dobijemo izvještaj o prodaji za treći kvartal, izgledat će ovako (slika 4).

Slika 4.Izvješće o prodaji za treće tromjesečje

Možete prerezati kocku po drugoj osi i dobiti izvještaj o prodaji grupe proizvoda 2 tijekom godine (slika 5).

Slika 5.Tromjesečno izvješće o prodaji za proizvod 2

Slično, možete analizirati odnos s klijentom 4, rezanje kocke prema oznaci Klijenti(Sl. 6)

Slika 6.Izvješće o isporukama robe kupcu 4

Izvješće možete detaljizirati po mjesecima ili razgovarati o opskrbi robom određenoj grani klijenta.