Mida kujutab endast nüüdisaegne pilvepõhine andmeladu
Allikas: Äri-IT Sügis 2020
Autor: Urmas Tutt
Mis on õieti andmeladu ja mis puhul see on tänapäevane? Siin on vastused neile ja mitmetele muudelegi küsimusele.
Andmeladu
Andmeladu on arvutisüsteem, mis tegeleb andmete kogumise ja analüüsimisega. Eesmärk on avastada andmetes trende, mustreid ja seoseid, et pakkuda infot ja teadmisi selle kohta, mis ettevõtte äris tegelikult toimub. Traditsiooniliselt kogutakse andmeid aisemistest allikatest, näiteks turundus-, müügi-, tootmis- ja finantssüsteemidest. Enamasti on need süsteemid tehingupõhised andmebaasid, mis on tuntud koondnimedega ERP* , CRM** ja DMS*** ehk majandustarkvarad, kliendihaldussüsteemid ja dokumendihaldus.
* ERP ehk Enterprise Resource Planning, ettevõtte ressursside planeerimine – majandustarkvara, mille abil juhitakse kogu ettevõtet
** CRM ehk Customer Relationship Management – kliendisuhete haldamise süsteem
*** DMS ehk Document Management System – dokumendihaldussüsteem
Andmelaod tekkisid siis, kui firmad said aru, et andmete analüüsimine vahetult nimetatud tehingupõhistest andmebaasidest pidurdab nende normaalset toimimiskiirust ja põhjustab sageli lausa süsteemide kokkukukkumist. Seetõttu leiti lahendus andmete kopeerimises spetsiaalselt analüüsi eesmärgil loodud andmelaobaasi, jättes operatiivsüsteemide fookuse äritehingute töötlemisele.
Aastate jooksul on andmeallikate valik laienenud kaugemale ettevõtte sisemistest süsteemidest. Andmete maht, mitmekesisus ja lisandumise kiirus eksponentsiaalselt kasvanud. Nende allikateks on mitmesugused veebilehed, reaalaja veebiteenused, mobiilsed seadmed ja nende äpid ning samuti masinad. Organisatsioonid toodavad asjade interneti vahendusel tohutul hulgal andmeid.
Traditsioonilised andmelao lahendused polnud disainitud toime tulema tänapäeva andmete mahu, mitmekesisuse ja lisandumise kiirusega. Uuemate süsteemide loomisel nähakse vaeva, et nendest puudustest üle saada ning kohaneda andmetele juurdepääsu ja analüüsi vajadustega.
Andmeladudega seotud proovikivid:
- Arvukad ja mitmekesised andmeallikad pakuvad paljusid andmestruktuure, mis peavad ühes kohas koos eksisteerima, et tagada süsteemne ja põhjalik analüüs.
- Traditsioonilised arhitektuurid põhjustavad konkurentsi süsteemi kasutajate ja andmeintegratsiooni tegevuste vahel. Raske on tagada üheaegne uute andmete laadimine andmelattu ja adekvaatne jõudlus kasutajatele.
- Pakettidena andmete laadimine on endiselt tavaline, aga paljud organisatsioonid vajavad tänapäeval pidevat andmete laadimist ehk mikropakette ja voogandmete kasutamist ehk vahetut laadimist.
- Tavapäraste lahenduste skaleeritavus tänapäevase salvestusruumi ja töökoormuse suhtes on väga kulukas, vaevaline ja aeglane.
- Kõige uuemad alternatiivsed andmeplatvormid on sageli keerukad, nõuavad eriteadmisi ning palju häälestamist ja konfigureerimist. See omakorda raskendab toimetulekut mitmekesiste andmeallikate kasvu, kasutajate halduse ja analüütiliste päringutega.
Pilvepõhine andmeladu
Pilvepõhine andmeladu on seevastu ettevõtteile kõige kulusäästlikum viis, et saada kasu uusimatest tehnoloogiatest ja arhitektuuridest ilma tohutusuure esialgse investeeringuta. Nii ei ole vaja soetada uut riistvara, tarkvara ja infrastruktuuri ning organiseerida nende paigaldust, seadistust ja järelhooldust.
Pilvetehnoloogiate kasutamise valikud jagatakse andmelao korral üldiselt kolme gruppi:
- Traditsiooniline andmelao lahendus, mis on sobitatud pilveteenuste infrastruktuurile. See valik sarnaneb traditsioonilisele majasisesele lahendusele. Kasutatakse tarkvara sama koodi minimaalsete kohandustega, et uude infrasse sobituda. Pilvest renditakse nn virtuaalserverit. Vabanetakse küll riist- ja tarkvara soetamise vajadusest, kuid kliendil peavad olema märkimisväärselt head IT-teadmised, et andmelao süsteemi kui tervikut hallata. Seda mudelit tuntakse nimetusena IaaS (Infrastructure as a Service).
- Traditsiooniline andmeladu, mida hoiab ja haldab pilvekeskkonnas kolmas osapool. Seda valikut tuntakse turul kui rakenduse teenuse pakkumise mudelit ASP (Application Service Provider). Andmelao klient peab siiski oskama prognoosida kettamahte ja arvutusvõimsusi. Tarnija hoolitseb riistvara, tarkvara paigalduse ja uuenduste eest. Klient haldab, häälestab ja optimeerib tarkvara. Endiselt säilivad paljud traditsioonilise andmelao piirangud. Sellist hübriidlahendust tuntakse ka nimetuse PaaS all (Platform as a Service).
- Andmeladu tervikuna kui tarkvarateenus ehk SaaS (Software as a Service), levinud on ka lühend DWaaS (Data Warehouse as a Service). Tarnija pakub antud juhul kliendile tervikliku pilvepõhist andmelao lahendust, mis sisaldab kõiki riist- ja tarkvaravahendeid. Nii ei ole vaja seoses andmelao lahendusega tegeleda pidevalt jõudluse, valitsemise poliitika ja turvalisuse haldamisega. Kliendid maksavad vaid nende ressursside eest, mida nad tegelikult kasutavad. Skaleeritavus on automaatne ja toimub vastavalt vajadusele. Töökoormus hajutatakse ning süsteemi jõudlus on jooksvalt tagatud.
Paljud pilvepõhiste andmelao lahenduste pakkujad on turul olnud juba väga pikka aega. Nad on alustanud nn klassikaliste arhitektuuridega kliendi omanduses olevate riist- ja tarkvarade peal. Edasi liiguvad nad infrastruktuuri ja platvormi rentimise mudelite peale. Kohandused on väljatöötatud tarkvaras minimaalsed. Teine grupp pilvepõhiste andmelao lahenduste pakkujaid on uued tegijad, kes on kohe asunud täies mahus pilveteenuseid kasutama.
Otsustamise võtmeteguriks hübriidse või päris pilvelahenduse vahel on just peamiste andmeallikate asukoht ning väliste andmete kaasamise vajadus, et tagada maksimaalne kasu analüütilisest süsteemist.
Oluline on arvestada ka pilvekeskkonna pakutavate kesksete süsteemikasutuse stsenaariumite rikkalikkusega. Traditsioonilistes keskkondades on palju süsteeme, et käsitleda erinevaid kasutuskaasusi: operatiivne aruandlus, osakondade lõikes analüütika, andmejärved andmete uurimiseks, erilahendused prognoosiva analüütika jaoks. Igaüks neist vajab riistvara, andmete koopiat, eraldi haldust, oskusi-teadmisi jpm. Andmelao pilvelahendus vabastab reeglina traditsiooniliste süsteemide haldusega seotud peavalust ja kuludest, mis tulenevad andmete kopeerimisest, süsteemi haldusest ja veasituatsioonide käsitlemisest.
Tuntumad pilveteenused on Microsofti Azure, Amazone AWS ja Google Cloud Platform. Tutvuge uute tehnoloogiliste võimalustega ja alustage samm-sammult ajalooliste infrastruktuuride ümberkujundamisega. Uutel tegijatel aga soovitan kohe kinni haarata pilveteenuste pakutavatest võimalustest ärianalüüsi lahenduste juurutamisel ja edasiarendamisel.
Rohkem infot leidub lehel www.bi365.ee.