29
09/2009
0

Open Source BI: körkép

Nem tudunk összehasonlítások nélkül élni. Már az oviban is a táplálkozási lánc csúcsán éreztük magunkat, ha mind közül nekünk volt a legtöbb turbórágónk a tesiszatyiban, vagy dzsíájdzsónk a répafőzelékben.
 
A helyzet mit sem változott azóta, egy szép komparálásért továbbra is nilszhorgelszonos bilinket vagy féltengelyes dömperünket adnánk, de érdeklődési körünk eltolódott az open source eszközök és a szalonnás rántotta irányába. Volt is nagy boldogság midőn pentahopimpeléstől összebitesedett kezünkkel rátenyerelhettünk Steve Holub posztjára, amiből kiderül kik a legmenőbb játékosok az Open Source BI játszóterén.
 

Az eredeti, angol nyelvű post itt olvasható, a míves magyarított változat alább.
 

Némi magyarázat a táblázatokhoz

Teljesen mértékben Open Source: Azon termékek, amelyeknek összes forráskódja szabadon elérhető Open Source licensz keretében. Ha a terméknek létezik olyan verziója, amely extra funkcionalitást kínál nem Open Source licensz keretében, azt itt nem tekintettük teljes mértékben Open Source szoftvernek.
Előfizetéses teméktámogatás: Azok a cégek, akik nem kínálnak házon belüli terméktámogatást, de az harmadik fél által biztosított szolgáltatásként elérhető, I* jelölést kaptak.
 

Adatbáziskezelő rendszerek

Egészen a közelmúltig a hagyományos, MySQL illetve PostgreSQL-hez hasonló relációs adatbáziskezelő rendszerek uralták a piacot. Nemrégiben azonban az adattárházak által támasztott igények kielégítésére új, nyílt forrású, oszlop alapú adatbáziskezelők születtek. Az oszlop alapú dbms-ek, mint az InfoBright, a LuciDB és a MonetDB adathozzáférési időt optimalizálnak azzal, hogy az adatokat sorok helyett oszlopokban tárolják. Az elosztott rendszerek terén is jelentős fejlődés történt, az itt felsorolt dmbs-ek mind az elosztott rendszerekhez tervezett Handoop Java alapú keretrendszerre épülnek. A Handoopra építő adatbázisok leginkább a több százmillió rekordos, tipikusan nagy forgalmú portálok web-analitikáit feldolgozó adattárházak kiszolgálására alkalmazhatóak. Ugyan sok nyílt forráskódú beágyazható adatbázis megoldás létezik, de mivel skálázhatóságuk elmarad az adattárházak által megkívánt mértéktől, így ezek kimaradtak az összehasonlításból.
 
 

ETL eszközök

Az ETL az adattárházfejlesztés legidőigényesebb területe. Ezért olyan eszközre van szükség, amely a lehető legtöbb típusú forrásrendszerrel képes együttműködni, miközben használhatósága és teljesítménye a még elfogadható tartományban marad, valamint a töltés során érintett adatokról metaadatokkal szolgál. 
 
 

Master Data Management

A BI rendszerek gyakorta sok különféle adatforrásból táplálkoznak, – Excel sheetektől kezdve az ERP rendszereken át az egyéb külső adatforrásokig – amelyekben esetleg többszörösen föllelhető ugyanaz a dimenzióadat (pl. Megrendelő, Termék). Az MDM eszközök segítségével azonosíthatóak, és az adattartalom egységesítése után az adattárházba tölthetőek az eredetileg duplikált rekordok.
Az adat duplikációra példa, hogy ugyanaz az ügyfél potenciális kliensként jelenhet meg a marketing osztály nyilvántartásában, miközben a számlázási osztály már meglévő ügyfélként kezeli. Így fordulhat az elő, hogy egy ügyfelet a már általa előfizetett szolgáltatás vásárálására felhívó marketinganyaggal bombáznak. Az MDM eszközök segítségével az adattárházban konszolidálhatóak az ügyféladatok, ezáltal az ügyfél-információ konzisztenssé tehető a teljes vállalati rendszerben. 
 
 

Riportáló és Analízis eszközök

Tipikusan a BI riport és analízis eszközök azok, amit az átlag üzleti felhasználó lát és használ az adattárházból, így létfontosságú, hogy ezen eszközök felhasználóbarátak és intuitívak legyenek. A különböző Open Source csomagok különféle szolgáltatásokat tartalmaznak egy-egy célcsoport számára (riport fejlesztők, döntéshozók, átlag felhasználók), így ajánlott minél több eszköz tesztelése a vállalat számára ideális csomag kiválasztása előtt. A következő összefoglaló táblázat négy, a BI szoftverekben általánosan használt szolgáltatást ölel fel, nevezetesen a hagyományos riportálási lehetőséget, az ad-hoc riportálást, az OLAP riportálást és a dashboard-okat.
 
 A Hagyományos riportok a legtöbb vállalatban megtalálhatóak, a legkülönfélébb riportálási igények kielégítésére alkalmasak. (Például Havi értékesítési adatok üzlet és termék szerinti bontásban)
Ad-hoc riportok segítségével az üzleti felhasználók is készíthetnek gyorsan összeállítható riportokat információéhségük kielégítésére, előzetes SQL tudás, vagy az adattárház felépítésének mélyebb ismerete nélkül.
Az OLAP (Online Analytical Processing) a BI lekérdezések optimalizálására kifejlesztett technika, amely az adatokat elő-aggregált táblák, és multidimenziós modellezés (kockák) felhasználásával teszi gyorsan elérhetővé. Az OLAP segítségével a felhasználók lefúrhatnak az adathierarchiák alsó szintjeiig. (országból megyébe, megyéből városba, városból üzletre)
A Dashboard-ok akár felhasználók által is készíthető vizuális riportok a vállalat fő teljesítménymutatóival. Az ábrák és diagrammok lehetnek interaktívak, segítségükkel a felhasználó mélyebb adathierarchiákba fúrhat le.  
 
 

Adatbányászati eszközök

Az adatbányászati technikák segítségével az üzleti intelligencia rendszerekben felderíthetőek az egyes kiindulási attribútumok és az ezekből adódó események közti minták és összefüggések. A vállalati adattárházak az üzleti adatbányászat szempontjából kiemelt jelentőséggel bírnak, hiszen ezen adattárházak a cég széleskörű és teljes üzleti infomációforrásai, amelyek idősor analízisre is tökéletesen alkalmasak. Adatbányászati technikákkal lehetővé válik a vállalati adattenger rejtett összefüggéseinek feltárása. Például egy megfelelő mennyiségű és minőségű vevőadatokkal rendelkező cég képes lehet eldönteni, melyek azok az ügyfelek, akik a leginkább fogékonyak direkt-marketing hirdetéseikre. (életkoruk, lakóhelyük, családi állapotuk, stb. alapján)
Az adatbányászat iránt érdeklődőknek Bodon Ferenc tanulmánya átfogó, folyamatosan frissített olvasmányként szolgálhat. 
 

  

A bejegyzés trackback címe:

https://dwbi.blog.hu/api/trackback/id/tr491415257

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.