03
01/2011
1

Alternatív adattárház technológiák összehasonlítása

 Véget értek az ünnepek? Még most is émelyegsz a púposra pakolt bejglis tál látványától? Rókáznod kell, ha virslire, lencsére vagy halászlére gondolsz? Azt hiszem, kedves olvasó, épp itt az ideje, hogy olvass egy összehasonlító tesztet az adattárházas technológiákról, aztán talán belefér még egy - két karácsonyról megmaradt fagyasztott töltött káposzta…

Egyik kollégám talált rá egy Szaud-Arábiai egyetemi honlapon, azon a bizonyos bűnös interneteken erre a kis gyöngyszemre: új technológiákat, architektúrákat használó adattárház megoldásokat mértek össze egymással és az ősi konkurenciával: az Oracle-el.

Sajnos a készítő egyetem weboldalának szinte minden egyes szava egy az általam kevéssé beszélt szaudi arab dialektusban (eltekintve a prezentációtól, amiben viszont minimális a magyarázó komment) íródott, emiatt bizonyos területeken erősen a fantáziánkra kell hagyatkoznunk, ha ki akarjuk találni, pontosan milyen szabályok mentén hasonlították össze a technológiákat. Ennek ellenére megéri átolvasni itt.

A szokásos, rövid összefoglaló a lusta olvasóknak:

Egy leírhatatlan nevű egyetem, megfejthetetlen (hacsak nem akarunk google translate-zni, de nekem az sem akart érthetően fordítani ezen az oldalon) okokból készített / publikált egy összehasonlító elemzést, amiben a DWBI oldalain is gyakran szereplő Infobright, Greenplum és Vertica adatbázis kezelőket hasonlítottak össze, olyan szempontok szerint, melyik a legalkalmasabb egy nagy mennyiségű web-forgalmi adatokat tartalmazó, elemzőket kiszolgáló adattárház megvalósítására.

Az összehasonlítás részletesebb szempontjai és a bennük elért pontszámok:

A performancia összehasonlítás oly módon történt, hogy generáltak egy 11milliós tény táblából és 5 dimenzióból álló adathalmazt (ez mondjuk a tesztelt adatbázis kezelők és a felhasznált hardver tekintetében szerintem az ágyúval zöldszemes ostorosra tipikus esete, így valószínűleg torzítja a végeredményt is kissé).

Ami a performancia tesztekből látszik, hogy sebesség tekintetében a Vertica veri a mezőnyt (a Greenplum 0,3sec-es átlagos válaszidőkhöz képest 0,07sec átlagot produkált - ami nem tűnik nagy különbségnek abszolút értékben, ám százalékosan jelentős). Az Infobright csak egyszerű kezelhetőségben tudta megverni a többieket, és az Oracle futás eredményeket hol űberelte, hol meg betlizett a többiekhez képest, de a teljesítménye szinte semmilyen performancia teszt-esetben nem volt meggyőző.

A Greenplum főleg a flexibilitás terén domborított nagyot a teszt készítői szerint, bár én hozzátenném, hogy a szabványosság, pl ANSI SQL 2003-nak való megfelelőség terén szerintem egyedül a Greenplum képes valamennyire is megszorítani az Oracle-t, ott a többiek szerepelnének gyengébben. Emiatt a meglévő SQL alapú BI eszközök kiszolgálásában hasznos kis barátunk lehet.

A konfigurációk a preziben megadott árai furák kissé: 

• az Infobight még érthető a maga 50k dollárjával/első év, 

• a Vertica-nál nem értem, hogy hogyan lehet olcsóbb, mint az Infobright, hiszen egy 3 szerverből álló cluster-en fut. Annyival meg nem olcsóbb a licensze…

• A Greenplum 200k dollárja meg vegytiszta ökörségnek tűnik. A Vertica is túl van tervezve egy 3 gépes clusterrel, de a Greenplum 5 gépes flottája (16 giga memóriával és 16 Terra vinyóval node-onként) abszolút nem indokolható. A tesztelők szerint a gyártók ajánlása alapján készültek a konfigurációk – hát vagy a GP csapat ünnepelte túl hatékonyan az EMC fölvásárlást, vagy a tesztelőknek gurult el a gyógyszere, de valaki benézett egy nagyságrendet.

A fenti hibák ellenére érdekes és tanulságos olvasmány a teszt, különösen olyan szemmel, hogy egy az adattárházak világában érzésem szerint nem vérprofi gárda is eljuthatott ide: képesek többé kevésbé objektív szempontok alapján kiválasztani és összehasonlítani a technológiákat, és racionális érveket felsorakoztatni a használatuk mellett, vagy ellen. Ez pedig már a fenti technológiák piaci érettségét, erős jelenlétét, támogatottságát, potenciálját – és ezzel a mindenki számára oly kedves versenyhelyzetet is csak erősíti. 

A bejegyzés trackback címe:

https://dwbi.blog.hu/api/trackback/id/tr792556362

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Koczeka_EG6 2011.01.06. 10:53:57

még 1 ökörség az anyagban: Teradata Software vendor (ölég sok appliance-al bírnak)