09/20100
EMC Greenplum szeminárium és újdonságok
A héten rendezték meg európa első hivatalos EMC Greenplum szemináriumát Frankfurtban, amelyen volt szerencsém személyes valómban is részt venni. A kifejezetten technikai jellegű adminisztrátori tréningek és workshopok mellett szó esett az EMC és Greenplum közös jövőjéről, stratégiájáról is. Természetesen több, a termékkel kapcsolatos bejelentés is elhangzott, így első kézből értesültünk az új, négyes verzió tervezett megjelenéséről, valamint az SAP BusinessObjects és Microstrategy partnerségről, amelynek keretében a BI gyártók még szorosabban fogják kihasználni a Greenplum adatbáziskezelő fejlett analitikus és OLAP kiterjesztéseit. De pontosan miről is volt szó?
A tréningen már az új, négyes Greenplum adatbáziskezelő szerverrel dolgozhattunk, illetve próbálhattuk ki az új funkcióit. Bár az oszlop alapú tárolás nem új, hiszen a Greenplum korábbi verziói (3.3+) is támogatták, azonban az új verzió jobban kihasználja az oszlop alapú táblák tömörítésének lehetősegiet. Képes egyéb tárolók (NAS, SSD) intelligens kezelésére, megadhatóak automatikus adatmigrációs szabályok. Ezt az új rendszert egyébként Polymorphic Data Storagenak hívják.
Szintén újdonság az Dynamic Query Priorization bevezetése, amely segítségével tervezetten és valós időben is lehet az erőforrásokat kezelni. Tipikus példa, hogy a különböző felhasználók lekérdezését nem csak szerepkörök, de a tervezett planek és futásidők alapján is osztályozhatjuk és priorizálhatjuk. Megadhatjuk, hogy az ad-hoc felhasználók azon lekérdezéseiből, amelyek a planjük szerint több mint 30 másodpercig futnak, maximum 3 futhasson egy időben, a többi kerüljön be egy várakozási sorba, míg a legfontosabb riportok lekérdezései minden esetben élvezzenek elsőbbséget. A technológia segítségével jobban gazdálkodhatunk erőforrásainkkal, jobban tervezhetjük a rendszer válaszidejeit.
Szintén újítás, hogy lehet tárolt eljárásokat írni C, Java és R nyelveken is. Ezek felhasználhatóak MapReduce eljárásokban is. Az R nyelv segítségével elosztott adatbányászati és statisztikai folyamatokat is kezelhetünk, mint azt egy amerikai telkotársaság már be is vezette a churn analízésének futtatásához. Az új nyelvekkel kapcsolatban van némi személyes érintettség is, mivel a C nyelvű MapReduce példaprogramot én követtem el, így egy kicsit magaménak is érzem az egész Greenplumos MapReduce dolgot. (Továbbá a ruby nyelvet is leportoltam Greenplum alá, előbb utóbb az is része lesz a következő verzióknak).
További fejlesztések történtek az SQL nyelvi kiterjesztésekben. A teradata által legtöbbet hangsúlyozott correlated subquery kezelésre is született megoldás. Ezeknek az allekérdezéseknek a végrehajtására a hagyományos postgres alapú adatbázisokban csak a teradata adott megoldást, azonban a 4-es verzióval a Greenplumban is lehetőség van az ilyen SQL-ek futtatására. Természetesen az összes oracle-ben elérhető analitikus függvény (aggr partition by) és OLAP kiterjesztés (grouping sets, rollup, cube, stb.) elérhető és használható.
A stratégiát illetően egyértelmű az EMC üzenete. A cég megkezdte az cloud alapú technológiák integrálását (elég csak az EMC tulajdonában lévő virtualizációs megoldásokat kínáló VMware-re, vagy a cloud security miatt felvásárolt RSA-ra gondolni). A Greenplum skálázhatóságának köszönhetően jó alanya a Corporate Private Cloudenak, ezért is készült el a kifejezetten felhő alapú Chorus keretrendszer. A cél tehát egy homogén EMC alapú, teljes nagyvállalati felhő megoldás, amelyben az adattárház adatbáziskezelője egyértelműen a Greenplum.
A szünetekben is ment az észosztás, megtudhattuk a híg német kávé társaságában, mit hekkeltek a Greenplumon a Skype-os adattárházas kollegák, vagy hogy lehet dubaiban alkudozás nélkül eladni cloud rendszereket.
Sajnos már a repülőgépen el kellett kezdeni szoktatni magam a magyarországi helyzethez, ahol az alternatív adattárház platformok nem a költségcsökkentés, inkább a meghökkentés eszközei.
A bejegyzés trackback címe:
Kommentek:
A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.