Olvasási idő: 2 perc
Annak apropóján írom e szösszenetet, hogy könyvünk (Business value in an ocean of data) e-book formában is megjelent. Ezt a formát elsősorban azok kedvéért hoztuk létre, akik tanulmányaikhoz szerették volna elérni a kiadványt, illetve több ügyfelünk is jelezte, szívesebben ismerné meg a digitális változatból a BI, az adatbányászat alkalmazását az üzleti gyakorlatban.
Miközben azonban e 2013-ban íródott könyvünk e-lapjait forgattam, felmerült bennem, hogy vajon mennyire lehet jó alap a tanuláshoz vagy üzleti ötletek kereséséhez egy adatelemzéssel foglalkozó könyv, amiben nem szerepel a big data fogalma. Hiszen mostanában a csapból is a big data buzzword folyik. Több nagyvállalati ügyfelünk is küzd az igazi nagy adatokkal kapcsolatos business case-ek kialakításával és implementációjával. De még nem láttunk igazi üzleti áttörést, ahol a gépek által generált adatokat komoly megtérüléssé fordíthatták volna.
Így hát, hogy megtudjam, mennyire vagyok őskövület vagy mennyire igazodok az idők szavához, beiratkoztam pár big data tanfolyamra. Ezeken szépen elmagyarázzák, hogy mennyi adat van; hogy azokat jól elő kell készíteni, tisztogatni, megelemezni, vizualizálni és végül riportokat készíteni a kapott eredményből. Mellesleg pedig megismertetnek fantasztikus új eszközökkel: Hadoop, Spark, Hive, meg még húsz másik. Sőt, példaként meg is mutatják, hogyan kell ezeket parancssorból meghívni.
Ügyfeleinknél vannak big data-val asszociált, elosztott technológiával megkezdett próbálkozások, de ezek legtöbbje egyelőre az IT játékszerei, észlelhető üzleti cél nélkül, és jelenleg elsősorban az infrastruktúra kialakításánál tartanak. Bőgel Györgyöt, a CEU professzorát idézve inkább adattemetők, mint adatbányák. Van olyan szupernagy cég, amelyik 3 havonta cseréli le még újabbra az adatfeldolgozó eszközét.
Ezen közben buzzword-ök nélkül napi gyakorlattá vált a hagyományosabb relációs adatbázisokon végezhető, tranzakció alapú elemzés: csalásfelderítésben, CRM-ben jelentős üzleti sikereket látunk. Érdekes módon még az online pénztárgépek adatai is feldolgozhatóak ésszerű idő alatt a kiforrott adatbázis-kezelőkkel.
Az utóbbi év leglátványosabb eredményeként értékelem, hogy több olyan vizualizációs és dashboard projektekre kérnek fel bennünket, amelyekben valóban adatalapú döntésekre nyílik esély. Átütő hatásokat érzékelünk több iparágban, cégvezetői, államtitkári szinteken.
Ezek után úgy döntöttem, még nem nyilvánítom magamat fosszíliának, inkább levontam a tanulságokat:
- Az első tanulság az, hogy a könyvünkben épp azokról a kiforrott módszerekről meséltünk mélységében, amit adatbányász- adattárház építési tevékenységünk során végeztünk, és ma ezeket big data címkével látnák el.
- A másik tanulság, hogy a big data technológiák nagyon messze vannak még a letisztultságtól – nekem a céhes világot juttatja eszembe – , ami tömeges üzleti hasznot hozó alkalmazhatóságuk korlátja. Két eset lehetséges: vagy valamelyikük integrálja és felhasználóbaráttá teszi a palettát, vagy pár hagyományos szoftverszállító (pl. IBM, Microsoft, Oracle, SAS) addig vásárol és/vagy fejleszt, hogy szinte észre sem vesszük, hogy más skálájú adatot dolgoztunk fel.
Addig is a magyar ugaron még nem találkoztunk akkora adattal, amit ne lehetett volna agymunkával, ésszerű üzleti-technikai kompromisszummal és kiforrott adatbázis-kezelővel, a könyvünkben leírt módszerekkel hasznosítani.
A lehetőségeket persze mi is örömmel várjuk, és ha a feladat úgy kívánja, hadrendben állítjuk minden big data tudásunkat, amelyet a korábbi munkáink során megszereztünk.
A Hiflylabs üzleti értéket nyer ki az adatokból. A csapat magja jó 15 éve dolgozik ezen, ma már több mint 50 lelkes munkatárssal együtt.