Big data
Big Data alatt a nagyon nagy mennyiségű, gyorsan változó és áramló, változatos adatok elemzését szokás érteni. Újabban a jellemzők közé sorolják azt is, hogy az adatok hibahatárát azok mennyisége nagymértékben csökkenti. A Big Data forradalmát az hozta el, hogy ennyi adat korábban nem létezett, és lehetetlen is volt feldolgozni, most viszont már lehetséges.
+
- + Piackutatás primer adatokból.
- + Pontos előrejelzések készíthetők.
–
- - Nagy számítógépes kapacitás igénye van.
- - Adatvédelmi problémákat vet fel.
- - Komoly fejlesztést igényel.
A Big Data alapanyaga hagyományos adatbázisokba nem rendezhető, nem strukturált, épp ezért a hagyományos adatelemzési módszerekkel nem is kezelhető. Eddig a keletkező adatoknak csak igen kicsi hányadával tudtunk kezdeni valamit, a többit - megfelelő eszközök és szaktudás hiányában - fölöslegesen gyűjtöttük, vagy kidobtuk, töröltük.
A Big Data fogalma valójában az elemzés attitűdjét jelenti: felváltjuk a hagyományos, reprezentatív mintavételen alapuló felméréseket, és már meglévő, automatikusan képződő, hatalmas adattömegekből jósolunk, ezeket elemezzük. Tudni kell azonban, hogy ezzel a hozzáállással csak azt lehet elemezni, amiről van adat, vagyis azokat az emberi tevékenységeket, amik digitális lábnyomot hagynak maguk után, vagy azokat a gépi történéseket, amiket valamilyen szenzor rögzít.
Ahogy életünk egyre digitalizáltabbá válik, úgy egyre több adat jön létre, és egyre több adatot hozhatunk létre mi magunk. Közösségi médiás jelenlétünk, telefonunk gps-e, adatforgalmunk, kép- és hangüzeneteink, az utcai és bolti kamerák, a tárgyakba épített szenzorok, a bankkártya-leolvasók, mind-mind gyűjtik és ontják az adatokat – ez maga a dolgok internete.
Elképesztő mennyiségű adat keletkezik az egészségügyben, az iparban, a közlekedésben, vagy akár a kormányzati szektorban is. Az adatmennyiség növekedését jól mutatja, hogy az emberiség történetében létrejött összes adat nagyjából 90 százaléka az elmúlt pár évben keletkezett.
Kis túlzással azt mondhatjuk, hogy aminek le tudjuk írni a múltját, annak meg tudjuk mondani a jövőjét is. A Big Data elemzéssel pedig leírható a múlt, és ezzel képet alkothatunk a jövőről is. Emellett az elemzés alapján „előíró” jellegű eredmény is születhet, azaz új megoldásokat javasolhatunk a korábbi adatok elemzésével, tesztelésével.
Gyakran észre sem vesszük, hogy mi magunk is használunk Big Data elemzéseket. Big Data elemzésen alapul minden időjárás előrejelzés, de amikor bekapcsolunk egy navigációs programot, akkor is Big Datát használunk. A program kismillió telefonból származó információ alapján számítja ki, hogy hogyan kerülhető ki a délutáni csúcsforgalmom.
A dolog kulcsa az adatbányászat: ez az, amikor hatalmas mennyiségű, strukturálatlan adatban próbáljuk megtalálni a lényeget. Kutatók tízezrei dolgoznak azon, hogy ehhez optimális, rövid futásidejű algoritmusokat dolgozzanak ki.
Ilyen rendszerek sokféle céllal létrejöhetnek az élet minden területén. A leggyakrabban emlegetett felhasználási terület a kereskedelem, mert a Big Datával könnyen profilozhatóvá válunk, azaz feltérképezhetők vásárlási szokásaink, és később vásárlássá érő vágyaink, így a kereskedő személyre szóló ajánlatokkal lephet meg minket (ami azért nem mindig tölt el mindenkit boldogsággal).
Hétköznapi tapasztalataink szerint azért messze vagyunk még ettől: ha ma gekkóra keresnénk a Google-on, akkor még egy hónap múlva is gekkós hirdetéseket fog feldobni, holott mi már rég terráriumot és tápláléknak való szöcskét akarunk venni Gyurmának, a családi gekkónkak. Ám az online hirdetési rendszerek gyorsan fejlődnek, és hamar eljöhet a kor, amikor gekkóra keresve, egy 20 százalék kedvezményre jogosító névre szóló örök hűségkártyát kapunk majd a hozzánk legközelebbi kisállat kereskedésből.
Jól látható, hogy a Big Data kezelésnek egyik fontos kihívása a személyes adatok kezelése. Digitális lábnyomainkból meglehetősen pontos profil rajzolható az egyes emberekről. Ezt a cégek felhasználhatják a szolgáltatások javítására, igényekre való azonnali reagálásra, de visszaélésre is ad lehetőséget. Így manapság egyre fontosabb, hogy a gyűjtött adatokat a cégek – különösen a hihetetlen adatmennyiséget felhalmozó Big Tech vállalatok - átláthatóan kezeljék, és mi is tudatosabbak legyünk abban, hogy digitális nyomainkat valahol, valakik követik.
Utoljára szerkesztve: 2023. február 5.