Big data, fjalë për fjalë “sasi të mëdha të dhënash”, janë zakonisht informacione dixhitale aq të mëdha sa nuk mund të përpunohen pa mbështetjen e kompjuterëve. Sasia e të dhënave, për të dhënë një masë të kuptueshme, shumë më e madhe se ajo që mund të ruhet në hard diskun e një kompjuteri, sado e madhe të jetë kjo.
Gjatë vitit 2018, njerëzimi prodhoi aq të dhëna sa u gjeneruan në të gjithë historinë e njeriut deri në vitin 2017. Një sasi të dhënash që vlerësohet të dyfishohet nga viti në vit. Janë figura letrare, është e pamundur të matet me saktësi se sa të dhëna prodhojmë offline dhe sidomos online. Ne krijojmë të reja çdo ditë, kur bëjmë pazar duke i dorëzuar arkëtarit kartën e besnikërisë së supermarketit, kur dërgojmë email, kur paguajmë një rezervuar të plotë benzinë me një ATM, kur marrim pjesë në lotari duke treguar të dhënat tona personale. Ne i prodhojmë gjithmonë më shumë falë telefonave tanë inteligjentë ose pajisjeve të lidhura (orë inteligjente, termostate inteligjente, asistentë zanor, etj.). Ne i prodhojmë ato kur shfletojmë në rrjet, kur shikojmë video ose dëgjojmë muzikë në transmetim. Çfarëdo që të bëjmë ne gjenerojmë të dhëna që mund të përdoren në një mënyrë të shkëlqyer dhe në një mënyrë të keqe, siç do të shohim më poshtë.
Pikëpamja e kompanive
Termi të dhëna të mëdha është jotrupor, ai nuk përcjell idenë se sa duhet të jetë “i madh” ose se çfarë qëndron pas fjalës “të dhëna”. Organizatat i grumbullojnë dhe i arkivojnë ato gjithashtu për shkak të kostos tashmë të arritshme të teknologjive të përdorura për t’i ruajtur dhe për t’i ekzaminuar ato, në mënyrë që të nxjerrin informacione që nuk shihen me sy të lirë, të tilla si zakonet e blerjes, qëndrimet e sjelljes, preferencat e udhëtimit, parimet sipas të cilat ne i zgjedhim restorantet, destinacionet turistike dhe shumë aktivitete të tjera.
Sidoqoftë, mbledhja e të dhënave është një gjë, dhe të dish se si t’i organizosh dhe përpunosh ato është një çështje krejt tjetër. Detyra të një natyre të ndryshme si dhe shkalla e vështirësisë së tyre. Pothuajse të gjitha kompanitë janë të afta në mbledhjen e tyre, aq më pak janë ato që dinë t’i përdorin ato në mënyrë gjithëpërfshirëse. Përtej një grushti kompanish që dinë ta përdorin atë që nuk është gjithmonë e mirë (Facebook, Amazon dhe Google, për të përmendur më kryesoret), është shkenca në përgjithësi ajo që po jep demonstrimet më të mëdha të potencialit të të dhënave të mëdha.
Big data dhe shkenca
Nxjerrja e vlerës nga të dhënat e mëdha është diçka që shkenca e bën shumë mirë. Ndër shembujt më të rëndësishëm mund të përmendim astronominë, e cila po zgjeron gjithnjë e më shumë horizontet e saj, mjekësinë precize por edhe detyra më ambicioze dhe komplekse nga pikëpamja e parashikimeve: të dhëna të mëdha (dhe inteligjenca artificiale) po përdoren. për të parashikuar pandemitë (ose të parashikojnë sipas modeleve që zgjerohen), të parashikojnë tërmete (mision në kufi me të pamundurën) dhe madje edhe sulme terroriste. Lidhja e të dhënave të mëdha dhe aftësia për t’i shqyrtuar ato me përparimin njerëzor tani është e pashmangshme.
Nuk janë gjëra të këqija, por duhet të mbeten anonimë
Rruga e nxjerrjes së vlerës së të dhënave i nënshtrohet një logjike të qartë: shndërrimi i të dhënave në informacion, informacioni në njohuri dhe njohuria në njohuri.
Vënia në pikëpyetje e të dhënave të mëdha, zbulimi i modeleve të sjelljes dhe shkencore (të quajtura “modele”) ka një rëndësi të madhe. Gjatë pandemisë, sasia e madhe e të dhënave luajti gjithashtu një rol themelor në kërkimin mbi vaksinat, të cilat, ia vlen të kujtojmë, u krijuan në kohë rekord. Të dhënat e mbledhura nga ata që u infektuan me virusin u trajtuan në mënyrë anonime dhe u përpunuan, u ekzaminuan dhe u studiuan për të gjetur se si të çrrënjoset Covid-19.
Nëse shkenca do të kishte më pak të dhëna në dispozicion, po të mos kishte mënyra të shpejta dhe të besueshme për ta organizuar dhe studiuar atë, do të kishim vaksina më pak efikase dhe më pak të shpejta.
Për kërkimin shkencor, nuk kishte rëndësi që të dhënat të ishin të qarta dhe të folura, nuk kishte nevojë që informacioni të përputhej me identitetin e njerëzve që e gjeneruan atë.
Shembulli i kundërt, ose një situatë në të cilën Big data tregon anën më të keqe, mund të gjendet në një rast jo shumë të fundit në të cilin Facebook është bërë vullnetarisht protagonist.
Le të kthehemi në vitin 2017, në Shtetet e Bashkuara të Amerikës. Historia është e gjatë dhe e detajuar, ne e reduktojmë atë në thelbësore pa ia hequr qartësinë. Një grua merr avionin për të vizituar djalin e saj dhe në aeroport i konfiskohet shishja e parfumit sepse nuk respekton masat e sigurisë. Disa ditë më vonë një reklamë për të njëjtin parfum u shfaq në rrjetin social Facebook të djalit.
Duket si magji por e gjithë kjo ka një shpjegim shumë të thjeshtë: Facebook-u e di që gruaja është në shtëpinë e fëmijës së saj sepse në rrjetin social, në fushën ku çdo përdorues mund të fusë shkallët e lidhjes farefisnore apo emrin e partnerit, nëna ka e bëri të qartë se kush ishte fëmija (ose anasjelltas). Gruaja më pas lidhi pajisjen e saj celulare me rrjetin e internetit të shtëpisë së djalit të saj, kështu që Facebook (me të drejtë) doli se të dy ishin nën të njëjtën çati.
Duke kryqëzuar informacionin komercial që gruaja ka shpërndarë (për shembull me kartat e besnikërisë) doli se ajo është mësuar të përdorë parfumin që i është konfiskuar në aeroport dhe se blen një shishe çdo dy vjet. Duke e ditur se gruaja do të ishte ende pranë blerjes së saj përsëri dhe duke imagjinuar që djali i saj do t’ia jepte me kënaqësi, Facebook bashkoi informacionin në profilizimin e reklamave. Në këtë rast, të dhënat, duke përfshirë vendndodhjen e përditësuar, janë të lidhura me emra dhe mbiemra të veçantë.
Po sikur të ishte një produkt tjetër (ndoshta i një natyre më private, si mund të jetë një pajisje farmakologjike) ose dy persona me një shkallë të ndryshme farefisnore? Ky përdorim i të dhënave të mëdha duhet të kufizohet përmes ligjeve të qarta, diçka për të cilën Garantuesit e Privatësisë të shteteve të ndryshme po punojnë shumë.
Big data nuk është e keqe, përkundrazi, do të shënojë përparimin e njerëzimit. Përdorimi i tyre dhe zona në të cilën përdoren është një çështje krejt tjetër.
Discussion about this post