Zer da "Big Data" zehatza?

Zergatik da Big Deal?

"Datu handiak" giza zientzien ulermen eta aurresateko zientzia berri bat da, datu ez estrukturatutako bolumen handiak aztertuz. Datu handiak ere "iragarpen iragazkiak" deritze.

Twitter mezu, Facebook jarioak, eBay bilaketak, GPS jarraitzaileak eta kutxazain automatikoak aztertuz gero, datu-adibide handiak dira. Segurtasuneko bideoak, trafiko datuak, eguraldiaren ereduak, hegaldi irteerak, telefono dorreen erregistroak eta bihotz-tasaren jarraitzaileak ikasten dira. Big datuak asteartean aldatzen duen zientzia berri bat da eta aditu gutxi batzuek ulertzen dute.

Zein dira Big Datuen adibide batzuk Bizitza erregularrean?

pantaila-argazkia http://project.wnyc.org/transit-time

Datuen proiektu handienak oso ezkutukoak diren arren, gizabanakoen, enpresen eta gobernuen eguneroko bizitzan eragiten duten datu handien adibide arrakastatsuak daude.

Biriketako birusak aurreikusteko: datu soziopolitiko, klimatologiko eta klimatiko datuak eta ospitale / datu klinikoak aztertuz gero, zientzialariek dengue sukarra broteak aurreikusten dituzte 4 aste lehenago.

Homicide Watch: datu-proiektu handi honek profila hilketa biktima, susmagarri eta gaizkile Washington, DC. Hildakoaren omenez eta jendeari sentsibilizatzeko baliabide gisa, datu-proiektu hau zoragarria da.

Transit Travel Planning, NYC: WNYC irrati programatzaile Steve Melendez lineako metroaren ordutegia konbinatu bidaia ibilbide-softwarearekin. Bere sorrerak New Yorkerrarekin klik egiten uzten dio mapan kokapenean, eta bidaiaren denbora iragarpena tren eta metroa agertuko da.

Xerox-ek bere langileen galera murriztu du: dei zentroen lana emozionalki agortu egiten da. Xerox-ek analista profesionalen laguntzarekin datuen erreserbak aztertu ditu eta gaur egun aurreikusten diren dei zentroen kontratazioak litekeena da enpresarekin luzeena izatea.

Terrorismoaren aldeko apustua: gizarte-komunikabideen, finantza-erregistroen, hegaldiaren erreserben eta segurtasunaren inguruko datuak aztertuz, legea betearazteko aurrez aurre eta terroristek susmagarrien aurkitzea ahalbidetzen dute beren egintza gaiztoak egin aurretik.

Marka komertziala doitzea sare sozialetan oinarritutako berrikuspenetan : jendeak modu errazean eta azkar partekatzen du pentsamenduak pub, jatetxean edo fitness klubean. Milioi sare sozialen mezu horiek aztertzea posible da eta konpainiari eskaintzen dizkion iritziak ematen dizkie zer zerbitzuek zer uste duten.

Nork erabiltzen du Big Data? Zer egiten dute?

Korporazio monolitiko askok datu handiak erabiltzen dituzte beren eskaintza eta prezioak egokitzeko, bezeroen asebetetzea maximizatzeko.

Zergatik Big Data Big Deal bat bezalakoa da?

4 gauza handiak esanguratsuak dira:

1. Datuak masiboa dira. Ez du disko gogor bakar batean sartzen, askoz gutxiago USB makina bat . Datuen bolumena gainditzen du giza adimena hautemateko (pentsatu milioi bat mila milioi megabyte) eta, ondorioz, bilioika gehiago biderkatzen du.

2. Datu nahasiak eta ez-egituratuak. Datuen datu handien% 50 eta% 80 bilakatzen eta informazioa garbitzen da bilaketak egiteko eta ordenatzeko. Bakarrik mila adituk planeta honetan guztiz ezagutzen dut nola egin datuen garbiketa hau. Aditu horiek ere oso espezializatutako tresnak behar dituzte, HPE eta Hadoop bezalakoak, haien artisautza egiteko. Beharbada, hamar urte barru, datu-aditu handiek dozena bat zentimetro izango dituzte, baina oraingoz analista-espezie oso arraroa dute eta haien lana oso iluna eta aspergarria da.

3. Datu bihurtu da ** komertzialtasuna saldu eta erosi ahal izatea. Datuen merkatuak existitzen dira, non enpresek eta partikularrek sare sozialen eta beste datu batzuen terabytes erosi ditzaketen. Datu gehienak hodeian oinarrituta daude, disko gogorrean sartzeko oso handia denez. Datuak erostea normalean hodeiko zerbitzari baserritara konektatzen zaren harpidetza kuota dakar.

** Datu tresna eta ideia handien liderrak Amazon, Google, Facebook eta Yahoo dira. Enpresa horiei esker, milioika pertsonari beren zerbitzu lineekin zerbitzatzen direnez, zentzuzkoa da bildumako puntua eta datu analitiko handien atzean zeudenak direla.

4. Datu handien aukerak amaigabeak dira. Beharbada medikuek egun bateko bihotzeko eraso eta trazuek aurrez iragarriko lukete gizabanakoen astez. Hegazkina eta automobilen hutsegiteak datu mekanikoen eta trafiko eta eguraldiaren inguruko aurresateko analisiak murriztuko lirateke. Lineako datazioa hobetu egin daiteke zure nortasunarekin bat datozen datuen aurreikuspen handiak dituztela. Musikariek ulermen handiagoa izan dezakete musikaren konposizioa xede-publikoetako gustu aldakorretarako atseginena dela. Elikagaiak saltoki eta erositako elikagaien konbinazioek pertsonen baldintza medikoak larriagotu edo lagunduko dieten aurreikusteko gai izan litezke. Azalera arrastaka bakarrik egon da, eta datu handien aurkikuntzak astean behin egiten dira.

Big Data gaizki dago

Monty Rakusen / Getty

Big datuak aurresateko analisiak dira: datu ez-egituratuak masiboak bihur daitezkeen datu bihurtzeko. Ezagutza eta pazientzia berezia eskatzen duen espazio nahasiak eta kaotikoak dira.

Esate baterako, UPS entregatzeko zerbitzu monolitikoa. UPS programatzaileek beren kontrolatzaileen GPS eta smartphoneen datuen azterketa egin dute trafiko pilaketak egokitzeko modu eraginkorrenak aztertzeko. GPS eta telefono mugikorren datuak gargantuan daude eta automatikoki ez daude prestatzeko. Datu horiei GPS eta maparen datu base desberdinetatik ateratzen dira, telefono mugikorren gailu desberdinen bidez. UPS analistek hilabeteak igaro dituzte datu horiek guztia erraz bilatzea eta ordenatu ahal izateko formatuan bihurtzea. Ahaleginak merezi du. Gaur egun, UPSk 8 milioi erregaia baino gehiago gorde ditu datu analitiko handiak erabiltzen hasi zenetik.

Datu handiak nahasgarria delako eta erabilerarako prestatzeko eta prestatzeko ahalegin handia eskatzen duelako, datuen zientzialariek goitizena den 'datuen kontsumitzaileak' bihurtu dituzte lan neketsurako.

Datu handien eta aurresateko analisi zientifikoak astean behin hobetzen ari dira. Datu handiak 2025. urtetik 2025. urtera bitarteko sarbidea izatea espero da.

Ez da Big Data pribatutasunaren aurkako tratu txarrak?

Feingersh / Getty

Bai, gure legeak eta pribatutasun-babeseko banakoen arreta handiz kudeatzen ez badira, datu handiak pribatutasun pertsonalean sartuko dira. Nabarmendu bezala, Google eta YouTube eta Facebook zure ohiturak eguneroko ohiturak jarraitzen dituzte . Zure telefonoak eta informatika bizitza aztarna digitalak egunero uzten dituzte, eta sofistikatuek aztarna horiek ikertzen ari dira.

Datu handien inguruan dauden legeak eboluzionatzen ari dira. Pribatutasun hori izatearen egoera da, erantzukizun pertsonala hartu behar duzula, ezin baita lehenetsitako eskubide gisa espero.

Zure pribatutasuna babesteko zer egin dezakezu:

Abiatzen duzun urrats bakarrak zure eguneroko ohiturak betetzen ditu VPN sarearen konexio bat erabiliz . VPN zerbitzu batek zure seinalea nahastuko du, zure identitatea eta kokalekua jarraitzaileetatik gutxienez partzialki ezkutatuta egongo direla. Horrek ez dizu% 100 anonimotzat hartuko, baina VPN batek nabarmen murriztuko du mundua zure lineako ohiturak behatzeko.

Non dezaket Big Data buruz gehiago ikasi?

Monty Raskusen / Getty

Big datuak adimen analitiko eta teknologiarako maitasuna duten pertsonentzat zoragarria da. Horrela bada, behin betiko bisita ezazu datu interesgarrien proiektu interesgarrien orrialdea.