Nani anakusanya data kubwa na kwa nini?

Mnamo msimu wa 2019, kashfa ilizuka na huduma ya Kadi ya Apple: wakati wa kusajili, ilitoa viwango tofauti vya mkopo kwa wanaume na wanawake. Hata Steve Wozniak hakuwa na bahati:

Mwaka mmoja mapema, ilifunuliwa kuwa jukwaa la Netflix linaonyesha watumiaji mabango na vivutio tofauti, kulingana na jinsia yao, umri na utaifa. Kwa hili, huduma hiyo ilishutumiwa kwa ubaguzi wa rangi.

Hatimaye, Mark Zuckerberg anakaripiwa mara kwa mara kwa madai ya kukusanya, kuuza na kuendesha data za watumiaji wake na Facebook. Kwa miaka mingi, alishutumiwa na hata kujaribiwa kwa udanganyifu wakati wa uchaguzi wa Marekani, akisaidia huduma maalum za Kirusi, kuchochea chuki na maoni makubwa, matangazo yasiyofaa, kuvuja data ya mtumiaji, kuzuia uchunguzi dhidi ya watoto wa watoto.

Chapisho la Facebook la Zuck

Wakati huo huo, huduma ya mtandaoni ya Pornhub kila mwaka huchapisha ripoti kuhusu aina gani ya ponografia ya mataifa tofauti, jinsia na umri wanatafuta. Na kwa sababu fulani hii haisumbui mtu yeyote. Ingawa hadithi hizi zote ni sawa: katika kila moja yao tunashughulika na data kubwa, ambayo katika karne ya XNUMX inaitwa "mafuta mapya".

Data kubwa ni nini

Data kubwa - pia ni data kubwa (eng. Big Data) au metadata - ni safu ya data ambayo hufika mara kwa mara na kwa kiasi kikubwa. Wao hukusanywa, kusindika na kuchambuliwa, na kusababisha mifano na mifumo wazi.

Mfano wa kushangaza ni data kutoka kwa Collider Kubwa ya Hadron, ambayo inakuja kwa kuendelea na kwa kiasi kikubwa. Kwa msaada wao, wanasayansi kutatua matatizo mengi.

Lakini data kubwa kwenye wavuti sio tu takwimu za utafiti wa kisayansi. Zinaweza kutumika kufuatilia jinsi watumiaji wa vikundi na mataifa tofauti wanavyofanya, kile wanachozingatia na jinsi wanavyoingiliana na yaliyomo. Wakati mwingine, kwa hili, data hukusanywa sio kutoka kwa chanzo kimoja, lakini kutoka kwa kadhaa, kulinganisha na kutambua mifumo fulani.

Kuhusu jinsi data kubwa ni muhimu kwenye mtandao, walianza kuzungumza wakati kulikuwa na mengi sana. Mwanzoni mwa 2020, kulikuwa na watumiaji wa Intaneti bilioni 4,5 duniani, ambapo bilioni 3,8 walisajiliwa katika mitandao ya kijamii.

Nani anaweza kufikia Data Kubwa

Kulingana na tafiti, zaidi ya nusu ya nchi zetu wanaamini kuwa data zao kwenye mtandao hutumiwa na watu wa tatu. Wakati huo huo, wengi huchapisha habari za kibinafsi, picha, na hata nambari ya simu kwenye mitandao ya kijamii na programu.

Nani anakusanya data kubwa na kwa nini?
Nani anakusanya data kubwa na kwa nini?
Nani anakusanya data kubwa na kwa nini?
Nani anakusanya data kubwa na kwa nini?

Inahitaji kuelezewa hapa: mtu wa kwanza ni mtumiaji mwenyewe, ambayo huweka data yake kwenye rasilimali au programu yoyote. Wakati huo huo, anakubali (anaweka tiki katika makubaliano) kwa usindikaji wa data hii upande wa pili - yaani, wamiliki wa rasilimali. Wahusika wengine ni wale ambao wamiliki wa rasilimali wanaweza kuhamisha au kuuza data ya mtumiaji. Mara nyingi hii imeandikwa katika makubaliano ya mtumiaji, lakini si mara zote.

Mhusika wa tatu ni mashirika ya serikali, wadukuzi au kampuni zinazonunua data kwa madhumuni ya kibiashara. Wa kwanza anaweza kupata data kwa uamuzi wa mahakama au mamlaka ya juu. Wadukuzi, bila shaka, hawatumii ruhusa yoyote - wao huhack tu hifadhidata zilizohifadhiwa kwenye seva. Makampuni (kwa sheria) yanaweza kufikia data tu ikiwa wewe mwenyewe umewaruhusu - kwa kuangalia kisanduku chini ya makubaliano. Vinginevyo, ni kinyume cha sheria.

Kwa nini makampuni hutumia Data Kubwa?

Data kubwa katika uwanja wa kibiashara imetumika kwa miongo kadhaa, haikuwa kubwa kama ilivyo sasa. Hizi ni, kwa mfano, rekodi kutoka kwa kamera za uchunguzi, data kutoka kwa wasafiri wa GPS au malipo ya mtandaoni. Sasa, pamoja na maendeleo ya mitandao ya kijamii, huduma za mtandaoni na maombi, yote haya yanaweza kuunganishwa na kupata picha kamili zaidi: wapi wateja watarajiwa wanaishi, nini wanapenda kutazama, wapi kwenda likizo na aina gani ya gari wanayo.

Kutoka kwa mifano hapo juu, ni wazi kwamba kwa msaada wa data kubwa, makampuni, kwanza kabisa, wanataka kulenga matangazo. Hiyo ni, kutoa bidhaa, huduma au chaguzi za mtu binafsi kwa hadhira inayofaa tu na hata kubinafsisha bidhaa kwa mtumiaji maalum. Kwa kuongeza, matangazo kwenye Facebook na majukwaa mengine makubwa yanazidi kuwa ghali zaidi na zaidi, na kuionyesha kwa kila mtu mfululizo sio faida kabisa.

Taarifa kuhusu wateja watarajiwa kutoka vyanzo wazi hutumiwa kikamilifu na makampuni ya bima, kliniki za kibinafsi na waajiri. Wa kwanza, kwa mfano, anaweza kubadilisha masharti ya bima ikiwa wanaona kuwa mara nyingi unatafuta habari juu ya magonjwa au dawa fulani, na waajiri wanaweza kutathmini ikiwa unakabiliwa na migogoro na tabia isiyofaa.

Lakini kuna kazi nyingine muhimu ambayo imekuwa ikijitahidi katika miaka ya hivi karibuni: kupata karibu na watazamaji wengi wa kutengenezea. Hii si rahisi sana kufanya, ingawa kazi hii inawezeshwa kwa kiasi kikubwa na huduma za malipo na ukaguzi wa kielektroniki kupitia OFD moja (opereta wa data ya fedha). Ili kupata karibu iwezekanavyo, makampuni hata hujaribu kufuatilia na "kulea" wateja watarajiwa kutoka utoto.: kupitia michezo ya mtandaoni, vinyago shirikishi na huduma za elimu.

Jinsi gani kazi?

Fursa kubwa zaidi za ukusanyaji wa data ni kutoka kwa mashirika ya kimataifa ambayo yanamiliki huduma kadhaa kwa wakati mmoja. Facebook sasa ina watumiaji zaidi ya bilioni 2,5 wanaofanya kazi. Wakati huo huo, kampuni pia inamiliki huduma zingine: Instagram - zaidi ya bilioni 1, WhatsApp - zaidi ya bilioni 2 na wengine.

Lakini Google ina ushawishi mkubwa zaidi: Gmail inatumiwa na watu bilioni 1,5 duniani, wengine bilioni 2,5 na Android mobile OS, zaidi ya bilioni 2 na YouTube. Na hiyo haihesabu utaftaji wa Google na programu za Ramani za Google, duka la Google Play na kivinjari cha Chrome. Inabakia kufunga benki yako ya mtandaoni - na Google itaweza kujua kila kitu kukuhusu. Kwa njia, Yandex tayari ni hatua mbele katika suala hili, lakini inashughulikia tu watazamaji wanaozungumza Kirusi.



???? Kwanza kabisa, kampuni zinavutiwa na kile tunachochapisha na kupenda kwenye mitandao ya kijamii. Kwa mfano, ikiwa benki inaona kuwa umeolewa na unapenda wasichana kwa bidii kwenye Instagram au Tinder, kuna uwezekano mkubwa wa kuidhinisha mkopo wa watumiaji. Na rehani kwa familia imekwenda.

Pia ni muhimu ni matangazo gani unayobofya, mara ngapi na kwa matokeo gani.

(Yaani Hatua inayofuata ni ujumbe wa kibinafsi: una habari zaidi. Ujumbe ulivuja kwenye VKontakte, Facebook, WhatsApp na wajumbe wengine wa papo hapo. Kulingana na wao, kwa njia, ni rahisi kufuatilia geolocation wakati wa kutuma ujumbe. Hakika umegundua: unapojadili kununua kitu au kuagiza pizza tu na mtu, matangazo muhimu huonekana mara moja kwenye malisho.

🚕 Data kubwa hutumiwa kikamilifu na "kuvuja" kwa utoaji na huduma za teksi. Wanajua unapoishi na kufanya kazi, unachopenda, mapato yako ya takriban ni nini. Uber, kwa mfano, huonyesha bei ya juu ikiwa unarudi nyumbani kutoka kwa baa na bila shaka umepita kiasi. Na wakati una rundo la aggregators nyingine kwenye simu yako, kinyume chake, watatoa nafuu.

(Yaani Kuna huduma zinazotumia picha na video kukusanya taarifa nyingi iwezekanavyo. Kwa mfano, maktaba za maono ya kompyuta - Google inayo moja. Wanakuchanganua wewe na mazingira yako ili kuona ukubwa wako au urefu gani, unavaa chapa gani, unaendesha gari gani, iwe una watoto au kipenzi.

(Yaani Wale ambao hutoa lango la SMS kwa benki kwa utumaji wao wanaweza kufuatilia ununuzi wako kwenye kadi - kujua tarakimu 4 za mwisho na nambari ya simu - na kisha uuze data hii kwa mtu mwingine. Kwa hivyo barua taka hizi zote na punguzo na pizza kama zawadi.

🤷️️ Hatimaye, sisi wenyewe huvuja data yetu kwa huduma na programu za kushoto. Kumbuka kwamba hype karibu Getcontact, wakati kila mtu alikuwa na furaha ya kujaza nambari yake ya simu ili kujua jinsi ilivyoandikwa na wengine. Na sasa pata makubaliano yao na usome kile inasema juu ya uhamishaji wa data yako (mharibifu: wamiliki wanaweza kuwahamisha kwa watu wengine kwa hiari yao):

Nani anakusanya data kubwa na kwa nini?

Mashirika yanaweza kukusanya na hata kuuza data ya mtumiaji kwa miaka mingi, hadi kesi itakapofikishwa - kama ilivyokuwa kwa Facebook sawa. Na kisha jukumu kuu lilichezwa na ukiukaji wa kampuni ya GDPR - sheria katika EU ambayo inazuia matumizi ya data kwa ukali zaidi kuliko ile ya Amerika. Mfano mwingine wa hivi karibuni ni kashfa ya antivirus ya Avast: moja ya huduma tanzu za kampuni ilikusanya na kuuza data kutoka kwa watumiaji milioni 100 hadi 400.

Lakini je, haya yote yana faida yoyote kwetu?

Je, data kubwa inatusaidia sote kwa kiasi gani?

Ndio, kuna upande mkali pia.

Data kubwa husaidia kupata wahalifu na kuzuia mashambulizi ya kigaidi, kupata watoto waliopotea na kuwalinda kutokana na hatari.

Kwa msaada wao, sisi tunapokea matoleo mazuri kutoka kwa benki na punguzo la kibinafsi. Shukrani kwao sisi hatulipii huduma nyingi na mitandao ya kijamii ambayo hupata kwenye matangazo tu. Vinginevyo, Instagram pekee ingetugharimu maelfu ya dola kwa mwezi.

Facebook pekee ina watumiaji bilioni 2,4 wanaofanya kazi. Wakati huo huo, faida yao kwa 2019 ilifikia $ 18,5 bilioni. Inabadilika kuwa kampuni hupata hadi $7,7 kwa mwaka kutoka kwa kila mtumiaji kupitia utangazaji.

Hatimaye, wakati mwingine ni rahisi tu: wakati huduma tayari zinajua wapi ulipo na unataka nini, na huna haja ya kutafuta habari unayohitaji mwenyewe.

Eneo lingine la kuahidi kwa matumizi ya Data Kubwa ni elimu.

Katika moja ya vyuo vikuu vya Marekani huko Virginia, utafiti ulifanyika ili kukusanya data juu ya wanafunzi wa kile kinachoitwa kikundi cha hatari. Hawa ni wale wanaosoma vibaya, wanakosa masomo na wanakaribia kuacha shule. Ukweli ni kwamba katika majimbo kila mwaka karibu watu 400 wanakatwa. Hii ni mbaya kwa vyuo vikuu, ambavyo viwango vyao vimepunguzwa na kupunguzwa kwa ufadhili wao, na kwa wanafunzi wenyewe: wengi huchukua mikopo kwa elimu, ambayo, baada ya kukatwa, bado italazimika kulipwa. Bila kutaja wakati uliopotea na matarajio ya kazi. Kwa msaada wa data kubwa, inawezekana kutambua walio nyuma kwa wakati na kuwapa mwalimu, madarasa ya ziada na usaidizi mwingine unaolengwa.

Hii, kwa njia, pia inafaa kwa shule: basi mfumo utawajulisha walimu na wazazi - wanasema, mtoto ana matatizo, hebu tumsaidie pamoja. Data Kubwa pia itakusaidia kuelewa ni vitabu vipi vya kiada vinavyofanya kazi vizuri zaidi na ni walimu gani wanaelezea nyenzo kwa urahisi zaidi.

Mfano mwingine mzuri ni wasifu wa kazi.: huu ndio wakati vijana wanasaidiwa kuamua juu ya taaluma yao ya baadaye. Hapa, data kubwa inakuwezesha kukusanya taarifa ambazo haziwezi kupatikana kwa kutumia vipimo vya jadi: jinsi mtumiaji anavyofanya, kile anachozingatia, jinsi anavyoingiliana na maudhui.

Huko USA, kuna mpango wa mwongozo wa kazi - SC ACCELERATE. Miongoni mwa mambo mengine, hutumia teknolojia ya GPS ya CareerChoice: wanachanganua data kuhusu asili ya wanafunzi, mielekeo yao kwa masomo, uwezo na udhaifu. Data kisha hutumika kuwasaidia vijana kuchagua vyuo vinavyowafaa.


Jisajili na utufuate kwenye Yandex.Zen - teknolojia, uvumbuzi, uchumi, elimu na kushiriki katika kituo kimoja.

Acha Reply