'बिग डेटा' क्या है?

और यह एक बड़ा सौदा क्यों है?

'बिग डेटा' असंगठित डेटा की बड़ी मात्रा का अध्ययन करके मानव व्यवहार को समझने और भविष्यवाणी करने का नया विज्ञान है। बड़े डेटा को 'भविष्यवाणी विश्लेषिकी' के रूप में भी जाना जाता है।

ट्विटर पोस्ट का विश्लेषण, फेसबुक फीड, ईबे खोज, जीपीएस ट्रैकर्स, और एटीएम मशीन कुछ बड़े डेटा उदाहरण हैं। सुरक्षा वीडियो, यातायात डेटा, मौसम पैटर्न, उड़ान आगमन, सेल फोन टावर लॉग, और हृदय गति ट्रैकर्स का अध्ययन अन्य रूप हैं। बड़ा डेटा एक गन्दा नया विज्ञान है जो साप्ताहिक बदलता है, और केवल कुछ विशेषज्ञ इसे समझते हैं।

नियमित जीवन में बड़े डेटा के कुछ उदाहरण क्या हैं?

स्क्रीनशॉट http://project.wnyc.org/transit-time

हालांकि अधिकांश बड़ी डेटा परियोजनाएं बहुत अस्पष्ट हैं, लेकिन व्यक्तियों, कंपनियों और सरकारों के रोजमर्रा की जिंदगी को प्रभावित करने वाले बड़े डेटा के सफल उदाहरण हैं:

वायरस प्रकोप की भविष्यवाणी: सामाजिक-राजनीतिक डेटा, मौसम और जलवायु डेटा, और अस्पताल / नैदानिक ​​डेटा का अध्ययन करके, ये वैज्ञानिक अब 4 सप्ताह के अग्रिम नोटिस के साथ डेंगू बुखार के प्रकोप की भविष्यवाणी कर रहे हैं।

होमिसाइड वॉच: वाशिंगटन, डीसी में इस बड़ी डेटा परियोजना प्रोफाइल पीड़ितों, संदिग्धों और अपराधियों की हत्या। मृतकों का सम्मान करने और लोगों के लिए जागरूकता संसाधन के रूप में दोनों, यह बड़ी डेटा परियोजना आकर्षक है।

ट्रांजिट ट्रैवल प्लानिंग, एनवाईसी: डब्ल्यूएनवाईसी रेडियो प्रोग्रामर स्टीव मेलेंडेज़ ने यात्रा कार्यक्रम कार्यक्रम के साथ ऑनलाइन सबवे शेड्यूल को संयुक्त किया। उनकी रचना ने न्यू यॉर्कर्स को मानचित्र पर अपने स्थान पर क्लिक करने दिया, और ट्रेनों और सबवे के लिए यात्रा के समय की भविष्यवाणी दिखाई देगी।

जेरोक्स ने अपने कर्मचारियों के नुकसान को कम कर दिया: कॉल सेंटर का काम भावनात्मक रूप से थकाऊ है। जेरोक्स ने पेशेवर विश्लेषकों की मदद से डेटा के रीम्स का अध्ययन किया है, और अब वे भविष्यवाणी कर सकते हैं कि कौन से कॉल सेंटर किराया कंपनी के साथ सबसे लंबे समय तक रहने की संभावना है।

आतंकवाद का समर्थन: सोशल मीडिया, वित्तीय रिकॉर्ड, उड़ान आरक्षण और सुरक्षा डेटा का अध्ययन करके, कानून प्रवर्तन उनके दुष्ट कर्मों से पहले आतंकवादी संदिग्धों की भविष्यवाणी और पता लगा सकता है।

सोशल मीडिया समीक्षाओं के आधार पर ब्रांड मार्केटिंग को समायोजित करना : लोगों को पब, रेस्तरां या फिटनेस क्लब पर अपने ऑनलाइन विचारों को स्पष्ट रूप से और जल्दी से साझा करना। इन लाखों सोशल मीडिया पोस्टों का अध्ययन करना और कंपनी को उनकी सेवाओं के बारे में क्या सोचते हैं, इस पर प्रतिक्रिया देना संभव है।

कौन बड़ा डेटा उपयोग करता है? वे इसके साथ क्या करते हैं?

कई मोनोलिथिक निगम ग्राहक संतुष्टि को अधिकतम करने के लिए अपने प्रसाद और कीमतों को समायोजित करने के लिए बड़े डेटा का उपयोग करते हैं।

बिग डेटा इतना बड़ा सौदा क्यों है?

4 चीजें बड़े डेटा को महत्वपूर्ण बनाती हैं:

1. डेटा भारी है। यह एक हार्ड ड्राइव पर फिट नहीं होगा, यूएसबी स्टिक बहुत कम है। डेटा की मात्रा मानव मस्तिष्क को समझने से कहीं अधिक है (अरब अरब मेगाबाइट्स के बारे में सोचें, और फिर इसे अधिक अरबों से गुणा करें)।

2. डेटा गन्दा और असंगठित है। बड़े डेटा काम का 50% से 80% जानकारी को परिवर्तित और साफ कर रहा है ताकि खोज योग्य और क्रमबद्ध हो। हमारे ग्रह पर केवल कुछ हज़ार विशेषज्ञ पूरी तरह से जानते हैं कि इस डेटा क्लीनअप को कैसे करें। इन विशेषज्ञों को भी अपने शिल्प के लिए एचपीई और हाडोप जैसे बहुत ही विशेष उपकरणों की आवश्यकता होती है। शायद 10 वर्षों में, बड़े डेटा विशेषज्ञ एक दर्जन दर्जन बन जाएंगे, लेकिन अभी के लिए, वे विश्लेषक की एक दुर्लभ प्रजातियां हैं और उनका काम अभी भी बहुत अस्पष्ट और थकाऊ है।

3. डेटा एक वस्तु बन गया है ** जिसे बेचा और खरीदा जा सकता है। डेटा मार्केटप्लेस मौजूद हैं जहां कंपनियां और व्यक्ति सोशल मीडिया और अन्य डेटा के टेराबाइट खरीद सकते हैं। अधिकांश डेटा क्लाउड-आधारित है, क्योंकि यह किसी भी हार्ड डिस्क पर फ़िट होने के लिए बहुत बड़ा है। डेटा ख़रीदना आमतौर पर एक सदस्यता शुल्क शामिल होता है जहां आप क्लाउड सर्वर फार्म में प्लग करते हैं।

** बड़े डेटा टूल्स और विचारों के नेता अमेज़ॅन, Google, फेसबुक और याहू हैं। चूंकि ये कंपनियां अपनी ऑनलाइन सेवाओं के साथ लाखों लोगों की सेवा करती हैं, इसलिए यह समझ में आता है कि वे बड़े डेटा एनालिटिक्स के पीछे संग्रह बिंदु और दूरदर्शी होंगे।

4. बड़े डेटा की संभावनाएं अनंत हैं। शायद डॉक्टर एक दिन होने से पहले सप्ताह के हफ्तों के लिए दिल के दौरे और स्ट्रोक की भविष्यवाणी करेंगे। हवाई जहाज और ऑटोमोबाइल दुर्घटनाओं को उनके यांत्रिक डेटा और यातायात और मौसम पैटर्न के अनुमानित विश्लेषण से कम किया जा सकता है। आपके लिए अनुकूल संगत व्यक्तियों के बड़े डेटा भविष्यवाणियों के साथ ऑनलाइन डेटिंग में सुधार किया जा सकता है। संगीतकारों को अंतर्दृष्टि मिल सकती है कि कौन सा संगीत रचना लक्षित दर्शकों के बदलते स्वाद के लिए सबसे ज्यादा प्रसन्न है। पोषण विशेषज्ञ भविष्यवाणी कर सकते हैं कि स्टोर से खरीदे गए खाद्य पदार्थों का कौन सा संयोजन बढ़ जाएगा या किसी व्यक्ति की चिकित्सा स्थितियों में मदद करेगा। सतह केवल खरोंच की गई है, और हर सप्ताह बड़े डेटा में खोज होती है।

बड़ा डेटा गन्दा है

मॉन्टी राकुसेन / गेट्टी

बड़ा डेटा भविष्यवाणी विश्लेषिकी है: बड़े पैमाने पर असंगठित डेटा को कुछ खोजने योग्य और क्रमबद्ध करने में परिवर्तित करना। यह एक गन्दा और अराजक जगह है जिसके लिए एक विशेष प्रकार का ज्ञान और धैर्य की आवश्यकता होती है।

उदाहरण के लिए मोनोलिथिक यूपीएस वितरण सेवा लें। यूपीएस अध्ययन प्रोग्रामर अपने ड्राइवरों के जीपीएस और स्मार्टफोन से डेटा यातायात भीड़ को अनुकूलित करने के सबसे प्रभावी तरीकों का विश्लेषण करने के लिए अध्ययन करते हैं। यह जीपीएस और स्मार्टफोन डेटा gargantuan है, और विश्लेषण के लिए स्वचालित रूप से तैयार नहीं है। यह डेटा विभिन्न स्मार्टफोन हार्डवेयर उपकरणों के माध्यम से विभिन्न जीपीएस और मैप डेटाबेस से डाला जाता है। यूपीएस विश्लेषकों ने उन सभी डेटा को उस प्रारूप में परिवर्तित करने में महीनों बिताए हैं जिन्हें आसानी से खोजा जा सकता है और सॉर्ट किया जा सकता है। हालांकि, प्रयास इसके लायक है। आज, यूपीएस ने 8 मिलियन गैलन ईंधन बचाया है क्योंकि उन्होंने इन बड़े डेटा एनालिटिक्स का उपयोग करना शुरू कर दिया है।

चूंकि बड़ा डेटा गन्दा है और उपयोग के लिए सफाई और तैयार करने के लिए बहुत अधिक प्रयास की आवश्यकता है, इसलिए डेटा वैज्ञानिक अपने द्वारा किए गए सभी कठिन कार्यों के लिए 'डेटा जेनिटर' उपनाम बन गए हैं।

हालांकि, बड़े डेटा और भविष्यवाणी विश्लेषिकी का विज्ञान हर हफ्ते में सुधार कर रहा है। वर्ष 2025 तक बड़े डेटा को आसानी से सुलभ होने की उम्मीद करें।

क्या बिग डेटा गोपनीयता के लिए एक घुसपैठ की धमकी नहीं है?

Feingersh / गेट्टी

हां, यदि हमारे कानून और व्यक्तिगत गोपनीयता सुरक्षा सावधानी से प्रबंधित नहीं की जाती हैं, तो बड़ा डेटा व्यक्तिगत गोपनीयता में घुसपैठ करता है। जैसा कि यह खड़ा है, Google और यूट्यूब और फेसबुक पहले से ही आपकी दैनिक ऑनलाइन आदतों को ट्रैक करते हैं । आपका स्मार्टफोन और कंप्यूटिंग लाइफ हर दिन डिजिटल पैरों के निशान छोड़ देता है, और परिष्कृत कंपनियां उन पैरों के निशान का अध्ययन कर रही हैं।

बड़े डेटा के आसपास के कानून विकसित हो रहे हैं। गोपनीयता यह है कि अब आप व्यक्तिगत ज़िम्मेदारी लेना चाहते हैं, क्योंकि अब आप इसे डिफ़ॉल्ट अधिकार के रूप में उम्मीद नहीं कर सकते हैं।

अपनी गोपनीयता की रक्षा के लिए आप क्या कर सकते हैं:

एक सबसे बड़ा एकल कदम जो आप ले सकते हैं वह है कि वीपीएन नेटवर्क कनेक्शन का उपयोग करके अपनी दैनिक आदतों को झुकाएं । एक वीपीएन सेवा आपके सिग्नल को धक्का देगी ताकि आपकी पहचान और स्थान कम से कम आंशिक रूप से ट्रैकर्स से मुखौटा हो। इससे आपको 100% गुमनाम नहीं मिलेगा, लेकिन एक वीपीएन काफी हद तक कम करेगा कि दुनिया आपकी ऑनलाइन आदतों को कितनी देख सकती है।

बिग डेटा के बारे में मैं और कहां जान सकता हूं?

मोंटी रस्कुसेन / गेट्टी

बिग डेटा विश्लेषणात्मक दिमाग वाले लोगों और तकनीक के लिए प्यार के लिए एक आकर्षक बात है। यदि यह आप हैं, तो निश्चित रूप से दिलचस्प बड़ी डेटा परियोजनाओं के इस पृष्ठ पर जाएं।