'बिग डेटा' असंगठित डेटा की बड़ी मात्रा का अध्ययन करके मानव व्यवहार को समझने और भविष्यवाणी करने का नया विज्ञान है। बड़े डेटा को 'भविष्यवाणी विश्लेषिकी' के रूप में भी जाना जाता है।
ट्विटर पोस्ट का विश्लेषण, फेसबुक फीड, ईबे खोज, जीपीएस ट्रैकर्स, और एटीएम मशीन कुछ बड़े डेटा उदाहरण हैं। सुरक्षा वीडियो, यातायात डेटा, मौसम पैटर्न, उड़ान आगमन, सेल फोन टावर लॉग, और हृदय गति ट्रैकर्स का अध्ययन अन्य रूप हैं। बड़ा डेटा एक गन्दा नया विज्ञान है जो साप्ताहिक बदलता है, और केवल कुछ विशेषज्ञ इसे समझते हैं।
नियमित जीवन में बड़े डेटा के कुछ उदाहरण क्या हैं?

हालांकि अधिकांश बड़ी डेटा परियोजनाएं बहुत अस्पष्ट हैं, लेकिन व्यक्तियों, कंपनियों और सरकारों के रोजमर्रा की जिंदगी को प्रभावित करने वाले बड़े डेटा के सफल उदाहरण हैं:
वायरस प्रकोप की भविष्यवाणी: सामाजिक-राजनीतिक डेटा, मौसम और जलवायु डेटा, और अस्पताल / नैदानिक डेटा का अध्ययन करके, ये वैज्ञानिक अब 4 सप्ताह के अग्रिम नोटिस के साथ डेंगू बुखार के प्रकोप की भविष्यवाणी कर रहे हैं।
Homicide घड़ी: वाशिंगटन, डीसी में इस बड़ी डेटा परियोजना प्रोफाइल पीड़ितों, संदिग्धों और अपराधियों की हत्या। मृतकों का सम्मान करने और लोगों के लिए जागरूकता संसाधन के रूप में दोनों, यह बड़ी डेटा परियोजना आकर्षक है।
ट्रांजिट यात्रा योजना, एनवाईसी: डब्ल्यूएनवाईसी रेडियो प्रोग्रामर स्टीव मेलेंडेज़ ने यात्रा कार्यक्रम कार्यक्रम के साथ ऑनलाइन सबवे शेड्यूल को संयुक्त किया। उनकी रचना ने न्यू यॉर्कर्स को मानचित्र पर अपने स्थान पर क्लिक करने दिया, और ट्रेनों और सबवे के लिए यात्रा के समय की भविष्यवाणी दिखाई देगी।
जेरोक्स ने अपने कर्मचारियों के नुकसान को कम किया: कॉल सेंटर का काम भावनात्मक रूप से थकाऊ है। जेरोक्स ने पेशेवर विश्लेषकों की मदद से डेटा के रीम्स का अध्ययन किया है, और अब वे भविष्यवाणी कर सकते हैं कि कौन से कॉल सेंटर किराया कंपनी के साथ सबसे लंबे समय तक रहने की संभावना है।
आतंकवाद का समर्थन करना: सोशल मीडिया, वित्तीय रिकॉर्ड, उड़ान आरक्षण और सुरक्षा डेटा का अध्ययन करके, कानून प्रवर्तन उनके दुष्ट कर्मों से पहले आतंकवादी संदिग्धों की भविष्यवाणी और पता लगा सकता है।
सोशल मीडिया समीक्षाओं के आधार पर ब्रांड मार्केटिंग समायोजित करना: लोग एक पब, रेस्टोरेंट या फिटनेस क्लब पर अपने ऑनलाइन विचारों को चुपचाप और जल्दी से साझा करते हैं। इन लाखों सोशल मीडिया पोस्टों का अध्ययन करना और कंपनी को उनकी सेवाओं के बारे में क्या सोचते हैं, इस पर प्रतिक्रिया देना संभव है।
कौन बड़ा डेटा उपयोग करता है? वे इसके साथ क्या करते हैं?

कई मोनोलिथिक निगम ग्राहक संतुष्टि को अधिकतम करने के लिए अपने प्रसाद और कीमतों को समायोजित करने के लिए बड़े डेटा का उपयोग करते हैं।
- मैसीज डिपार्टमेंट स्टोरउदाहरण के लिए, 70 मिलियन से अधिक उत्पादों के लिए फ्लाई पर अपनी कीमतों को समायोजित करने के लिए बड़े डेटा का उपयोग करता है। मैसी का मानना है कि वे किसमें रुचि रखते हैं, इस आधार पर वे अपने ग्राहकों को अनुकूलित ईमेल भी भेजते हैं।
- बोस्टन मैराथन बम विस्फोट के लिए पुलिस प्रतिक्रिया: वीडियो और निगरानी छवियों का अध्ययन करने के लिए बड़े डेटा का उपयोग करके, पुलिस संदिग्धों के लिए अपनी खोज को जल्दी से कम करने में सक्षम थी।
- मोर्टन स्टीकहाउस एक पोर्टरहाउस स्टेक और झींगा रात के खाने के प्रसिद्ध न्यू जर्सी हवाई अड्डे के वितरण सहित मार्केटिंग स्टंट को खींचने के लिए ट्विटर का उपयोग करता है।
- वीजा धोखाधड़ी करने वालों को पहचानने और पकड़ने के लिए बड़े डेटा का उपयोग करता है।यहां और वहां एकल लेन-देन आसानी से एक बेईमान क्रेडिट कार्ड उपयोगकर्ता को छुपा सकता है, लेकिन लाखों लेनदेन सावधानीपूर्वक देखकर, धोखाधड़ी के पैटर्न का पता लगाया जा सकता है।
- फेसबुक विज्ञापन तैयार करने के लिए बड़े डेटा का उपयोग करता है। सावधानी से अपने एफबी पसंद और ब्राउज़िंग आदतों का अध्ययन करके, सोशल मीडिया जायंट के पास आपके स्वाद में अंतर्दृष्टि है। आपके फेसबुक फीड पर जो साइडबार विज्ञापन आप देखते हैं उन्हें बहुत ही जानबूझकर और जटिल एल्गोरिदम द्वारा चुना जाता है जो आपकी फेसबुक आदतों को देख रहे हैं।
बिग डेटा इतना बड़ा सौदा क्यों है?

4 चीजें बड़े डेटा को महत्वपूर्ण बनाती हैं:
1. डेटा भारी है। यह एक हार्ड ड्राइव पर फिट नहीं होगा, यूएसबी स्टिक बहुत कम है। डेटा की मात्रा मानव मस्तिष्क को समझने से कहीं अधिक है (अरब अरब मेगाबाइट्स के बारे में सोचें, और फिर इसे अधिक अरबों से गुणा करें)।
2. डेटा गन्दा और असंगठित है। बड़े डेटा काम का 50% से 80% जानकारी को परिवर्तित और साफ कर रहा है ताकि खोज योग्य और क्रमबद्ध हो। हमारे ग्रह पर केवल कुछ हज़ार विशेषज्ञ पूरी तरह से जानते हैं कि इस डेटा क्लीनअप को कैसे करें। इन विशेषज्ञों को भी अपने शिल्प के लिए एचपीई और हाडोप जैसे बहुत ही विशेष उपकरणों की आवश्यकता होती है। शायद 10 वर्षों में, बड़े डेटा विशेषज्ञ एक दर्जन दर्जन बन जाएंगे, लेकिन अभी के लिए, वे विश्लेषक की एक दुर्लभ प्रजातियां हैं और उनका काम अभी भी बहुत अस्पष्ट और थकाऊ है।
3. डेटा एक वस्तु बन गया है ** जिसे बेचा और खरीदा जा सकता है। डेटा मार्केटप्लेस मौजूद हैं जहां कंपनियां और व्यक्ति सोशल मीडिया और अन्य डेटा के टेराबाइट खरीद सकते हैं। अधिकांश डेटा क्लाउड-आधारित है, क्योंकि यह किसी भी हार्ड डिस्क पर फ़िट होने के लिए बहुत बड़ा है। डेटा ख़रीदना आमतौर पर एक सदस्यता शुल्क शामिल होता है जहां आप क्लाउड सर्वर फार्म में प्लग करते हैं।
** बड़े डेटा टूल्स और विचारों के नेता अमेज़ॅन, Google, फेसबुक और याहू हैं। चूंकि ये कंपनियां अपनी ऑनलाइन सेवाओं के साथ लाखों लोगों की सेवा करती हैं, इसलिए यह समझ में आता है कि वे बड़े डेटा एनालिटिक्स के पीछे संग्रह बिंदु और दूरदर्शी होंगे।4. बड़े डेटा की संभावनाएं अनंत हैं। शायद डॉक्टर एक दिन होने से पहले सप्ताह के हफ्तों के लिए दिल के दौरे और स्ट्रोक की भविष्यवाणी करेंगे। हवाई जहाज और ऑटोमोबाइल दुर्घटनाओं को उनके यांत्रिक डेटा और यातायात और मौसम पैटर्न के अनुमानित विश्लेषण से कम किया जा सकता है। आपके लिए अनुकूल संगत व्यक्तियों के बड़े डेटा भविष्यवाणियों के साथ ऑनलाइन डेटिंग में सुधार किया जा सकता है। संगीतकारों को अंतर्दृष्टि मिल सकती है कि कौन सा संगीत रचना लक्षित दर्शकों के बदलते स्वाद के लिए सबसे ज्यादा प्रसन्न है।पोषण विशेषज्ञ भविष्यवाणी कर सकते हैं कि स्टोर से खरीदे गए खाद्य पदार्थों का कौन सा संयोजन बढ़ जाएगा या किसी व्यक्ति की चिकित्सा स्थितियों में मदद करेगा। सतह केवल खरोंच की गई है, और हर सप्ताह बड़े डेटा में खोज होती है।
बड़ा डेटा गन्दा है

बड़ा डेटा भविष्यवाणी विश्लेषिकी है: बड़े पैमाने पर असंगठित डेटा को कुछ खोजने योग्य और क्रमबद्ध करने में परिवर्तित करना। यह एक गन्दा और अराजक जगह है जिसके लिए एक विशेष प्रकार का ज्ञान और धैर्य की आवश्यकता होती है।
उदाहरण के लिए मोनोलिथिक यूपीएस वितरण सेवा लें। यूपीएस अध्ययन प्रोग्रामर अपने ड्राइवरों के जीपीएस और स्मार्टफोन से डेटा यातायात भीड़ को अनुकूलित करने के सबसे प्रभावी तरीकों का विश्लेषण करने के लिए अध्ययन करते हैं। यह जीपीएस और स्मार्टफोन डेटा gargantuan है, और विश्लेषण के लिए स्वचालित रूप से तैयार नहीं है। यह डेटा विभिन्न स्मार्टफोन हार्डवेयर उपकरणों के माध्यम से विभिन्न जीपीएस और मैप डेटाबेस से डाला जाता है। यूपीएस विश्लेषकों ने उन सभी डेटा को उस प्रारूप में परिवर्तित करने में महीनों बिताए हैं जिन्हें आसानी से खोजा जा सकता है और सॉर्ट किया जा सकता है। हालांकि, प्रयास इसके लायक है। आज, यूपीएस ने 8 मिलियन गैलन ईंधन बचाया है क्योंकि उन्होंने इन बड़े डेटा एनालिटिक्स का उपयोग करना शुरू कर दिया है।
चूंकि बड़ा डेटा गन्दा है और उपयोग के लिए सफाई और तैयार करने के लिए बहुत अधिक प्रयास की आवश्यकता है, इसलिए डेटा वैज्ञानिक अपने द्वारा किए गए सभी कठिन कार्यों के लिए 'डेटा जेनिटर' उपनाम बन गए हैं।
हालांकि, बड़े डेटा और भविष्यवाणी विश्लेषिकी का विज्ञान हर हफ्ते में सुधार कर रहा है। वर्ष 2025 तक बड़े डेटा को आसानी से सुलभ होने की उम्मीद करें।
क्या बिग डेटा गोपनीयता के लिए एक घुसपैठ की धमकी नहीं है?

हां, यदि हमारे कानून और व्यक्तिगत गोपनीयता सुरक्षा सावधानी से प्रबंधित नहीं की जाती हैं, तो बड़ा डेटा व्यक्तिगत गोपनीयता में घुसपैठ करता है। जैसा कि यह खड़ा है, Google और यूट्यूब और फेसबुक पहले से ही आपकी दैनिक ऑनलाइन आदतों को ट्रैक करते हैं। आपका स्मार्टफोन और कंप्यूटिंग लाइफ हर दिन डिजिटल पैरों के निशान छोड़ देता है, और परिष्कृत कंपनियां उन पैरों के निशान का अध्ययन कर रही हैं।
बड़े डेटा के आसपास के कानून विकसित हो रहे हैं। गोपनीयता यह है कि अब आप व्यक्तिगत ज़िम्मेदारी लेना चाहते हैं, क्योंकि अब आप इसे डिफ़ॉल्ट अधिकार के रूप में उम्मीद नहीं कर सकते हैं।
अपनी गोपनीयता की रक्षा के लिए आप क्या कर सकते हैं:
एक सबसे बड़ा एकल कदम जो आप ले सकते हैं वह है कि वीपीएन नेटवर्क कनेक्शन का उपयोग करके अपनी दैनिक आदतों को झुकाएं। एक वीपीएन सेवा आपके सिग्नल को धक्का देगी ताकि आपकी पहचान और स्थान कम से कम आंशिक रूप से ट्रैकर्स से मुखौटा हो। इससे आपको 100% गुमनाम नहीं मिलेगा, लेकिन एक वीपीएन काफी हद तक कम करेगा कि दुनिया आपकी ऑनलाइन आदतों को कितनी देख सकती है।
बिग डेटा के बारे में मैं और कहां जान सकता हूं?

बिग डेटा विश्लेषणात्मक दिमाग वाले लोगों और तकनीक के लिए प्यार के लिए एक आकर्षक बात है। यदि यह आप हैं, तो निश्चित रूप से दिलचस्प बड़ी डेटा परियोजनाओं के इस पृष्ठ पर जाएं।




