डेटा प्रबंधन बनाम डेटा साइंस

“नमस्ते, चिचि। आपसे मिलकर खुशी हुई। तो तुम क्या करते हो?"

मेरी सबसे अच्छी मुस्कान के साथ "मैं एक डेटा मैनेजर हूं।"

एक उलझन भरी मुस्कान के साथ "एर्म्म ... इसका क्या मतलब है?"

**********************

चूंकि डेटा बहुत लोकप्रिय हो गया, इसलिए मैं शर्त लगा सकता हूं (भले ही मैं जुआ नहीं कर रहा हूं) जो आपने डेटा साइंटिस्ट की भूमिका के बारे में सुना होगा। यदि आप यह नहीं समझ पा रहे हैं कि यह क्या है, तो कुछ प्रमुख डेटा व्यवसायों पर मेरी पोस्ट देखें। दूसरी ओर, डेटा प्रबंधक की भूमिका दुर्लभ है। तो वास्तव में यह क्या है?

एक व्यापक अर्थ में, प्रबंधन कुछ लक्ष्य (ओं) को प्राप्त करने के लिए लोगों और / या गतिविधियों का समन्वय है। इसी तरह, डेटा प्रबंधन है

"कुछ निर्धारित लक्ष्यों को प्राप्त करने के लिए लोगों, प्रक्रियाओं और डेटा प्रवाह का समन्वय होता है-जिसमें डेटा से मूल्य प्राप्त करने में परिणाम शामिल होना चाहिए या होना चाहिए।"

उस परिभाषा पर एक सरसरी नज़र डेटा प्रबंधन के रूप में डेटा प्रबंधन की एक तस्वीर पेंट कर सकती है। सच तो यह है, डेटा मैनेजमेंट बहुत सारा डेटा गवर्नेंस है, लेकिन बहुत कुछ। डेटा मैनेजमेंट बॉडी ऑफ नॉलेज डेटा प्रबंधन को परिभाषित करता है

"योजनाओं, नीतियों, कार्यक्रमों, और प्रथाओं का विकास, निष्पादन और पर्यवेक्षण, वितरित करने, नियंत्रण, सुरक्षा और उनके जीवन चक्र में डेटा और सूचना परिसंपत्तियों के मूल्य को बढ़ाने के लिए।"

डेटा प्रबंधन गतिविधियाँ तकनीकी से लेकर डेटा इंजीनियरिंग से लेकर गैर-तकनीकी जैसे डेटा गवर्नेंस तक होती हैं। ज्ञान का डेटा प्रबंधन निकाय कवर करने वाले 11 ज्ञान क्षेत्रों को निर्दिष्ट करता है:

  • वास्तुकला और मॉडलिंग
  • भंडारण और संचालन
  • सुरक्षा
  • मास्टर डेटा, संदर्भ डेटा, दस्तावेज़, सामग्री और मेटाडेटा प्रबंधन
  • एकीकरण और अंतर
  • वेयरहाउसिंग और बिजनेस इंटेलिजेंस
  • गुणवत्ता
  • शासन

तो, "डेटा साइंस कहाँ है?", आप पूछ सकते हैं। (यदि आप कुछ हास्य को ध्यान में रखते हैं, तो यह शरीर के ज्ञान के दूसरे संस्करण के अध्याय 14 में है।)

डेटा साइंस बिग डेटा का विश्लेषण और दृश्य है। यह एक विशिष्ट तकनीकी भूमिका है जो कई डेटा प्रबंधन ज्ञान क्षेत्रों के आवेदन पर बनाता है।

चलो थोड़ा और अधिक व्यावहारिक है

एक डेटा साइंटिस्ट मुख्य रूप से एक विशेष बड़े डेटासेट के साथ क्या संभव है, यह देखने के लिए चिंतित है। डेटा वैज्ञानिक को उन प्रश्नों के लिए अंतर्दृष्टि और उत्तर खोजने की आवश्यकता है जो पूर्व-निर्धारित नहीं थे (विश्लेषक के विपरीत जो खोज करते हैं कि डेटा के साथ कुछ ज्ञात व्यावसायिक प्रश्नों का उत्तर कैसे दिया जाए)। इस बीच, डेटा प्रबंधक पूरे उद्यम / विभाग / डोमेन डेटा से संबंधित है, न केवल एक विशिष्ट डेटासेट। प्रबंधक अपने संपूर्ण जीवनचक्र के माध्यम से डेटा की अखंडता को बनाए रखने से संबंधित है और यह सुनिश्चित करता है कि इसे उन लोगों द्वारा कुशलता से एक्सेस किया जा सकता है जिन्हें इसका उपयोग करने की आवश्यकता है। इस डेटा भूमिका के लिए व्यावसायिक लक्ष्यों की तीव्र जागरूकता की आवश्यकता होती है, साथ ही तकनीकी पक्ष पर क्या किया जाना चाहिए।

और अब, थोड़ा और अधिक यथार्थवादी होने दो!

डेटा पेशेवरों की दुविधा यह है कि भूमिकाओं के बीच की रेखाएं अधिक धुंधली हो रही हैं, फिर भी विशिष्ट क्षेत्रों में गहराई की आवश्यकता एक साथ मांग पर है। यदि आप अधिक मूल्यवान डेटा प्रबंधक बनना चाहते हैं, तो आपके पास डेटा विज्ञान में एक बुनियादी स्तर से अधिक विशेषज्ञता होनी चाहिए। इसी तरह, एक आगे की सोच रखने वाले डेटा साइंटिस्ट को केवल सांख्यिकीय और एल्गोरिदम में गर्व नहीं करना चाहिए, बल्कि डेटा को एक चक्र के माध्यम से जाने वाली एक जीवित इकाई के रूप में सोचना चाहिए, और इसे प्रबंधित करने की आवश्यकता है।

********************

तो मैं क्या करूं?

मैं रणनीतियों, नीतियों, प्रक्रियाओं और परियोजनाओं को विकसित करने, निष्पादित करने और पर्यवेक्षण करने में संगठनों को प्राप्त करने में मदद करता हूं, जो डेटा प्राप्त करते हैं, बढ़ाते हैं और इसका उपयोग करते हैं, और इसे भविष्य में आसान पहुंच प्रदान करते हैं। यदि डेटा बड़ा होता है और मशीन लर्निंग की आवश्यकता होती है, तो मैं मॉडल को प्रशिक्षित करने में संकोच नहीं करता!