यथाप्राप्त आंकड़े
यथाप्राप्त आंकड़े, जिसे प्रायः स्रोत या प्राथमिक आंकड़े के रूप में संदर्भित किया जाता है, वह आंकड़े हैं जिसे अभी तक संसाधित, कोडित, स्वरूपित या विश्लेषण नहीं किया गया है। जबकि यथाप्राप्त आंकड़े एक मूल्यवान संसाधन है, इसके साथ काम करना या समझना चुनौतीपूर्ण हो सकता है क्योंकि यह दृष्टिगत रूप से अव्यवस्थित है और इसमें सामंजस्य की कमी हो सकती है। संगठन ग्राहकों, बिक्री, विपणन अभियानों की सफलता और अन्य उपयोगी लक्ष्यों के बारे में अधिक जानने के लिए यथाप्राप्त आंकड़े को एकत्र और उपयोग कर सकते हैं, लेकिन पहले उन्हें आंकड़ों को ऐसे रूप में संरचना और व्यवस्थित करने की आवश्यकता है जो पढ़ने और कल्पना करने में सुविधा हो।
जो उद्यम विश्लेषण, निर्णय लेने या रिपोर्टिंग के लिए सक्रिय रूप से आंकड़ों का उपयोग करते हैं, उन्हें यह समझना चाहिए कि यथाप्राप्त आंकड़े कैसे काम करता है और यह एक बड़ी यथाप्राप्त युक्ति में कैसे सही स्थिति में रखता है।
यथाप्राप्त आंकड़े का उपयोग कैसे किया जाता है?
यथाप्राप्त आंकड़े, एक या एकाधिक स्रोतों से एकत्र किए गए आंकड़े है जो अपनी अपरिवर्तित प्रारंभिक स्थिति में रहता है। इस बिंदु पर, आंकड़े में मानवीय, मशीन या वाद्य त्रुटियाँ हो सकती हैं - संग्रह विधि के आधार पर - या इसमें सत्यापन की कमी हो सकती है। एक बार जब आंकड़े की गुणवत्ता में सुधार के लिए किसी भी तरह से बदलाव किया जाता है, तो आंकड़े संसाधित हो जाते हैं और अब उसे यथाप्राप्त नहीं माना जाता है। एक संसाधन के रूप में यथाप्राप्त आंकड़े में असीमित क्षमता होती है, क्योंकि यह विभिन्न स्रोतों से विभिन्न रूपों में आता है। किसी जनसांख्यिकीय, प्रणाली, अवधारणा या पर्यावरण की अधिक गहन समझ प्राप्त करने की दिशा में यथाप्राप्त आंकड़े एकत्र करना पहला कदम है। बिजनेस इंटेलिजेंस विश्लेषक यथाप्राप्त आंकड़े से अपने व्यवसाय की स्थिति के बारे में उपयोगी और सटीक जानकारी निकाल सकते हैं - उदाहरण के लिए, दर्शकों की रुचि, बिक्री के आंकड़े, विपणन अभियान प्रदर्शन और यथाप्राप्त आंकड़े उत्पादकता।
यथाप्राप्त आंकड़ों का संग्रहण
यथाप्राप्त आंकड़े कैसे एकत्र किया जाता है यह इसकी गुणवत्ता और भविष्य की संभावनाओं में महत्वपूर्ण भूमिका निभाता है। सटीकता, विश्वसनीयता और वैधता का मतलब यथाप्राप्त आंकड़े के आँकड़ासंचय(डेटाबेस) के बीच अंतर हो सकता है जो जानकारी और अंतर्दृष्टि का खजाना है, और अप्राप्य आंकड़े जो बस जगह लेते हैं। निम्नलिखित चरण आंकड़ों के संग्रहण के लिए एक पथ तैयार करते हैं ताकि यह सुनिश्चित हो सके कि यह संगठन की आवश्यकताओं को पूरा करता है।
लक्ष्य परिभाषित करना
उस जानकारी को परिभाषित करें जिसे आप अपने यथाप्राप्त आंकड़े -एकत्रित लक्ष्यों के लिए आधार बनाने के लिए निकालना चाहते हैं। उदाहरण के लिए, यदि वांछित आंकड़े उपयोगकर्ता-आधार और ग्राहक जानकारी है, तो इसे एकत्रित करने के लिए एक विशिष्ट आयु और भौगोलिक जनसांख्यिकीय पर केंद्रित ऑनलाइन और व्यक्तिगत सर्वेक्षण का उपयोग किया जा सकता है।
अन्य प्रकार के यथाप्राप्त आंकड़े के लिए अग्रिम योजना की आवश्यकता हो सकती है। उदाहरण के लिए, लॉग रिकॉर्ड से आंकड़े एकत्र करने के लिए कुछ हफ्तों से लेकर एक साल तक के लिए एक निगरानी प्रणाली की आवश्यकता होगी ताकि आंकड़े एकत्र करने में सक्षम होने से पहले उसे एकत्र किया जा सके।
संग्रहण विधि का चयन
उचित यथाप्राप्त आंकड़े संग्रहण विधि चुनने से मानव या मशीन की त्रुटियों का प्रतिशत कम हो सकता है, जिन्हें आपको यथाप्राप्त डेटाबेस को साफ करते समय साफ़ करना होगा। साधारणतः, इलेक्ट्रॉनिक संग्रहण विधियों के परिणामस्वरूप त्रुटि दर कम होती है - मैन्युअल संग्रहण ऐसे चर प्रस्तुत कर सकता है जो व्याख्या के लिए जगह छोड़ते हैं, जैसे कि ऑडियो या वीडियो रिकॉर्डिंग में अस्पष्ट लिखावट या समझने में कठिन उच्चारण।
आँकड़े एकत्रित करना
यथाप्राप्त आंकड़े साधारणतः मात्रा में बड़ा और अत्यधिक जटिल होता है। संग्रहण प्रक्रिया के दौरान, आंकड़ों की कुल मात्रा मात्र एक अनुमान है - एक बार जब आप आंकड़े को त्रुटियों और अमान्य आंकड़े बिंदुओं से साफ़ करके संसाधित करते हैं, तो आपको दायरे की अधिक सटीक समझ होगी।
5 चरणों में यथाप्राप्त आंकड़ों को कैसे संसाधित किया जाता है
आँकड़े प्रवृत्तियों और पैटर्न में पारंगत विश्लेषक आधुनिक बिजनेस इंटेलिजेंस उपकरणों के साथ काम करते हैं और कभी-कभी, निम्नलिखित चरणों का उपयोग करके यथाप्राप्त आंकड़े को व्यावहारिक ज्ञान में बदलने के लिए कृत्रिम बुद्धिमत्ता (AI) अनुप्रयोगों को उपस्थित करते हैं:
1. आंकड़ों की तैयारी युक्ति
परिभाषा के अनुसार, यथाप्राप्त आंकड़े दोषपूर्ण होते हैं और इसमें त्रुटियाँ हो सकती हैं - इसमें संरचना और प्रारूप में भी स्थिरता की कमी हो सकती है, विशेषतः जब इसे विभिन्न स्रोतों से प्राप्त किया गया हो। आंकड़े तैयार करने के दौरान, उच्च-गुणवत्ता, सुसंगत परिणाम सुनिश्चित करने के लिए पूर्वनिर्धारित मानकों का पालन करते हुए आंकड़ों को पूरी तरह से साफ, क्रमबद्ध और फ़िल्टर किया जाता है।
2. आंकड़ों का निदेश
आंकड़ों का निदेश करना - जिसे कभी-कभी आंकड़ों का अनुवाद भी कहा जाता है - में यथाप्राप्त आंकड़े को मशीन-पठनीय रूप में परिवर्तित करना उपस्थित है। विश्लेषण के लिए उपयोग किए जाने वाले उपकरणों और सॉफ़्टवेयर के आधार पर विशिष्ट प्रक्रिया अलग-अलग होगी।
डिजिटल रूप से एकत्रित आंकड़े के स्थिति में, यह चरण न्यूनतम है—फ़ाइल प्रारूप में कुछ संरचना और परिवर्तन की आवश्यकता हो सकती है। लेकिन हस्तलिखित सर्वेक्षणों, ऑडियो रिकॉर्डिंग और वीडियो क्लिप के लिए, आंकड़े को मैन्युअल रूप से या डिजिटल रूप से ऐसे रूप में निकालने की आवश्यकता होगी जिसे प्रोसेसिंग सॉफ़्टवेयर समझने में सक्षम हो।
3. आंकड़ों का संसाधन और विश्लेषण
यथाप्राप्त आंकड़े को विभिन्न तत्वों के बीच रुझानों, पैटर्न, विसंगतियों और संबंधों की खोज करके अंतर्दृष्टि के लिए संसाधित और विश्लेषित किया जाता है। यह प्रक्रिया स्रोत के आधार पर भिन्न होती है, और इसे मैन्युअल रूप से या कृत्रिम बुद्धिमत्ता और मशीन लर्निंग का उपयोग करके किया जा सकता है।
4. आंकड़ों का निर्गम
एक बार जब यथाप्राप्त आंकड़े पूरी तरह से उपयोगी और व्यावहारिक आंकड़ों में बदल जाते हैं, तो इसे मानव-अनुकूल रूप में अनुवादित किया जाता है - उदाहरण के लिए आरेख, ग्राफ़, टेबल, वेक्टर फ़ाइलें या सादा पाठ। यह चरण आंकड़े को प्रयोग करने योग्य और कार्रवाई योग्य बनाता है।
5. आंकड़ों का भंडारण
आंकड़ों का भंडारण आवश्यक है, क्योंकि संसाधित आंकड़े को अतिरिक्त अंतर्दृष्टि के लिए भविष्य में विश्लेषण के अधीन किया जा सकता है - लेकिन संवेदनशील कॉर्पोरेट जानकारी या उपयोगकर्ता आंकड़े के साथ काम करते समय यह और भी महत्वपूर्ण हो जाता है। संग्रहण गुणवत्ता कंपनी के आंकड़े और जानकारी के यथाप्राप्त मानकों के अनुरूप होनी चाहिए, साथ ही किसी भी स्थानीय आंकड़े गोपनीयता और सुरक्षा कानून, जैसे कि यूरोपीय संघ के सामान्य आंकड़े सुरक्षा विनियमन (GDPR) और कैलिफ़ोर्निया उपभोक्ता संरक्षण अधिनियम (CCPA) का अनुपालन भी करना चाहिए।
दो प्रकार के यथाप्राप्त आंकड़े और उनके उदाहरण
यथाप्राप्त आंकड़ों में आंकड़े के कई प्रकार उपस्थित होते हैं, जिन्हें प्रायः गुणात्मक या मात्रात्मक के रूप में वर्गीकृत किया जाता है। इस वर्गीकरण के लिए सबसे महत्वपूर्ण शर्त यह है कि आंकड़े को किसी भी तरह से साफ या संसाधित नहीं किया जाता है। यथाप्राप्त आंकड़े डेटाबेस से एकत्रित जानकारी पर बेजोड़ लचीलापन और नियंत्रण की अनुमति देता है।
मात्रात्मक यथाप्राप्त आंकड़े
मात्रात्मक आंकड़े, यथाप्राप्त आंकड़े होते हैं जिसमें गणनीय आंकड़े होते हैं, जहाँ प्रत्येक आंकड़े बिंदु का एक अद्वितीय संख्यात्मक मान होता है। इस प्रकार के आंकड़ों का उपयोग गणितीय गणनाओं और तकनीकी सांख्यिकीय विश्लेषण के लिए सबसे अच्छा किया जाता है। यहाँ कुछ सामान्य उदाहरण दिए गए हैं:
ग्राहक जानकारी | अन्य आंकड़ों के साथ संयुक्त करने पर लक्षित परिणाम और जनसांख्यिकीय अंतर्दृष्टि सक्षम होती है। |
विक्रय अभिलेख | वस्तुओं और सेवाओं की बिक्री की संख्या और आवृत्ति पर मात्रात्मक आंकड़े। लोकप्रिय उत्पादों और अनुकूलतम बिक्री समय की पहचान करता है। ग्राहक जानकारी के साथ संयोजन में, ग्राहक जनसांख्यिकी और प्राथमिकताओं में अंतर्दृष्टि प्रदान की जाती है। |
कर्मचारी कार्य निष्पादन | कार्य के घंटे, उत्पादकता, गुणवत्ता और पारिश्रमिक पर मात्रात्मक आंकड़े। सर्वेक्षण या आंतरिक निगरानी सॉफ़्टवेयर के माध्यम से एकत्र किया गया। कर्मचारियों के निवेश पर प्रतिफल की गणना करने में सहायता करता है। |
राजस्व एवं व्यय | राजस्व और व्यय सहित वित्तीय गतिविधि पर नज़र रखने वाला सख्त मात्रात्मक आंकड़े। कंपनी के विभिन्न क्षेत्रों में शुद्ध राजस्व की गणना और निवेश पर रिटर्न का विश्लेषण करने के लिए उपयोग किया जाता है। |
गुणात्मक यथाप्राप्त आंकड़े
गुणात्मक आंकड़ों को गैर-मात्रात्मक और गैर-संख्यात्मक प्रकृति में रिकॉर्ड और देखा जा सकता है। इसमें कदाचित् ही कभी संख्याएँ उपस्थित होती हैं और प्रायः ऑडियो और वीडियो रिकॉर्डिंग या आमने-सामने साक्षात्कार के माध्यम से प्रत्येक प्रतिभागी के लिए अलग-अलग उत्तरों से निकाला जाता है। यहाँ कुछ सामान्य उदाहरण दिए गए हैं:
सर्वेक्षण पर खुली प्रतिक्रिया | असंरचित प्रतिक्रियाओं के साथ खुले-आम सर्वेक्षण प्रश्न उत्तरदाताओं के विचारों और राय के बारे में वास्तविक जानकारी प्रदान करते हैं। इसे मात्रात्मक आंकड़े की तरह आसानी से एकत्रित नहीं किया जा सकता है, लेकिन यह एक सच्चा दृष्टिकोण प्रदान करता है। |
तस्वीरें और वीडियो | ओवरलैप के कारण फ़ोटो और वीडियो को वर्गीकृत करना जटिल है, लेकिन कंप्यूटर विज़न में मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए यथाप्राप्त आंकड़े महत्वपूर्ण है, विशेष रूप से निगरानी और दृश्य परिदृश्य विश्लेषण के लिए। |
ग्राहक समीक्षाएँ | स्टार रेटिंग मात्रात्मक होती हैं, जबकि समीक्षाएं गुणात्मक होती हैं, जो सकारात्मक से नकारात्मक पैमाने पर प्रतिक्रियाओं का आकलन करती हैं, तथा ग्राहकों के सुझावों और समस्याओं पर प्रकाश डालती हैं। |
समाचार रिपोर्ट और जनमत | आपकी कंपनी के बारे में समाचार रिपोर्टों और लेखों से प्राप्त आंकड़े, जनमत के बारे में मूल्यवान जानकारी प्रदान करता है, लेकिन सकारात्मक और नकारात्मक व्याप्ति में अंतर करने के लिए प्रसंस्करण की आवश्यकता होती है। |