गौण आंकड़े: Difference between revisions

From Vidyalayawiki

(added content)
(added internal links)
 
(3 intermediate revisions by the same user not shown)
Line 1: Line 1:
गौण आंकड़े दो मुख्य प्रकार के आंकड़ों में से एक है, जहाँ दूसरा प्रकार गौण आंकड़ा है। ये दो आंकड़ों के प्रकार अनुसंधान और सांख्यिकी में बहुत उपयोगी हैं
गौण [[आंकड़े]] दो मुख्य प्रकार के आंकड़ों में से एक है, जहाँ दूसरा प्रकार [[प्राथमिक आंकड़े|प्राथमिक आंकड़ा]] है। ये दो आंकड़ों के प्रकार अनुसंधान और सांख्यिकी में बहुत उपयोगी हैं


हम गौण आंकड़े, इसके उदाहरण, स्रोत और विश्लेषण के तरीकों का अध्ययन करेंगे।
हम गौण आंकड़े, इसके उदाहरण, स्रोत और विश्लेषण के तरीकों का अध्ययन करेंगे।
Line 42: Line 42:
* '''वेबसाइटें'''
* '''वेबसाइटें'''


The information shared on websites is mostly not regulated and as such may not be trusted compared to other sources. However, there are some regulated websites that only share authentic data and can be trusted by researchers.
वेबसाइटों पर साझा की गई जानकारी अधिकांशतः विनियमित नहीं होती है और इसलिए अन्य स्रोतों की तुलना में इस पर विश्वास नहीं किया जा सकता है। हालाँकि, कुछ विनियमित वेबसाइटें हैं जो केवल प्रामाणिक आंकड़े साझा करती हैं और शोधकर्ताओं द्वारा उन पर विश्वास किया जा सकता है।
 
Most of these websites are usually government websites or private organizations that are paid, data collectors.


इनमें से अधिकांश वेबसाइटें प्रायः सरकारी वेबसाइटें या निजी संगठन होते हैं जिन्हें भुगतान किया जाता है, आंकड़ों के संग्रहकर्ता।
* '''ब्लॉग्स'''
* '''ब्लॉग्स'''


Blogs are one of the most common online sources for data and may even be less authentic than websites. These days, practically everyone owns a blog, and a lot of people use these blogs to drive traffic to their website or make money through paid ads.
ब्लॉग आंकड़ों के लिए सबसे साधारणतः ऑनलाइन स्रोतों में से एक हैं और वेबसाइटों की तुलना में कम प्रामाणिक भी हो सकते हैं। आजकल, व्यावहारिक रूप से हर किसी के पास एक ब्लॉग है, और बहुत से लोग इन ब्लॉग का उपयोग अपनी वेबसाइट पर ट्रैफ़िक लाने या सशुल्क विज्ञापनों के माध्यम से पैसे कमाने के लिए करते हैं।


Therefore, they cannot always be trusted. For example, a blogger may write good things about a product because he or she was paid to do so by the manufacturer even though these things are not true.
इसलिए, उन पर सदैव विश्वास नहीं किया जा सकता है। उदाहरण के लिए, एक ब्लॉगर किसी उत्पाद के बारे में अच्छी बातें लिख सकता है क्योंकि उसे निर्माता द्वारा ऐसा करने के लिए भुगतान किया गया था, भले ही ये बातें सत्य न हों।


* '''डायरियों'''
* '''डायरियों'''


They are personal records and as such rarely used for data collection by researchers. Also, diaries are usually personal, except for these days when people now share public diaries containing specific events in their life.
वे व्यक्तिगत अभिलेख होते हैं और इसलिए शोधकर्ताओं द्वारा आंकड़ों के संग्रहण के लिए संभवतः ही कभी उनका उपयोग किया जाता है। इसके अतिरिक्त, डायरियां प्रायः  व्यक्तिगत होती हैं, सिवाय उन दिनों के जब लोग अब अपने जीवन की विशिष्ट घटनाओं वाली डायरियां सार्वजनिक रूप से साझा करते हैं।
 
A common example of this is Anne Frank’s diary which contained an accurate record of the Nazi wars.


इसका एक सामान्य उदाहरण ऐनी फ्रैंक की डायरी है जिसमें नाजी युद्धों का सटीक अभिलेख था।
* '''सरकारी अभिलेख'''
* '''सरकारी अभिलेख'''


Government records are a very important and authentic source of secondary data. They contain information useful in marketing, management, humanities, and social science research.
सरकारी अभिलेख गौण आंकड़ों का एक बहुत ही महत्वपूर्ण और प्रामाणिक स्रोत हैं। उनमें विपणन, प्रबंधन, मानविकी और सामाजिक विज्ञान अनुसंधान में उपयोगी जानकारी उपस्थित हैं।


Some of these records include; census data, health records, education institute records, etc. They are usually collected to aid proper planning, allocation of funds, and prioritizing of projects.
इनमें से कुछ अभिलेखों में निम्नलिखित उपस्थित हैं; जनसंख्या आंकड़े, स्वास्थ्य अभिलेख, शिक्षा संस्थान अभिलेख आदि। इन्हें प्रायः उचित योजना बनाने, धन के आवंटन और परियोजनाओं को प्राथमिकता देने में सहायता के लिए एकत्र किया जाता है।


* '''पॉडकास्ट'''
* '''पॉडकास्ट'''


Podcasts are gradually becoming very common these days, and a lot of people listen to them as an alternative to radio. They are more or less like online radio stations and are generating increasing popularity.
पॉडकास्ट इन दिनों धीरे-धीरे बहुत साधारणत होते जा रहे हैं और बहुत से लोग रेडियो के विकल्प के रूप में इन्हें सुनते हैं। वे लगभग ऑनलाइन रेडियो स्टेशनों की तरह हैं और बढ़ती लोकप्रियता उपलब्ध कर रहे हैं।


Information is usually shared during podcasts, and listeners can use it as a source of data collection.
जानकारी साधारणतः पॉडकास्ट के दौरान साझा की जाती है, और श्रोता इसे आंकड़ों के संग्रहण के स्रोत के रूप में उपयोग कर सकते हैं।


Some other sources of data collection include:
आंकड़ों के संग्रहण के कुछ अन्य स्रोत निम्नलिखित हैं:


* Letters
* पत्र
* Radio stations
* रेडियो स्टेशन
* Public sector records.
* सार्वजनिक क्षेत्र के अभिलेख ।


== गौण आंकड़ों के लाभ ==
== गौण आंकड़ों के लाभ ==


* '''Ease of Access'''
* '''अभिगम्यता की सहजता'''
 
Most of the sources of secondary data are easily accessible to researchers. Most of these sources can be accessed online through a mobile device.  People who do not have access to the internet can also access them through print.
 
They are usually available in libraries, book stores, and can even be borrowed from other people.
 
* '''Inexpensive'''


Secondary data mostly require little to no cost for people to acquire them. Many books, journals, and magazines can be downloaded for free online.  Books can also be borrowed for free from public libraries by people who do not have access to the internet.
गौण आंकड़ों के अधिकांश स्रोत शोधकर्ताओं के लिए आसानी से उपलब्ध हैं। इनमें से अधिकांश स्रोतों को मोबाइल डिवाइस के माध्यम से ऑनलाइन पहुंचा जा सकता है। जिन लोगों के पास इंटरनेट तक पहुंच नहीं है वे प्रिंट के माध्यम से भी इंटरनेट तक पहुंच सकते हैं।


Researchers do not have to spend money on investigations, and very little is spent on acquiring books if any.
वे साधारणतः पुस्तकालयों, पुस्तक दुकानों में उपलब्ध होते हैं, और यहां तक कि अन्य लोगों से उधार भी लिए जा सकते हैं।


* '''Time-Saving'''
* '''मितव्ययी'''  


The time spent on collecting secondary data is usually very little compared to that of primary data. The only investigation necessary for secondary data collection is the process of sourcing for necessary data sources.
गौण आंकड़ों को प्राप्त करने के लिए लोगों को अधिकतर बहुत कम या बिना किसी लागत की आवश्यकता होती है। कई पुस्तकें, पत्रिकाएँ और पत्रिकाएँ निःशुल्क ऑनलाइन डाउनलोड की जा सकती हैं। जिन लोगों के पास इंटरनेट तक पहुंच नहीं है, वे भी सार्वजनिक पुस्तकालयों से मुफ्त में पुस्तकें उधार ले सकते हैं। शोधकर्ताओं को जाँच-पड़ताल पर पैसे खर्च करने की आवश्यकता नहीं है और अगर कोई पुस्तक खरीदनी भी है, तो उस पर बहुत कम खर्च करना पड़ता है।


Therefore, cutting the time that would normally be spent on the investigation. This will save a significant amount of time for the researcher
* '''समय की बचत'''


* '''Longitudinal and Comparative Studies'''
गौण आंकड़ों को एकत्र करने में लगने वाला समय प्रायः प्राथमिक आंकड़ों की तुलना में बहुत कम होता है। गौण आंकड़ों के संग्रहण के लिए आवश्यक एकमात्र जांच आवश्यक आंकड़ों स्रोतों के स्रोत की प्रक्रिया है।


Secondary data makes it easy to carry out longitudinal studies without having to wait for a couple of years to draw conclusions. For example, you may want to compare the country’s population according to census 5 years ago, and now.
इसलिए, सामान्यतः जांच पर खर्च होने वाले समय में कटौती की जा रही है। इससे शोधकर्ता के समय की पर्याप्त रूप से बचत होगी
* '''अनुदैर्ध्य एवं तुलनात्मक अध्ययन'''


Rather than waiting for 5 years, the comparison can easily be made by collecting the census 5 years ago and now.
गौण आंकड़ों से निष्कर्ष निकालने के लिए कुछ वर्षों तक प्रतीक्षा किए बिना अनुदैर्ध्य अध्ययन करना सरल हो जाता है। उदाहरण के लिए, आप 5 वर्ष पहले की जनगणना और अब के अनुसार देश की जनसंख्या की तुलना करना चाह सकते हैं।


* '''Generating new insights'''
5 वर्षों तक प्रतीक्षा करने के बजाय, 5 वर्ष पहले की जनगणना और अब की जनगणना एकत्र करके तुलना आसानी से की जा सकती है।
* '''नई अंतर्दृष्टि उत्पन्न करना'''


When re-evaluating data, especially through another person’s lens or point of view, new things are uncovered. There might be a thing that wasn’t discovered in the past by the primary data collector, that secondary data collection may reveal.
आंकड़ों का पुनर्मूल्यांकन करते समय, विशेष रूप से किसी अन्य व्यक्ति के  तेजोजल या दृष्टिकोण से, नई चीजें उजागर होती हैं। हो सकता है कि कोई ऐसी चीज हो जो प्राथमिक आंकड़ों संग्रहकर्ता द्वारा अतीत में नहीं खोजी गई हो, जिसे गौण आंकड़ों  के संग्रहण प्रकट कर सकता है।


For example, when customers complain about difficulty using an app to the customer service team, they may decide to create a user guide teaching customers how to use it. However, when a product developer has access to this data, it may be uncovered that the issue came from and UI/UX design that needs to be worked on.
उदाहरण के लिए, जब ग्राहक, ग्राहक सेवा वर्ग से किसी ऐप का उपयोग करने में कठिनाई के बारे में दोषारोपण करते हैं, तो वे ग्राहकों को इसका उपयोग करने का उपाय सिखाने के लिए एक उपयोगकर्ता मार्गदर्शिका बनाने का निर्णय ले सकते हैं। हालाँकि, जब किसी उत्पाद डेवलपर के पास इस आंकड़े तक पहुँच होती है, तो यह पता चल सकता है कि समस्या UI/UX डिज़ाइन से आई है जिस पर काम करने की आवश्यकता है।


== गौण आंकड़ों के हानि ==
== गौण आंकड़ों के हानि ==


* '''Data Quality:'''
* '''आंकड़ों की गुणवत्ता:'''
 
The data collected through secondary sources may not be as authentic as when collected directly from the source. This is a very common disadvantage with online sources due to a lack of regulatory bodies to monitor the kind of content that is being shared.
 
Therefore, working with this kind of data may have negative effects on the research being carried out.
 
* '''Irrelevant Data:'''


Researchers spend so much time surfing through a pool of irrelevant data before finally getting the one they need. This is because the data was not collected mainly for the researcher.
गौण स्रोतों के माध्यम से एकत्र किए गए आंकड़े उतना प्रामाणिक नहीं हो सकते  जितना सीधे स्रोत से एकत्र किए जाने पर होते हैं। ऑनलाइन स्रोतों के साथ यह एक बहुत ही साधारण हानि है क्योंकि साझा की जा रही सामग्री की निगरानी करने के लिए नियामक निकायों की कमी है।


In some cases, a researcher may not even find the exact data he or she needs, but have to settle for the next best alternative.
इसलिए, इस प्रकार के आंकड़ों के साथ काम करने से किए जा रहे अनुसंधान पर नकारात्मक प्रभाव पड़ सकता है।
* '''अप्रासंगिक आंकड़े:'''


* '''Exaggerated Data'''
शोधकर्ता अंततः अप्रासंगिक आंकड़ों के एक पूल के माध्यम से सर्फिंग करने में बहुत समय बिताते हैं, इससे पहले कि उन्हें जो चाहिए वह मिल जाए। इसका कारण यह है कि आंकड़े मुख्यतः शोधकर्ता के लिए एकत्र नहीं किए गए थे।


Some data sources are known to exaggerate the information that is being shared. This bias may be some to maintain a good public image or due to a paid advert.
कुछ परिस्थितियों में, एक शोधकर्ता को वह सटीक आंकड़ा भी नहीं मिल पाता जिसकी उसे आवश्यकता है, परंतु उसे अगले सर्वोत्तम विकल्प के लिए समझौता करना पड़ता है।
* '''अतिशयोक्तिपूर्ण आंकड़े:'''


This is very common with many online blogs that even go a bead to share false information just to gain web traffic. For example, a FinTech startup may exaggerate the amount of money it has processed just to attract more customers.
कुछ आंकड़े स्रोत साझा की जा रही जानकारी को बढ़ा-चढ़ाकर पेश करने के लिए जाने जाते हैं। यह पूर्वाग्रह अच्छी सार्वजनिक छवि बनाए रखने के लिए या किसी भुगतान किए गए विज्ञापन के कारण हो सकता है।


A researcher gathering this data to investigate the total amount of money processed by FinTech startups in the US for the quarter may have to use this exaggerated data.
यह कई ऑनलाइन ब्लॉगों में बहुत साधारण है जो मात्र वेब ट्रैफ़िक उपलब्ध करने के लिए गलत जानकारी साझा करने की सीमा तक चले जाते हैं। उदाहरण के लिए, एक फिनटेक स्टार्टअप अधिक ग्राहकों को आकर्षित करने के लिए अपने द्वारा संसाधित किए गए धन की मात्रा को बढ़ा-चढ़ाकर बता सकता है।


* '''Outdated Information'''
तिमाही के लिए अमेरिका में फिनटेक स्टार्टअप द्वारा संसाधित कुल धन की जांच करने के लिए यह आंकड़े एकत्र करने वाले एक शोधकर्ता को इस अतिरंजित आंकड़े का उपयोग करना पड़ सकता है।
* '''अप्रचलित जानकारी:'''


Some of the data sources are outdated and there are no new available data to replace the old ones. For example, the national census is not usually updated yearly.
कुछ आंकड़े स्रोत अप्रचलित/पुराने हो चुके हैं और पुराने स्रोतों के स्थान पर कोई नया आंकड़ा उपलब्ध नहीं है। उदाहरण के लिए, राष्ट्रीय जनगणना को प्रायः वार्षिक रूप से अद्यतन नहीं किया जाता है।


Therefore, there have been changes in the country’s population since the last census. However, someone working with the country’s population will have to settle for the previously recorded figure even though it is outdated.
इसलिए, पिछली जनगणना के बाद से देश की जनसंख्या में परिवर्तन हुए हैं। हालाँकि, देश की जनसंख्या के साथ काम करने वाले किसी व्यक्ति को पहले दर्ज किए गए आंकड़े से ही संतुष्ट होना होगा, भले ही वह पुराना हो।


== निष्कर्ष ==
== निष्कर्ष ==
Secondary data has various uses in research, business, and statistics. Researchers choose secondary data for different reasons, with some of it being due to price, availability, or even needs of the research.
गौण आंकड़ों का अनुसंधान, व्यवसाय और सांख्यिकी में विभिन्न उपयोग होता है। शोधकर्ता विभिन्न कारणों से गौण आंकड़े चुनते हैं, जिनमें से कुछ कीमत, उपलब्धता या यहां तक कि शोध की आवश्यकताओं के कारण भी होते हैं।


Although old, secondary data may be the only source of data in some cases. This may be due to the huge cost of performing research or due to its delegation to a particular body (e.g. national census).
यद्यपि अप्रचलित गौण आंकड़े कुछ स्थितियों में आंकड़ों का एकमात्र स्रोत हो सकता है। यह शोध करने की भारी लागत या किसी विशेष निकाय (जैसे राष्ट्रीय जनगणना) को सौंपे जाने के कारण हो सकता है।


In short, secondary data has its shortcomings, which may affect the outcome of the research negatively and also some advantages over primary data. It all depends on the situation, the researcher in question, and the kind of research being carried out.
संक्षेप में, गौण आंकड़ों की अपनी कमियाँ हैं, जो शोध के परिणाम को नकारात्मक रूप से प्रभावित कर सकती हैं और प्राथमिक आंकड़ों की तुलना में कुछ लाभ भी देती हैं। यह सब स्थिति, संबंधित शोधकर्ता और किए जा रहे शोध के प्रकार पर निर्भर करता है।






गौण आंकडों से तात्पर्य उस आंकड़े से है जो प्राथमिक उपयोगकर्ता के अलावा किसी अन्य व्यक्ति द्वारा पहले एकत्र किया गया है। सामाजिक विज्ञान के लिए गौण आंकडों के सामान्य स्रोतों में जनगणना, सरकारी विभागों द्वारा एकत्र की गई जानकारी, संगठनात्मक रिकॉर्ड और अन्य शोध उद्देश्यों के लिए मूल रूप से एकत्र किया गया आंकड़े सम्मिलित हैं। इसके विपरीत, प्राथमिक आंकडों का  शोध करने वाले अन्वेषक द्वारा एकत्र किया जाता है।


गौण आंकडों के कुछ मुख्य बिंदुओं का उल्लेख नीचे दी गई तालिका में किया गया है।
[[Category:सांख्यिकी]][[Category:कक्षा-9]][[Category:गणित]]
[[Category:सांख्यिकी]][[Category:कक्षा-9]][[Category:गणित]]
{| class="wikitable"
|आंकड़े
|भूतपूर्व आँकड़े
|-
|प्रक्रिया
|त्वरित और सरल
|-
|स्रोत
|सरकारी प्रकाशन, वेबसाइट, पुस्तकें, जर्नल लेख, आंतरिक रिकॉर्ड आदि।
|-
|लागत प्रभाविता
|अल्पव्ययी
|-
|संग्रहकाल
|लघु
|-
|विशिष्ट
|शोधकर्ता की आवश्यकता के लिए विशिष्ट हो भी सकता है और नहीं भी
|-
|उपलब्धता
|परिष्कृत रूप
|-
|परिशुद्धता और विश्वसनीयता
|अपेक्षाकृत कम
|}

Latest revision as of 10:54, 15 October 2024

गौण आंकड़े दो मुख्य प्रकार के आंकड़ों में से एक है, जहाँ दूसरा प्रकार प्राथमिक आंकड़ा है। ये दो आंकड़ों के प्रकार अनुसंधान और सांख्यिकी में बहुत उपयोगी हैं

हम गौण आंकड़े, इसके उदाहरण, स्रोत और विश्लेषण के तरीकों का अध्ययन करेंगे।

गौण आंकड़े क्या है?

गौण आंकड़े वह आंकड़े हैं जो प्राथमिक स्रोतों के माध्यम से पहले से ही एकत्र किया गया है और शोधकर्ताओं को अपने स्वयं के शोध के लिए उपयोग करने के लिए आसानी से उपलब्ध कराया गया है। यह एक प्रकार का आंकड़ा है जो पहले से ही अतीत में एकत्र किया गया है।

एक शोधकर्ता ने किसी विशेष परियोजना के लिए आंकड़ा एकत्र किया हो सकता है, फिर इसे किसी अन्य शोधकर्ता द्वारा उपयोग करने के लिए उपलब्ध कराया हो सकता है। आंकड़े को राष्ट्रीय जनगणना की तरह बिना किसी विशिष्ट शोध उद्देश्य के सामान्य उपयोग के लिए भी एकत्र किया जा सकता है।

किसी विशेष शोध के लिए गौण के रूप में वर्गीकृत आंकड़े को किसी अन्य शोध के लिए प्राथमिक कहा जा सकता है। यह तब होता है जब आंकड़े का पुन: उपयोग किया जा रहा हो, जिससे यह पहले शोध के लिए प्राथमिक आंकड़े बन जाते हैं और दूसरे शोध के लिए गौण आंकड़े बन जाते हैं जिसके लिए इसका उपयोग किया जा रहा है।

गौण आंकड़ों के स्रोत

गौण आंकड़ों के स्रोतों में पुस्तकें, व्यक्तिगत स्रोत, पत्रिकाएँ, समाचार पत्र, वेबसाइट, सरकारी अभिलेख आदि उपस्थित हैं। गौण आंकड़े, प्राथमिक आंकड़े की तुलना में आसानी से उपलब्ध होने के लिए जाने जाते हैं। इन स्रोतों का उपयोग करने के लिए बहुत कम शोध की आवश्यकता होती है और जनशक्ति की आवश्यकता होती है।

इलेक्ट्रॉनिक मीडिया और इंटरनेट के आगमन के साथ, गौण आंकड़ों के स्रोत अधिक आसानी से सुलभ हो गए हैं। इनमें से कुछ स्रोतों पर नीचे प्रकाश डाला गया है।

  • पुस्तकें

पुस्तकें आंकड़े एकत्र करने के सबसे पारंपरिक उपायों में से एक हैं। आज, हम जितने भी विषयों के बारे में सोच सकते हैं, उन सभी के लिए किताबें उपलब्ध हैं। शोध करते समय, हमें मात्र शोध किए जा रहे विषय पर एक पुस्तक की तलाश करनी है, फिर उस क्षेत्र में पुस्तकों के उपलब्ध भंडार में से चयन करना है। पुस्तकें, जब सावधानीपूर्वक चुनी जाती हैं, प्रामाणिक आंकड़ों का एक प्रामाणिक स्रोत होता है और साहित्य समीक्षा तैयार करने में उपयोगी हो सकती हैं।

  • प्रकाशित स्रोत

विभिन्न शोध विषयों के लिए विभिन्न प्रकार के प्रकाशित स्रोत उपलब्ध हैं। इन स्रोतों से उत्पन्न आंकड़े की प्रामाणिकता मुख्य रूप से लेखक और प्रकाशन कंपनी पर निर्भर करती है।

प्रकाशित स्रोत मुद्रित या इलेक्ट्रॉनिक हो सकते हैं, जैसी भी स्थिति हो। लेखक और प्रकाशन कंपनी के निर्णय के आधार पर वे सशुल्क या निःशुल्क हो सकते हैं।

  • अप्रकाशित व्यक्तिगत स्रोत

प्रकाशित स्रोतों की तुलना में यह आसानी से उपलब्ध और सुलभ नहीं हो सकता है। वे केवल तभी सुलभ होते हैं जब शोधकर्ता उन्हें किसी अन्य शोधकर्ता के साथ साझा करता है, जिसे उन्हें किसी तीसरे पक्ष के साथ साझा करने की अनुमति नहीं है।

उदाहरण के लिए, किसी संगठन की उत्पाद प्रबंधन वर्ग को यह आकलन करने के लिए ग्राहक प्रतिक्रिया पर आंकड़े की आवश्यकता हो सकती है कि ग्राहक उनके उत्पाद और सुधार सुझावों के बारे में क्या सोचते हैं। उन्हें ग्राहक सेवा विभाग से आंकड़े एकत्र करने की आवश्यकता होगी, जो मुख्य रूप से ग्राहक सेवा को बेहतर बनाने के लिए आंकड़े एकत्र करता है।

  • पत्रिका

जब आंकड़ों के संग्रहण की बात आती है तो पत्रिकाएँ इन दिनों धीरे-धीरे पुस्तकों से अधिक महत्वपूर्ण होती जा रही हैं। ऐसा इसलिए है क्योंकि पत्रिकाओं को नियमित रूप से समय-समय पर नए प्रकाशनों के साथ अद्यतन किया जाता है, इसलिए नवीनतम जानकारी मिलती है।

इसके अलावा, जब शोध की बात आती है तो पत्रिकाएँ साधारणतः अधिक विशिष्ट होती हैं। उदाहरण के लिए, हम "गौण आंकड़ों के लिए गौण आंकड़ों का संग्रहण" पर एक पत्रिका रख सकते हैं, जबकि एक पुस्तक का शीर्षक केवल "गौण आंकड़ों का संग्रहण" होगा।

  • समाचार पत्र

अधिकांश परिस्थितियों में, समाचार पत्र के माध्यम से पारित जानकारी प्रायः बहुत विश्वसनीय होती है। इसलिए, यह गौण आंकड़े एकत्र करने के सबसे प्रामाणिक स्रोतों में से एक बन गया है।

समाचार पत्र में साधारणतः साझा किए जाने वाले आंकड़े प्रायः वैज्ञानिक से ज़्यादा राजनीतिक, आर्थिक और शैक्षिक होते हैं। इसलिए, समाचार-पत्र वैज्ञानिक आंकड़ों के संग्रहण के लिए सर्वोत्तम स्रोत नहीं हो सकते हैं।

  • वेबसाइटें

वेबसाइटों पर साझा की गई जानकारी अधिकांशतः विनियमित नहीं होती है और इसलिए अन्य स्रोतों की तुलना में इस पर विश्वास नहीं किया जा सकता है। हालाँकि, कुछ विनियमित वेबसाइटें हैं जो केवल प्रामाणिक आंकड़े साझा करती हैं और शोधकर्ताओं द्वारा उन पर विश्वास किया जा सकता है।

इनमें से अधिकांश वेबसाइटें प्रायः सरकारी वेबसाइटें या निजी संगठन होते हैं जिन्हें भुगतान किया जाता है, आंकड़ों के संग्रहकर्ता।

  • ब्लॉग्स

ब्लॉग आंकड़ों के लिए सबसे साधारणतः ऑनलाइन स्रोतों में से एक हैं और वेबसाइटों की तुलना में कम प्रामाणिक भी हो सकते हैं। आजकल, व्यावहारिक रूप से हर किसी के पास एक ब्लॉग है, और बहुत से लोग इन ब्लॉग का उपयोग अपनी वेबसाइट पर ट्रैफ़िक लाने या सशुल्क विज्ञापनों के माध्यम से पैसे कमाने के लिए करते हैं।

इसलिए, उन पर सदैव विश्वास नहीं किया जा सकता है। उदाहरण के लिए, एक ब्लॉगर किसी उत्पाद के बारे में अच्छी बातें लिख सकता है क्योंकि उसे निर्माता द्वारा ऐसा करने के लिए भुगतान किया गया था, भले ही ये बातें सत्य न हों।

  • डायरियों

वे व्यक्तिगत अभिलेख होते हैं और इसलिए शोधकर्ताओं द्वारा आंकड़ों के संग्रहण के लिए संभवतः ही कभी उनका उपयोग किया जाता है। इसके अतिरिक्त, डायरियां प्रायः व्यक्तिगत होती हैं, सिवाय उन दिनों के जब लोग अब अपने जीवन की विशिष्ट घटनाओं वाली डायरियां सार्वजनिक रूप से साझा करते हैं।

इसका एक सामान्य उदाहरण ऐनी फ्रैंक की डायरी है जिसमें नाजी युद्धों का सटीक अभिलेख था।

  • सरकारी अभिलेख

सरकारी अभिलेख गौण आंकड़ों का एक बहुत ही महत्वपूर्ण और प्रामाणिक स्रोत हैं। उनमें विपणन, प्रबंधन, मानविकी और सामाजिक विज्ञान अनुसंधान में उपयोगी जानकारी उपस्थित हैं।

इनमें से कुछ अभिलेखों में निम्नलिखित उपस्थित हैं; जनसंख्या आंकड़े, स्वास्थ्य अभिलेख, शिक्षा संस्थान अभिलेख आदि। इन्हें प्रायः उचित योजना बनाने, धन के आवंटन और परियोजनाओं को प्राथमिकता देने में सहायता के लिए एकत्र किया जाता है।

  • पॉडकास्ट

पॉडकास्ट इन दिनों धीरे-धीरे बहुत साधारणत होते जा रहे हैं और बहुत से लोग रेडियो के विकल्प के रूप में इन्हें सुनते हैं। वे लगभग ऑनलाइन रेडियो स्टेशनों की तरह हैं और बढ़ती लोकप्रियता उपलब्ध कर रहे हैं।

जानकारी साधारणतः पॉडकास्ट के दौरान साझा की जाती है, और श्रोता इसे आंकड़ों के संग्रहण के स्रोत के रूप में उपयोग कर सकते हैं।

आंकड़ों के संग्रहण के कुछ अन्य स्रोत निम्नलिखित हैं:

  • पत्र
  • रेडियो स्टेशन
  • सार्वजनिक क्षेत्र के अभिलेख ।

गौण आंकड़ों के लाभ

  • अभिगम्यता की सहजता

गौण आंकड़ों के अधिकांश स्रोत शोधकर्ताओं के लिए आसानी से उपलब्ध हैं। इनमें से अधिकांश स्रोतों को मोबाइल डिवाइस के माध्यम से ऑनलाइन पहुंचा जा सकता है। जिन लोगों के पास इंटरनेट तक पहुंच नहीं है वे प्रिंट के माध्यम से भी इंटरनेट तक पहुंच सकते हैं।

वे साधारणतः पुस्तकालयों, पुस्तक दुकानों में उपलब्ध होते हैं, और यहां तक कि अन्य लोगों से उधार भी लिए जा सकते हैं।

  • मितव्ययी

गौण आंकड़ों को प्राप्त करने के लिए लोगों को अधिकतर बहुत कम या बिना किसी लागत की आवश्यकता होती है। कई पुस्तकें, पत्रिकाएँ और पत्रिकाएँ निःशुल्क ऑनलाइन डाउनलोड की जा सकती हैं। जिन लोगों के पास इंटरनेट तक पहुंच नहीं है, वे भी सार्वजनिक पुस्तकालयों से मुफ्त में पुस्तकें उधार ले सकते हैं। शोधकर्ताओं को जाँच-पड़ताल पर पैसे खर्च करने की आवश्यकता नहीं है और अगर कोई पुस्तक खरीदनी भी है, तो उस पर बहुत कम खर्च करना पड़ता है।

  • समय की बचत

गौण आंकड़ों को एकत्र करने में लगने वाला समय प्रायः प्राथमिक आंकड़ों की तुलना में बहुत कम होता है। गौण आंकड़ों के संग्रहण के लिए आवश्यक एकमात्र जांच आवश्यक आंकड़ों स्रोतों के स्रोत की प्रक्रिया है।

इसलिए, सामान्यतः जांच पर खर्च होने वाले समय में कटौती की जा रही है। इससे शोधकर्ता के समय की पर्याप्त रूप से बचत होगी

  • अनुदैर्ध्य एवं तुलनात्मक अध्ययन

गौण आंकड़ों से निष्कर्ष निकालने के लिए कुछ वर्षों तक प्रतीक्षा किए बिना अनुदैर्ध्य अध्ययन करना सरल हो जाता है। उदाहरण के लिए, आप 5 वर्ष पहले की जनगणना और अब के अनुसार देश की जनसंख्या की तुलना करना चाह सकते हैं।

5 वर्षों तक प्रतीक्षा करने के बजाय, 5 वर्ष पहले की जनगणना और अब की जनगणना एकत्र करके तुलना आसानी से की जा सकती है।

  • नई अंतर्दृष्टि उत्पन्न करना

आंकड़ों का पुनर्मूल्यांकन करते समय, विशेष रूप से किसी अन्य व्यक्ति के तेजोजल या दृष्टिकोण से, नई चीजें उजागर होती हैं। हो सकता है कि कोई ऐसी चीज हो जो प्राथमिक आंकड़ों संग्रहकर्ता द्वारा अतीत में नहीं खोजी गई हो, जिसे गौण आंकड़ों के संग्रहण प्रकट कर सकता है।

उदाहरण के लिए, जब ग्राहक, ग्राहक सेवा वर्ग से किसी ऐप का उपयोग करने में कठिनाई के बारे में दोषारोपण करते हैं, तो वे ग्राहकों को इसका उपयोग करने का उपाय सिखाने के लिए एक उपयोगकर्ता मार्गदर्शिका बनाने का निर्णय ले सकते हैं। हालाँकि, जब किसी उत्पाद डेवलपर के पास इस आंकड़े तक पहुँच होती है, तो यह पता चल सकता है कि समस्या UI/UX डिज़ाइन से आई है जिस पर काम करने की आवश्यकता है।

गौण आंकड़ों के हानि

  • आंकड़ों की गुणवत्ता:

गौण स्रोतों के माध्यम से एकत्र किए गए आंकड़े उतना प्रामाणिक नहीं हो सकते जितना सीधे स्रोत से एकत्र किए जाने पर होते हैं। ऑनलाइन स्रोतों के साथ यह एक बहुत ही साधारण हानि है क्योंकि साझा की जा रही सामग्री की निगरानी करने के लिए नियामक निकायों की कमी है।

इसलिए, इस प्रकार के आंकड़ों के साथ काम करने से किए जा रहे अनुसंधान पर नकारात्मक प्रभाव पड़ सकता है।

  • अप्रासंगिक आंकड़े:

शोधकर्ता अंततः अप्रासंगिक आंकड़ों के एक पूल के माध्यम से सर्फिंग करने में बहुत समय बिताते हैं, इससे पहले कि उन्हें जो चाहिए वह मिल जाए। इसका कारण यह है कि आंकड़े मुख्यतः शोधकर्ता के लिए एकत्र नहीं किए गए थे।

कुछ परिस्थितियों में, एक शोधकर्ता को वह सटीक आंकड़ा भी नहीं मिल पाता जिसकी उसे आवश्यकता है, परंतु उसे अगले सर्वोत्तम विकल्प के लिए समझौता करना पड़ता है।

  • अतिशयोक्तिपूर्ण आंकड़े:

कुछ आंकड़े स्रोत साझा की जा रही जानकारी को बढ़ा-चढ़ाकर पेश करने के लिए जाने जाते हैं। यह पूर्वाग्रह अच्छी सार्वजनिक छवि बनाए रखने के लिए या किसी भुगतान किए गए विज्ञापन के कारण हो सकता है।

यह कई ऑनलाइन ब्लॉगों में बहुत साधारण है जो मात्र वेब ट्रैफ़िक उपलब्ध करने के लिए गलत जानकारी साझा करने की सीमा तक चले जाते हैं। उदाहरण के लिए, एक फिनटेक स्टार्टअप अधिक ग्राहकों को आकर्षित करने के लिए अपने द्वारा संसाधित किए गए धन की मात्रा को बढ़ा-चढ़ाकर बता सकता है।

तिमाही के लिए अमेरिका में फिनटेक स्टार्टअप द्वारा संसाधित कुल धन की जांच करने के लिए यह आंकड़े एकत्र करने वाले एक शोधकर्ता को इस अतिरंजित आंकड़े का उपयोग करना पड़ सकता है।

  • अप्रचलित जानकारी:

कुछ आंकड़े स्रोत अप्रचलित/पुराने हो चुके हैं और पुराने स्रोतों के स्थान पर कोई नया आंकड़ा उपलब्ध नहीं है। उदाहरण के लिए, राष्ट्रीय जनगणना को प्रायः वार्षिक रूप से अद्यतन नहीं किया जाता है।

इसलिए, पिछली जनगणना के बाद से देश की जनसंख्या में परिवर्तन हुए हैं। हालाँकि, देश की जनसंख्या के साथ काम करने वाले किसी व्यक्ति को पहले दर्ज किए गए आंकड़े से ही संतुष्ट होना होगा, भले ही वह पुराना हो।

निष्कर्ष

गौण आंकड़ों का अनुसंधान, व्यवसाय और सांख्यिकी में विभिन्न उपयोग होता है। शोधकर्ता विभिन्न कारणों से गौण आंकड़े चुनते हैं, जिनमें से कुछ कीमत, उपलब्धता या यहां तक कि शोध की आवश्यकताओं के कारण भी होते हैं।

यद्यपि अप्रचलित गौण आंकड़े कुछ स्थितियों में आंकड़ों का एकमात्र स्रोत हो सकता है। यह शोध करने की भारी लागत या किसी विशेष निकाय (जैसे राष्ट्रीय जनगणना) को सौंपे जाने के कारण हो सकता है।

संक्षेप में, गौण आंकड़ों की अपनी कमियाँ हैं, जो शोध के परिणाम को नकारात्मक रूप से प्रभावित कर सकती हैं और प्राथमिक आंकड़ों की तुलना में कुछ लाभ भी देती हैं। यह सब स्थिति, संबंधित शोधकर्ता और किए जा रहे शोध के प्रकार पर निर्भर करता है।