गौण आंकड़े: Difference between revisions

From Vidyalayawiki

No edit summary
(added internal links)
 
(6 intermediate revisions by the same user not shown)
Line 1: Line 1:
Secondary data is one of the two main types of [[data]], where the second type is the [[Primary Data|primary data]]. These two data types are very useful in research and statistics
गौण [[आंकड़े]] दो मुख्य प्रकार के आंकड़ों में से एक है, जहाँ दूसरा प्रकार [[प्राथमिक आंकड़े|प्राथमिक आंकड़ा]] है। ये दो आंकड़ों के प्रकार अनुसंधान और सांख्यिकी में बहुत उपयोगी हैं


We will study secondary data, its examples, sources, and methods of analysis.
हम गौण आंकड़े, इसके उदाहरण, स्रोत और विश्लेषण के तरीकों का अध्ययन करेंगे।


== '''What is Secondary Data?''' ==
== गौण आंकड़े क्या है? ==
Secondary data is the data that has already been collected through primary sources and made readily available for researchers to use for their own research. It is a type of data that has already been collected in the past.
गौण आंकड़े वह आंकड़े हैं जो प्राथमिक स्रोतों के माध्यम से पहले से ही एकत्र किया गया है और शोधकर्ताओं को अपने स्वयं के शोध के लिए उपयोग करने के लिए आसानी से उपलब्ध कराया गया है। यह एक प्रकार का आंकड़ा है जो पहले से ही अतीत में एकत्र किया गया है।


A researcher may have collected the data for a particular project, then made it available to be used by another researcher. The data may also have been collected for general use with no specific research purpose like in the case of the national census.
एक शोधकर्ता ने किसी विशेष परियोजना के लिए आंकड़ा एकत्र किया हो सकता है, फिर इसे किसी अन्य शोधकर्ता द्वारा उपयोग करने के लिए उपलब्ध कराया हो सकता है। आंकड़े को राष्ट्रीय जनगणना की तरह बिना किसी विशिष्ट शोध उद्देश्य के सामान्य उपयोग के लिए भी एकत्र किया जा सकता है।


Data classified as secondary for particular research may be said to be primary for another research. This is the case when data is being reused, making it primary data for the first research and secondary data for the second research it is being used for.
किसी विशेष शोध के लिए गौण के रूप में वर्गीकृत आंकड़े को किसी अन्य शोध के लिए प्राथमिक कहा जा सकता है। यह तब होता है जब आंकड़े का पुन: उपयोग किया जा रहा हो, जिससे यह पहले शोध के लिए प्राथमिक आंकड़े बन जाते हैं और दूसरे शोध के लिए गौण आंकड़े बन जाते हैं जिसके लिए इसका उपयोग किया जा रहा है।


== '''Sources of Secondary Data''' ==
== गौण आंकड़ों के स्रोत ==
Sources of secondary data include books, personal sources, journals, newspapers, websites, government records etc. Secondary data are known to be readily available compared to that of primary data. It requires very little research and needs for manpower to use these sources.
गौण आंकड़ों के स्रोतों में पुस्तकें, व्यक्तिगत स्रोत, पत्रिकाएँ, समाचार पत्र, वेबसाइट, सरकारी अभिलेख आदि उपस्थित हैं। गौण आंकड़े, प्राथमिक आंकड़े की तुलना में आसानी से उपलब्ध होने के लिए जाने जाते हैं। इन स्रोतों का उपयोग करने के लिए बहुत कम शोध की आवश्यकता होती है और जनशक्ति की आवश्यकता होती है।


With the advent of electronic media and the internet, secondary data sources have become more easily accessible. Some of these sources are highlighted below.
इलेक्ट्रॉनिक मीडिया और इंटरनेट के आगमन के साथ, गौण आंकड़ों के स्रोत अधिक आसानी से सुलभ हो गए हैं। इनमें से कुछ स्रोतों पर नीचे प्रकाश डाला गया है।


* '''Books'''
* '''पुस्तकें'''


Books are one of the most traditional ways of collecting data. Today, there are books available for all topics we can think of.  When carrying out research, all we have to do is look for a book on the topic being researched, then select from the available repository of books in that area. Books, when carefully chosen are an authentic source of authentic data and can be useful in preparing a literature review.
पुस्तकें आंकड़े एकत्र करने के सबसे पारंपरिक उपायों में से एक हैं। आज, हम जितने भी विषयों के बारे में सोच सकते हैं, उन सभी के लिए किताबें उपलब्ध हैं। शोध करते समय, हमें मात्र शोध किए जा रहे विषय पर एक पुस्तक की तलाश करनी है, फिर उस क्षेत्र में पुस्तकों के उपलब्ध भंडार में से चयन करना है। पुस्तकें, जब सावधानीपूर्वक चुनी जाती हैं, प्रामाणिक आंकड़ों का एक प्रामाणिक स्रोत होता है और साहित्य समीक्षा तैयार करने में उपयोगी हो सकती हैं।


* '''Published Sources'''
* '''प्रकाशित स्रोत'''


There are a variety of published sources available for different research topics. The authenticity of the data generated from these sources depends majorly on the writer and publishing company.
विभिन्न शोध विषयों के लिए विभिन्न प्रकार के प्रकाशित स्रोत उपलब्ध हैं। इन स्रोतों से उत्पन्न आंकड़े की प्रामाणिकता मुख्य रूप से लेखक और प्रकाशन कंपनी पर निर्भर करती है।


Published sources may be printed or electronic as the case may be. They may be paid or free depending on the writer and publishing company’s decision.
प्रकाशित स्रोत मुद्रित या इलेक्ट्रॉनिक हो सकते हैं, जैसी भी स्थिति हो। लेखक और प्रकाशन कंपनी के निर्णय के आधार पर वे सशुल्क या निःशुल्क हो सकते हैं।
* '''अप्रकाशित व्यक्तिगत स्रोत'''


* '''Unpublished Personal Sources'''
प्रकाशित स्रोतों की तुलना में यह आसानी से उपलब्ध और सुलभ नहीं हो सकता है। वे केवल तभी सुलभ होते हैं जब शोधकर्ता उन्हें किसी अन्य शोधकर्ता के साथ साझा करता है, जिसे उन्हें किसी तीसरे पक्ष के साथ साझा करने की अनुमति नहीं है।


This may not be readily available and easily accessible compared to the published sources. They only become accessible if the researcher shares with another researcher who is not allowed to share it with a third party.
उदाहरण के लिए, किसी संगठन की उत्पाद प्रबंधन वर्ग को यह आकलन करने के लिए ग्राहक प्रतिक्रिया पर आंकड़े की आवश्यकता हो सकती है कि ग्राहक उनके उत्पाद और सुधार सुझावों के बारे में क्या सोचते हैं। उन्हें ग्राहक सेवा विभाग से आंकड़े एकत्र करने की आवश्यकता होगी, जो मुख्य रूप से ग्राहक सेवा को बेहतर बनाने के लिए आंकड़े एकत्र करता है।


For example, the product management team of an organization may need data on customer feedback to assess what customers think about their product and improvement suggestions. They will need to collect the data from the customer service department, which primarily collected the data to improve customer service.
* '''पत्रिका'''


* '''Journal'''
जब आंकड़ों के संग्रहण की बात आती है तो पत्रिकाएँ इन दिनों धीरे-धीरे पुस्तकों से अधिक महत्वपूर्ण होती जा रही हैं। ऐसा इसलिए है क्योंकि पत्रिकाओं को नियमित रूप से समय-समय पर नए प्रकाशनों के साथ अद्यतन किया जाता है, इसलिए नवीनतम जानकारी मिलती है।


Journals are gradually becoming more important than books these days when data collection is concerned. This is because journals are updated regularly with new publications on a periodic basis, therefore giving to date information.
इसके अलावा, जब शोध की बात आती है तो पत्रिकाएँ साधारणतः अधिक विशिष्ट होती हैं। उदाहरण के लिए, हम "गौण आंकड़ों के लिए गौण आंकड़ों का संग्रहण" पर एक पत्रिका रख सकते हैं, जबकि एक पुस्तक का शीर्षक केवल "गौण आंकड़ों का संग्रहण" होगा।
* '''समाचार पत्र'''


Also, journals are usually more specific when it comes to research. For example, we can have a journal on, “Secondary data collection for quantitative data” while a book will simply be titled, “Secondary data collection”.
अधिकांश परिस्थितियों में, समाचार पत्र के माध्यम से पारित जानकारी प्रायः बहुत विश्वसनीय होती है। इसलिए, यह गौण आंकड़े एकत्र करने के सबसे प्रामाणिक स्रोतों में से एक बन गया है।


* '''Newspapers'''
समाचार पत्र में साधारणतः साझा किए जाने वाले आंकड़े प्रायः वैज्ञानिक से ज़्यादा राजनीतिक, आर्थिक और शैक्षिक होते हैं। इसलिए, समाचार-पत्र वैज्ञानिक आंकड़ों के संग्रहण के लिए सर्वोत्तम स्रोत नहीं हो सकते हैं।
* '''वेबसाइटें'''


In most cases, the information passed through a newspaper is usually very reliable. Hence, making it one of the most authentic sources of collecting secondary data.
वेबसाइटों पर साझा की गई जानकारी अधिकांशतः विनियमित नहीं होती है और इसलिए अन्य स्रोतों की तुलना में इस पर विश्वास नहीं किया जा सकता है। हालाँकि, कुछ विनियमित वेबसाइटें हैं जो केवल प्रामाणिक आंकड़े साझा करती हैं और शोधकर्ताओं द्वारा उन पर विश्वास किया जा सकता है।


The kind of data commonly shared in newspapers is usually more political, economic, and educational than scientific. Therefore, newspapers may not be the best source for scientific data collection.
इनमें से अधिकांश वेबसाइटें प्रायः सरकारी वेबसाइटें या निजी संगठन होते हैं जिन्हें भुगतान किया जाता है, आंकड़ों के संग्रहकर्ता।
* '''ब्लॉग्स'''


* '''Websites'''
ब्लॉग आंकड़ों के लिए सबसे साधारणतः ऑनलाइन स्रोतों में से एक हैं और वेबसाइटों की तुलना में कम प्रामाणिक भी हो सकते हैं। आजकल, व्यावहारिक रूप से हर किसी के पास एक ब्लॉग है, और बहुत से लोग इन ब्लॉग का उपयोग अपनी वेबसाइट पर ट्रैफ़िक लाने या सशुल्क विज्ञापनों के माध्यम से पैसे कमाने के लिए करते हैं।


The information shared on websites is mostly not regulated and as such may not be trusted compared to other sources. However, there are some regulated websites that only share authentic data and can be trusted by researchers.
इसलिए, उन पर सदैव विश्वास नहीं किया जा सकता है। उदाहरण के लिए, एक ब्लॉगर किसी उत्पाद के बारे में अच्छी बातें लिख सकता है क्योंकि उसे निर्माता द्वारा ऐसा करने के लिए भुगतान किया गया था, भले ही ये बातें सत्य न हों।


Most of these websites are usually government websites or private organizations that are paid, data collectors.
* '''डायरियों'''


* '''Blogs'''
वे व्यक्तिगत अभिलेख होते हैं और इसलिए शोधकर्ताओं द्वारा आंकड़ों के संग्रहण के लिए संभवतः ही कभी उनका उपयोग किया जाता है। इसके अतिरिक्त, डायरियां प्रायः  व्यक्तिगत होती हैं, सिवाय उन दिनों के जब लोग अब अपने जीवन की विशिष्ट घटनाओं वाली डायरियां सार्वजनिक रूप से साझा करते हैं।


Blogs are one of the most common online sources for data and may even be less authentic than websites. These days, practically everyone owns a blog, and a lot of people use these blogs to drive traffic to their website or make money through paid ads.
इसका एक सामान्य उदाहरण ऐनी फ्रैंक की डायरी है जिसमें नाजी युद्धों का सटीक अभिलेख था।
* '''सरकारी अभिलेख'''


Therefore, they cannot always be trusted. For example, a blogger may write good things about a product because he or she was paid to do so by the manufacturer even though these things are not true.
सरकारी अभिलेख गौण आंकड़ों का एक बहुत ही महत्वपूर्ण और प्रामाणिक स्रोत हैं। उनमें विपणन, प्रबंधन, मानविकी और सामाजिक विज्ञान अनुसंधान में उपयोगी जानकारी उपस्थित हैं।


* '''Diaries'''
इनमें से कुछ अभिलेखों में निम्नलिखित उपस्थित हैं; जनसंख्या आंकड़े, स्वास्थ्य अभिलेख, शिक्षा संस्थान अभिलेख आदि। इन्हें प्रायः उचित योजना बनाने, धन के आवंटन और परियोजनाओं को प्राथमिकता देने में सहायता के लिए एकत्र किया जाता है।


They are personal records and as such rarely used for data collection by researchers. Also, diaries are usually personal, except for these days when people now share public diaries containing specific events in their life.
* '''पॉडकास्ट'''


A common example of this is Anne Frank’s diary which contained an accurate record of the Nazi wars.
पॉडकास्ट इन दिनों धीरे-धीरे बहुत साधारणत होते जा रहे हैं और बहुत से लोग रेडियो के विकल्प के रूप में इन्हें सुनते हैं। वे लगभग ऑनलाइन रेडियो स्टेशनों की तरह हैं और बढ़ती लोकप्रियता उपलब्ध कर रहे हैं।


* '''Government Records'''
जानकारी साधारणतः पॉडकास्ट के दौरान साझा की जाती है, और श्रोता इसे आंकड़ों के संग्रहण के स्रोत के रूप में उपयोग कर सकते हैं।


Government records are a very important and authentic source of secondary data. They contain information useful in marketing, management, humanities, and social science research.
आंकड़ों के संग्रहण के कुछ अन्य स्रोत निम्नलिखित हैं:


Some of these records include; census data, health records, education institute records, etc. They are usually collected to aid proper planning, allocation of funds, and prioritizing of projects.
* पत्र
* रेडियो स्टेशन
* सार्वजनिक क्षेत्र के अभिलेख ।


* '''Podcasts'''
== गौण आंकड़ों के लाभ ==


Podcasts are gradually becoming very common these days, and a lot of people listen to them as an alternative to radio. They are more or less like online radio stations and are generating increasing popularity.
* '''अभिगम्यता की सहजता'''


Information is usually shared during podcasts, and listeners can use it as a source of data collection.
गौण आंकड़ों के अधिकांश स्रोत शोधकर्ताओं के लिए आसानी से उपलब्ध हैं। इनमें से अधिकांश स्रोतों को मोबाइल डिवाइस के माध्यम से ऑनलाइन पहुंचा जा सकता है। जिन लोगों के पास इंटरनेट तक पहुंच नहीं है वे प्रिंट के माध्यम से भी इंटरनेट तक पहुंच सकते हैं।


Some other sources of data collection include:
वे साधारणतः पुस्तकालयों, पुस्तक दुकानों में उपलब्ध होते हैं, और यहां तक कि अन्य लोगों से उधार भी लिए जा सकते हैं।


* Letters
* '''मितव्ययी'''
* Radio stations
* Public sector records.


== '''Advantages of Secondary Data''' ==
गौण आंकड़ों को प्राप्त करने के लिए लोगों को अधिकतर बहुत कम या बिना किसी लागत की आवश्यकता होती है। कई पुस्तकें, पत्रिकाएँ और पत्रिकाएँ निःशुल्क ऑनलाइन डाउनलोड की जा सकती हैं। जिन लोगों के पास इंटरनेट तक पहुंच नहीं है, वे भी सार्वजनिक पुस्तकालयों से मुफ्त में पुस्तकें उधार ले सकते हैं। शोधकर्ताओं को जाँच-पड़ताल पर पैसे खर्च करने की आवश्यकता नहीं है और अगर कोई पुस्तक खरीदनी भी है, तो उस पर बहुत कम खर्च करना पड़ता है।


* '''Ease of Access'''
* '''समय की बचत'''


Most of the sources of secondary data are easily accessible to researchers. Most of these sources can be accessed online through a mobile device.  People who do not have access to the internet can also access them through print.
गौण आंकड़ों को एकत्र करने में लगने वाला समय प्रायः प्राथमिक आंकड़ों की तुलना में बहुत कम होता है। गौण आंकड़ों के संग्रहण के लिए आवश्यक एकमात्र जांच आवश्यक आंकड़ों स्रोतों के स्रोत की प्रक्रिया है।


They are usually available in libraries, book stores, and can even be borrowed from other people.
इसलिए, सामान्यतः जांच पर खर्च होने वाले समय में कटौती की जा रही है। इससे शोधकर्ता के समय की पर्याप्त रूप से बचत होगी
* '''अनुदैर्ध्य एवं तुलनात्मक अध्ययन'''


* '''Inexpensive'''
गौण आंकड़ों से निष्कर्ष निकालने के लिए कुछ वर्षों तक प्रतीक्षा किए बिना अनुदैर्ध्य अध्ययन करना सरल हो जाता है। उदाहरण के लिए, आप 5 वर्ष पहले की जनगणना और अब के अनुसार देश की जनसंख्या की तुलना करना चाह सकते हैं।


Secondary data mostly require little to no cost for people to acquire them. Many books, journals, and magazines can be downloaded for free online.  Books can also be borrowed for free from public libraries by people who do not have access to the internet.
5 वर्षों तक प्रतीक्षा करने के बजाय, 5 वर्ष पहले की जनगणना और अब की जनगणना एकत्र करके तुलना आसानी से की जा सकती है।
* '''नई अंतर्दृष्टि उत्पन्न करना'''


Researchers do not have to spend money on investigations, and very little is spent on acquiring books if any.
आंकड़ों का पुनर्मूल्यांकन करते समय, विशेष रूप से किसी अन्य व्यक्ति के  तेजोजल या दृष्टिकोण से, नई चीजें उजागर होती हैं। हो सकता है कि कोई ऐसी चीज हो जो प्राथमिक आंकड़ों संग्रहकर्ता द्वारा अतीत में नहीं खोजी गई हो, जिसे गौण आंकड़ों  के संग्रहण प्रकट कर सकता है।


* '''Time-Saving'''
उदाहरण के लिए, जब ग्राहक, ग्राहक सेवा वर्ग से किसी ऐप का उपयोग करने में कठिनाई के बारे में दोषारोपण करते हैं, तो वे ग्राहकों को इसका उपयोग करने का उपाय सिखाने के लिए एक उपयोगकर्ता मार्गदर्शिका बनाने का निर्णय ले सकते हैं। हालाँकि, जब किसी उत्पाद डेवलपर के पास इस आंकड़े तक पहुँच होती है, तो यह पता चल सकता है कि समस्या UI/UX डिज़ाइन से आई है जिस पर काम करने की आवश्यकता है।


The time spent on collecting secondary data is usually very little compared to that of primary data. The only investigation necessary for secondary data collection is the process of sourcing for necessary data sources.
== गौण आंकड़ों के हानि ==


Therefore, cutting the time that would normally be spent on the investigation. This will save a significant amount of time for the researcher
* '''आंकड़ों की गुणवत्ता:'''


* '''Longitudinal and Comparative Studies'''
गौण स्रोतों के माध्यम से एकत्र किए गए आंकड़े उतना प्रामाणिक नहीं हो सकते  जितना सीधे स्रोत से एकत्र किए जाने पर होते हैं। ऑनलाइन स्रोतों के साथ यह एक बहुत ही साधारण हानि है क्योंकि साझा की जा रही सामग्री की निगरानी करने के लिए नियामक निकायों की कमी है।


Secondary data makes it easy to carry out longitudinal studies without having to wait for a couple of years to draw conclusions. For example, you may want to compare the country’s population according to census 5 years ago, and now.
इसलिए, इस प्रकार के आंकड़ों के साथ काम करने से किए जा रहे अनुसंधान पर नकारात्मक प्रभाव पड़ सकता है।
* '''अप्रासंगिक आंकड़े:'''


Rather than waiting for 5 years, the comparison can easily be made by collecting the census 5 years ago and now.
शोधकर्ता अंततः अप्रासंगिक आंकड़ों के एक पूल के माध्यम से सर्फिंग करने में बहुत समय बिताते हैं, इससे पहले कि उन्हें जो चाहिए वह मिल जाए। इसका कारण यह है कि आंकड़े मुख्यतः शोधकर्ता के लिए एकत्र नहीं किए गए थे।


* '''Generating new insights'''
कुछ परिस्थितियों में, एक शोधकर्ता को वह सटीक आंकड़ा भी नहीं मिल पाता जिसकी उसे आवश्यकता है, परंतु उसे अगले सर्वोत्तम विकल्प के लिए समझौता करना पड़ता है।
* '''अतिशयोक्तिपूर्ण आंकड़े:'''


When re-evaluating data, especially through another person’s lens or point of view, new things are uncovered. There might be a thing that wasn’t discovered in the past by the primary data collector, that secondary data collection may reveal.
कुछ आंकड़े स्रोत साझा की जा रही जानकारी को बढ़ा-चढ़ाकर पेश करने के लिए जाने जाते हैं। यह पूर्वाग्रह अच्छी सार्वजनिक छवि बनाए रखने के लिए या किसी भुगतान किए गए विज्ञापन के कारण हो सकता है।


For example, when customers complain about difficulty using an app to the customer service team, they may decide to create a user guide teaching customers how to use it. However, when a product developer has access to this data, it may be uncovered that the issue came from and UI/UX design that needs to be worked on.
यह कई ऑनलाइन ब्लॉगों में बहुत साधारण है जो मात्र वेब ट्रैफ़िक उपलब्ध करने के लिए गलत जानकारी साझा करने की सीमा तक चले जाते हैं। उदाहरण के लिए, एक फिनटेक स्टार्टअप अधिक ग्राहकों को आकर्षित करने के लिए अपने द्वारा संसाधित किए गए धन की मात्रा को बढ़ा-चढ़ाकर बता सकता है।


== '''Disadvantages of Secondary Data''' ==
तिमाही के लिए अमेरिका में फिनटेक स्टार्टअप द्वारा संसाधित कुल धन की जांच करने के लिए यह आंकड़े एकत्र करने वाले एक शोधकर्ता को इस अतिरंजित आंकड़े का उपयोग करना पड़ सकता है।
* '''अप्रचलित जानकारी:'''


* '''Data Quality:'''
कुछ आंकड़े स्रोत अप्रचलित/पुराने हो चुके हैं और पुराने स्रोतों के स्थान पर कोई नया आंकड़ा उपलब्ध नहीं है। उदाहरण के लिए, राष्ट्रीय जनगणना को प्रायः वार्षिक रूप से अद्यतन नहीं किया जाता है।


The data collected through secondary sources may not be as authentic as when collected directly from the source. This is a very common disadvantage with online sources due to a lack of regulatory bodies to monitor the kind of content that is being shared.
इसलिए, पिछली जनगणना के बाद से देश की जनसंख्या में परिवर्तन हुए हैं। हालाँकि, देश की जनसंख्या के साथ काम करने वाले किसी व्यक्ति को पहले दर्ज किए गए आंकड़े से ही संतुष्ट होना होगा, भले ही वह पुराना हो।


Therefore, working with this kind of data may have negative effects on the research being carried out.
== निष्कर्ष ==
गौण आंकड़ों का अनुसंधान, व्यवसाय और सांख्यिकी में विभिन्न उपयोग होता है। शोधकर्ता विभिन्न कारणों से गौण आंकड़े चुनते हैं, जिनमें से कुछ कीमत, उपलब्धता या यहां तक कि शोध की आवश्यकताओं के कारण भी होते हैं।


* '''Irrelevant Data:'''
यद्यपि अप्रचलित गौण आंकड़े कुछ स्थितियों में आंकड़ों का एकमात्र स्रोत हो सकता है। यह शोध करने की भारी लागत या किसी विशेष निकाय (जैसे राष्ट्रीय जनगणना) को सौंपे जाने के कारण हो सकता है।


Researchers spend so much time surfing through a pool of irrelevant data before finally getting the one they need. This is because the data was not collected mainly for the researcher.
संक्षेप में, गौण आंकड़ों की अपनी कमियाँ हैं, जो शोध के परिणाम को नकारात्मक रूप से प्रभावित कर सकती हैं और प्राथमिक आंकड़ों की तुलना में कुछ लाभ भी देती हैं। यह सब स्थिति, संबंधित शोधकर्ता और किए जा रहे शोध के प्रकार पर निर्भर करता है।


In some cases, a researcher may not even find the exact data he or she needs, but have to settle for the next best alternative.


* '''Exaggerated Data'''


Some data sources are known to exaggerate the information that is being shared. This bias may be some to maintain a good public image or due to a paid advert.


This is very common with many online blogs that even go a bead to share false information just to gain web traffic. For example, a FinTech startup may exaggerate the amount of money it has processed just to attract more customers.
  [[Category:सांख्यिकी]][[Category:कक्षा-9]][[Category:गणित]]
 
A researcher gathering this data to investigate the total amount of money processed by FinTech startups in the US for the quarter may have to use this exaggerated data.
 
* '''Outdated Information'''
 
Some of the data sources are outdated and there are no new available data to replace the old ones. For example, the national census is not usually updated yearly.
 
Therefore, there have been changes in the country’s population since the last census. However, someone working with the country’s population will have to settle for the previously recorded figure even though it is outdated.
 
== '''Conclusion''' ==
Secondary data has various uses in research, business, and statistics. Researchers choose secondary data for different reasons, with some of it being due to price, availability, or even needs of the research.
 
Although old, secondary data may be the only source of data in some cases. This may be due to the huge cost of performing research or due to its delegation to a particular body (e.g. national census).
 
In short, secondary data has its shortcomings, which may affect the outcome of the research negatively and also some advantages over primary data. It all depends on the situation, the researcher in question, and the kind of research being carried out.
 
 
 
गौण आंकडों से तात्पर्य उस आंकड़े से है जो प्राथमिक उपयोगकर्ता के अलावा किसी अन्य व्यक्ति द्वारा पहले एकत्र किया गया है। सामाजिक विज्ञान के लिए गौण आंकडों के सामान्य स्रोतों में जनगणना, सरकारी विभागों द्वारा एकत्र की गई जानकारी, संगठनात्मक रिकॉर्ड और अन्य शोध उद्देश्यों के लिए मूल रूप से एकत्र किया गया आंकड़े सम्मिलित हैं। इसके विपरीत, प्राथमिक आंकडों का शोध करने वाले अन्वेषक द्वारा एकत्र किया जाता है।
 
गौण आंकडों के कुछ मुख्य बिंदुओं का उल्लेख नीचे दी गई तालिका में किया गया है।
[[Category:सांख्यिकी]][[Category:कक्षा-9]][[Category:गणित]]
{| class="wikitable"
|आंकड़े
|भूतपूर्व आँकड़े
|-
|प्रक्रिया
|त्वरित और सरल
|-
|स्रोत
|सरकारी प्रकाशन, वेबसाइट, पुस्तकें, जर्नल लेख, आंतरिक रिकॉर्ड आदि।
|-
|लागत प्रभाविता
|अल्पव्ययी
|-
|संग्रहकाल
|लघु
|-
|विशिष्ट
|शोधकर्ता की आवश्यकता के लिए विशिष्ट हो भी सकता है और नहीं भी
|-
|उपलब्धता
|परिष्कृत रूप
|-
|परिशुद्धता और विश्वसनीयता
|अपेक्षाकृत कम
|}

Latest revision as of 10:54, 15 October 2024

गौण आंकड़े दो मुख्य प्रकार के आंकड़ों में से एक है, जहाँ दूसरा प्रकार प्राथमिक आंकड़ा है। ये दो आंकड़ों के प्रकार अनुसंधान और सांख्यिकी में बहुत उपयोगी हैं

हम गौण आंकड़े, इसके उदाहरण, स्रोत और विश्लेषण के तरीकों का अध्ययन करेंगे।

गौण आंकड़े क्या है?

गौण आंकड़े वह आंकड़े हैं जो प्राथमिक स्रोतों के माध्यम से पहले से ही एकत्र किया गया है और शोधकर्ताओं को अपने स्वयं के शोध के लिए उपयोग करने के लिए आसानी से उपलब्ध कराया गया है। यह एक प्रकार का आंकड़ा है जो पहले से ही अतीत में एकत्र किया गया है।

एक शोधकर्ता ने किसी विशेष परियोजना के लिए आंकड़ा एकत्र किया हो सकता है, फिर इसे किसी अन्य शोधकर्ता द्वारा उपयोग करने के लिए उपलब्ध कराया हो सकता है। आंकड़े को राष्ट्रीय जनगणना की तरह बिना किसी विशिष्ट शोध उद्देश्य के सामान्य उपयोग के लिए भी एकत्र किया जा सकता है।

किसी विशेष शोध के लिए गौण के रूप में वर्गीकृत आंकड़े को किसी अन्य शोध के लिए प्राथमिक कहा जा सकता है। यह तब होता है जब आंकड़े का पुन: उपयोग किया जा रहा हो, जिससे यह पहले शोध के लिए प्राथमिक आंकड़े बन जाते हैं और दूसरे शोध के लिए गौण आंकड़े बन जाते हैं जिसके लिए इसका उपयोग किया जा रहा है।

गौण आंकड़ों के स्रोत

गौण आंकड़ों के स्रोतों में पुस्तकें, व्यक्तिगत स्रोत, पत्रिकाएँ, समाचार पत्र, वेबसाइट, सरकारी अभिलेख आदि उपस्थित हैं। गौण आंकड़े, प्राथमिक आंकड़े की तुलना में आसानी से उपलब्ध होने के लिए जाने जाते हैं। इन स्रोतों का उपयोग करने के लिए बहुत कम शोध की आवश्यकता होती है और जनशक्ति की आवश्यकता होती है।

इलेक्ट्रॉनिक मीडिया और इंटरनेट के आगमन के साथ, गौण आंकड़ों के स्रोत अधिक आसानी से सुलभ हो गए हैं। इनमें से कुछ स्रोतों पर नीचे प्रकाश डाला गया है।

  • पुस्तकें

पुस्तकें आंकड़े एकत्र करने के सबसे पारंपरिक उपायों में से एक हैं। आज, हम जितने भी विषयों के बारे में सोच सकते हैं, उन सभी के लिए किताबें उपलब्ध हैं। शोध करते समय, हमें मात्र शोध किए जा रहे विषय पर एक पुस्तक की तलाश करनी है, फिर उस क्षेत्र में पुस्तकों के उपलब्ध भंडार में से चयन करना है। पुस्तकें, जब सावधानीपूर्वक चुनी जाती हैं, प्रामाणिक आंकड़ों का एक प्रामाणिक स्रोत होता है और साहित्य समीक्षा तैयार करने में उपयोगी हो सकती हैं।

  • प्रकाशित स्रोत

विभिन्न शोध विषयों के लिए विभिन्न प्रकार के प्रकाशित स्रोत उपलब्ध हैं। इन स्रोतों से उत्पन्न आंकड़े की प्रामाणिकता मुख्य रूप से लेखक और प्रकाशन कंपनी पर निर्भर करती है।

प्रकाशित स्रोत मुद्रित या इलेक्ट्रॉनिक हो सकते हैं, जैसी भी स्थिति हो। लेखक और प्रकाशन कंपनी के निर्णय के आधार पर वे सशुल्क या निःशुल्क हो सकते हैं।

  • अप्रकाशित व्यक्तिगत स्रोत

प्रकाशित स्रोतों की तुलना में यह आसानी से उपलब्ध और सुलभ नहीं हो सकता है। वे केवल तभी सुलभ होते हैं जब शोधकर्ता उन्हें किसी अन्य शोधकर्ता के साथ साझा करता है, जिसे उन्हें किसी तीसरे पक्ष के साथ साझा करने की अनुमति नहीं है।

उदाहरण के लिए, किसी संगठन की उत्पाद प्रबंधन वर्ग को यह आकलन करने के लिए ग्राहक प्रतिक्रिया पर आंकड़े की आवश्यकता हो सकती है कि ग्राहक उनके उत्पाद और सुधार सुझावों के बारे में क्या सोचते हैं। उन्हें ग्राहक सेवा विभाग से आंकड़े एकत्र करने की आवश्यकता होगी, जो मुख्य रूप से ग्राहक सेवा को बेहतर बनाने के लिए आंकड़े एकत्र करता है।

  • पत्रिका

जब आंकड़ों के संग्रहण की बात आती है तो पत्रिकाएँ इन दिनों धीरे-धीरे पुस्तकों से अधिक महत्वपूर्ण होती जा रही हैं। ऐसा इसलिए है क्योंकि पत्रिकाओं को नियमित रूप से समय-समय पर नए प्रकाशनों के साथ अद्यतन किया जाता है, इसलिए नवीनतम जानकारी मिलती है।

इसके अलावा, जब शोध की बात आती है तो पत्रिकाएँ साधारणतः अधिक विशिष्ट होती हैं। उदाहरण के लिए, हम "गौण आंकड़ों के लिए गौण आंकड़ों का संग्रहण" पर एक पत्रिका रख सकते हैं, जबकि एक पुस्तक का शीर्षक केवल "गौण आंकड़ों का संग्रहण" होगा।

  • समाचार पत्र

अधिकांश परिस्थितियों में, समाचार पत्र के माध्यम से पारित जानकारी प्रायः बहुत विश्वसनीय होती है। इसलिए, यह गौण आंकड़े एकत्र करने के सबसे प्रामाणिक स्रोतों में से एक बन गया है।

समाचार पत्र में साधारणतः साझा किए जाने वाले आंकड़े प्रायः वैज्ञानिक से ज़्यादा राजनीतिक, आर्थिक और शैक्षिक होते हैं। इसलिए, समाचार-पत्र वैज्ञानिक आंकड़ों के संग्रहण के लिए सर्वोत्तम स्रोत नहीं हो सकते हैं।

  • वेबसाइटें

वेबसाइटों पर साझा की गई जानकारी अधिकांशतः विनियमित नहीं होती है और इसलिए अन्य स्रोतों की तुलना में इस पर विश्वास नहीं किया जा सकता है। हालाँकि, कुछ विनियमित वेबसाइटें हैं जो केवल प्रामाणिक आंकड़े साझा करती हैं और शोधकर्ताओं द्वारा उन पर विश्वास किया जा सकता है।

इनमें से अधिकांश वेबसाइटें प्रायः सरकारी वेबसाइटें या निजी संगठन होते हैं जिन्हें भुगतान किया जाता है, आंकड़ों के संग्रहकर्ता।

  • ब्लॉग्स

ब्लॉग आंकड़ों के लिए सबसे साधारणतः ऑनलाइन स्रोतों में से एक हैं और वेबसाइटों की तुलना में कम प्रामाणिक भी हो सकते हैं। आजकल, व्यावहारिक रूप से हर किसी के पास एक ब्लॉग है, और बहुत से लोग इन ब्लॉग का उपयोग अपनी वेबसाइट पर ट्रैफ़िक लाने या सशुल्क विज्ञापनों के माध्यम से पैसे कमाने के लिए करते हैं।

इसलिए, उन पर सदैव विश्वास नहीं किया जा सकता है। उदाहरण के लिए, एक ब्लॉगर किसी उत्पाद के बारे में अच्छी बातें लिख सकता है क्योंकि उसे निर्माता द्वारा ऐसा करने के लिए भुगतान किया गया था, भले ही ये बातें सत्य न हों।

  • डायरियों

वे व्यक्तिगत अभिलेख होते हैं और इसलिए शोधकर्ताओं द्वारा आंकड़ों के संग्रहण के लिए संभवतः ही कभी उनका उपयोग किया जाता है। इसके अतिरिक्त, डायरियां प्रायः व्यक्तिगत होती हैं, सिवाय उन दिनों के जब लोग अब अपने जीवन की विशिष्ट घटनाओं वाली डायरियां सार्वजनिक रूप से साझा करते हैं।

इसका एक सामान्य उदाहरण ऐनी फ्रैंक की डायरी है जिसमें नाजी युद्धों का सटीक अभिलेख था।

  • सरकारी अभिलेख

सरकारी अभिलेख गौण आंकड़ों का एक बहुत ही महत्वपूर्ण और प्रामाणिक स्रोत हैं। उनमें विपणन, प्रबंधन, मानविकी और सामाजिक विज्ञान अनुसंधान में उपयोगी जानकारी उपस्थित हैं।

इनमें से कुछ अभिलेखों में निम्नलिखित उपस्थित हैं; जनसंख्या आंकड़े, स्वास्थ्य अभिलेख, शिक्षा संस्थान अभिलेख आदि। इन्हें प्रायः उचित योजना बनाने, धन के आवंटन और परियोजनाओं को प्राथमिकता देने में सहायता के लिए एकत्र किया जाता है।

  • पॉडकास्ट

पॉडकास्ट इन दिनों धीरे-धीरे बहुत साधारणत होते जा रहे हैं और बहुत से लोग रेडियो के विकल्प के रूप में इन्हें सुनते हैं। वे लगभग ऑनलाइन रेडियो स्टेशनों की तरह हैं और बढ़ती लोकप्रियता उपलब्ध कर रहे हैं।

जानकारी साधारणतः पॉडकास्ट के दौरान साझा की जाती है, और श्रोता इसे आंकड़ों के संग्रहण के स्रोत के रूप में उपयोग कर सकते हैं।

आंकड़ों के संग्रहण के कुछ अन्य स्रोत निम्नलिखित हैं:

  • पत्र
  • रेडियो स्टेशन
  • सार्वजनिक क्षेत्र के अभिलेख ।

गौण आंकड़ों के लाभ

  • अभिगम्यता की सहजता

गौण आंकड़ों के अधिकांश स्रोत शोधकर्ताओं के लिए आसानी से उपलब्ध हैं। इनमें से अधिकांश स्रोतों को मोबाइल डिवाइस के माध्यम से ऑनलाइन पहुंचा जा सकता है। जिन लोगों के पास इंटरनेट तक पहुंच नहीं है वे प्रिंट के माध्यम से भी इंटरनेट तक पहुंच सकते हैं।

वे साधारणतः पुस्तकालयों, पुस्तक दुकानों में उपलब्ध होते हैं, और यहां तक कि अन्य लोगों से उधार भी लिए जा सकते हैं।

  • मितव्ययी

गौण आंकड़ों को प्राप्त करने के लिए लोगों को अधिकतर बहुत कम या बिना किसी लागत की आवश्यकता होती है। कई पुस्तकें, पत्रिकाएँ और पत्रिकाएँ निःशुल्क ऑनलाइन डाउनलोड की जा सकती हैं। जिन लोगों के पास इंटरनेट तक पहुंच नहीं है, वे भी सार्वजनिक पुस्तकालयों से मुफ्त में पुस्तकें उधार ले सकते हैं। शोधकर्ताओं को जाँच-पड़ताल पर पैसे खर्च करने की आवश्यकता नहीं है और अगर कोई पुस्तक खरीदनी भी है, तो उस पर बहुत कम खर्च करना पड़ता है।

  • समय की बचत

गौण आंकड़ों को एकत्र करने में लगने वाला समय प्रायः प्राथमिक आंकड़ों की तुलना में बहुत कम होता है। गौण आंकड़ों के संग्रहण के लिए आवश्यक एकमात्र जांच आवश्यक आंकड़ों स्रोतों के स्रोत की प्रक्रिया है।

इसलिए, सामान्यतः जांच पर खर्च होने वाले समय में कटौती की जा रही है। इससे शोधकर्ता के समय की पर्याप्त रूप से बचत होगी

  • अनुदैर्ध्य एवं तुलनात्मक अध्ययन

गौण आंकड़ों से निष्कर्ष निकालने के लिए कुछ वर्षों तक प्रतीक्षा किए बिना अनुदैर्ध्य अध्ययन करना सरल हो जाता है। उदाहरण के लिए, आप 5 वर्ष पहले की जनगणना और अब के अनुसार देश की जनसंख्या की तुलना करना चाह सकते हैं।

5 वर्षों तक प्रतीक्षा करने के बजाय, 5 वर्ष पहले की जनगणना और अब की जनगणना एकत्र करके तुलना आसानी से की जा सकती है।

  • नई अंतर्दृष्टि उत्पन्न करना

आंकड़ों का पुनर्मूल्यांकन करते समय, विशेष रूप से किसी अन्य व्यक्ति के तेजोजल या दृष्टिकोण से, नई चीजें उजागर होती हैं। हो सकता है कि कोई ऐसी चीज हो जो प्राथमिक आंकड़ों संग्रहकर्ता द्वारा अतीत में नहीं खोजी गई हो, जिसे गौण आंकड़ों के संग्रहण प्रकट कर सकता है।

उदाहरण के लिए, जब ग्राहक, ग्राहक सेवा वर्ग से किसी ऐप का उपयोग करने में कठिनाई के बारे में दोषारोपण करते हैं, तो वे ग्राहकों को इसका उपयोग करने का उपाय सिखाने के लिए एक उपयोगकर्ता मार्गदर्शिका बनाने का निर्णय ले सकते हैं। हालाँकि, जब किसी उत्पाद डेवलपर के पास इस आंकड़े तक पहुँच होती है, तो यह पता चल सकता है कि समस्या UI/UX डिज़ाइन से आई है जिस पर काम करने की आवश्यकता है।

गौण आंकड़ों के हानि

  • आंकड़ों की गुणवत्ता:

गौण स्रोतों के माध्यम से एकत्र किए गए आंकड़े उतना प्रामाणिक नहीं हो सकते जितना सीधे स्रोत से एकत्र किए जाने पर होते हैं। ऑनलाइन स्रोतों के साथ यह एक बहुत ही साधारण हानि है क्योंकि साझा की जा रही सामग्री की निगरानी करने के लिए नियामक निकायों की कमी है।

इसलिए, इस प्रकार के आंकड़ों के साथ काम करने से किए जा रहे अनुसंधान पर नकारात्मक प्रभाव पड़ सकता है।

  • अप्रासंगिक आंकड़े:

शोधकर्ता अंततः अप्रासंगिक आंकड़ों के एक पूल के माध्यम से सर्फिंग करने में बहुत समय बिताते हैं, इससे पहले कि उन्हें जो चाहिए वह मिल जाए। इसका कारण यह है कि आंकड़े मुख्यतः शोधकर्ता के लिए एकत्र नहीं किए गए थे।

कुछ परिस्थितियों में, एक शोधकर्ता को वह सटीक आंकड़ा भी नहीं मिल पाता जिसकी उसे आवश्यकता है, परंतु उसे अगले सर्वोत्तम विकल्प के लिए समझौता करना पड़ता है।

  • अतिशयोक्तिपूर्ण आंकड़े:

कुछ आंकड़े स्रोत साझा की जा रही जानकारी को बढ़ा-चढ़ाकर पेश करने के लिए जाने जाते हैं। यह पूर्वाग्रह अच्छी सार्वजनिक छवि बनाए रखने के लिए या किसी भुगतान किए गए विज्ञापन के कारण हो सकता है।

यह कई ऑनलाइन ब्लॉगों में बहुत साधारण है जो मात्र वेब ट्रैफ़िक उपलब्ध करने के लिए गलत जानकारी साझा करने की सीमा तक चले जाते हैं। उदाहरण के लिए, एक फिनटेक स्टार्टअप अधिक ग्राहकों को आकर्षित करने के लिए अपने द्वारा संसाधित किए गए धन की मात्रा को बढ़ा-चढ़ाकर बता सकता है।

तिमाही के लिए अमेरिका में फिनटेक स्टार्टअप द्वारा संसाधित कुल धन की जांच करने के लिए यह आंकड़े एकत्र करने वाले एक शोधकर्ता को इस अतिरंजित आंकड़े का उपयोग करना पड़ सकता है।

  • अप्रचलित जानकारी:

कुछ आंकड़े स्रोत अप्रचलित/पुराने हो चुके हैं और पुराने स्रोतों के स्थान पर कोई नया आंकड़ा उपलब्ध नहीं है। उदाहरण के लिए, राष्ट्रीय जनगणना को प्रायः वार्षिक रूप से अद्यतन नहीं किया जाता है।

इसलिए, पिछली जनगणना के बाद से देश की जनसंख्या में परिवर्तन हुए हैं। हालाँकि, देश की जनसंख्या के साथ काम करने वाले किसी व्यक्ति को पहले दर्ज किए गए आंकड़े से ही संतुष्ट होना होगा, भले ही वह पुराना हो।

निष्कर्ष

गौण आंकड़ों का अनुसंधान, व्यवसाय और सांख्यिकी में विभिन्न उपयोग होता है। शोधकर्ता विभिन्न कारणों से गौण आंकड़े चुनते हैं, जिनमें से कुछ कीमत, उपलब्धता या यहां तक कि शोध की आवश्यकताओं के कारण भी होते हैं।

यद्यपि अप्रचलित गौण आंकड़े कुछ स्थितियों में आंकड़ों का एकमात्र स्रोत हो सकता है। यह शोध करने की भारी लागत या किसी विशेष निकाय (जैसे राष्ट्रीय जनगणना) को सौंपे जाने के कारण हो सकता है।

संक्षेप में, गौण आंकड़ों की अपनी कमियाँ हैं, जो शोध के परिणाम को नकारात्मक रूप से प्रभावित कर सकती हैं और प्राथमिक आंकड़ों की तुलना में कुछ लाभ भी देती हैं। यह सब स्थिति, संबंधित शोधकर्ता और किए जा रहे शोध के प्रकार पर निर्भर करता है।