Competitive Exam Level Maths: Statistics (सांख्यिकी) Complete Notes
Statistics (सांख्यिकी) गणित की वह शाखा है जो डेटा (आँकड़ों) के संग्रह, विश्लेषण, व्याख्या और प्रस्तुति से संबंधित है। प्रतियोगी परीक्षाओं जैसे UPSC CSAT, SSC CGL, Railway NTPC, Banking और State PSC में सांख्यिकी का महत्व लगातार बढ़ रहा है। पहले सांख्यिकी को केवल शैक्षणिक स्तर तक सीमित माना जाता था, लेकिन अब डेटा विश्लेषण (Data Analysis) के बढ़ते प्रभाव के कारण इससे संबंधित प्रश्न बहुतायत में पूछे जाते हैं। इस अध्याय में हम माध्य (Mean), माध्यिका (Median), बहुलक (Mode), परिसर (Range), विचरण (Variance) और मानक विचलन (Standard Deviation) जैसे विषयों को गहराई से समझेंगे। यह नोट्स विशेष रूप से सरकारी नौकरी की तैयारी करने वाले छात्रों के लिए तैयार किए गए हैं ताकि वे जटिल गणनाओं को सरल शॉर्टकट ट्रिक्स के माध्यम से हल कर सकें।
1. अध्याय का परिचय (Introduction to Statistics)
सांख्यिकी का मुख्य उद्देश्य बिखरे हुए डेटा को एक सार्थक रूप देना है। जब हम किसी समूह की औसत आयु निकालते हैं या किसी कंपनी के मुनाफे का रुझान देखते हैं, तो हम वास्तव में सांख्यिकी का उपयोग कर रहे होते हैं। प्रतियोगी परीक्षाओं के नजरिए से सांख्यिकी को दो मुख्य भागों में बांटा जा सकता है: केन्द्रीय प्रवृत्ति के माप (Measures of Central Tendency) और विक्षेपण के माप (Measures of Dispersion)।
केन्द्रीय प्रवृत्ति के माप हमें यह बताते हैं कि डेटा का केंद्र कहाँ स्थित है (माध्य, माध्यिका, बहुलक), जबकि विक्षेपण के माप हमें यह बताते हैं कि डेटा अपने केंद्र से कितना फैला हुआ है (मानक विचलन, विचरण)। सांख्यिकी के प्रश्नों को हल करने के लिए आपको बुनियादी अंकगणित और तर्कशक्ति की आवश्यकता होती है। 2026 की परीक्षाओं के ट्रेंड के अनुसार, अब सीधे सूत्रों के बजाय वैचारिक (Conceptual) प्रश्न अधिक पूछे जा रहे हैं।
2. मुख्य परिभाषाएँ
- Data (आँकड़े): किसी विशेष उद्देश्य के लिए एकत्रित की गई संख्यात्मक सूचनाएँ। ये प्राथमिक (Primary) या द्वितीयक (Secondary) हो सकती हैं।
- Mean (माध्य): इसे ‘औसत’ भी कहा जाता है। यह सभी टिप्पणियों के योग को उनकी कुल संख्या से भाग देने पर प्राप्त होता है।
- Median (माध्यिका): जब डेटा को आरोही (Ascending) या अवरोही (Descending) क्रम में व्यवस्थित किया जाता है, तो बीच वाली संख्या माध्यिका कहलाती है।
- Mode (बहुलक): डेटा के सेट में वह संख्या जो सबसे अधिक बार आती है।
- Range (परिसर): डेटा के सबसे बड़े और सबसे छोटे मान के बीच का अंतर।
- Frequency (बारंबारता): कोई विशेष डेटा मान कितनी बार दोहराया गया है।
3. मुख्य सूत्र / नियम
(जहाँ \sum x_i सभी पदों का योग है और n पदों की कुल संख्या है)
यदि n विषम (Odd) है:
यदि n सम (Even) है:
(यह सूत्र प्रतियोगी परीक्षाओं के लिए अत्यंत महत्वपूर्ण है)
4. विस्तृत व्याख्या (Detailed Explanation)
4.1 केंद्रीय प्रवृत्ति के माप (Central Tendency)
सांख्यिकी में केंद्रीय प्रवृत्ति वह मान है जो पूरे डेटा सेट का प्रतिनिधित्व करता है।
- Mean: यह सटीक होता है लेकिन बहुत बड़े या बहुत छोटे मानों (Outliers) से प्रभावित हो जाता है।
- Median: यह आउटलेयर्स से प्रभावित नहीं होता। यदि हमें किसी क्षेत्र के निवासियों की ‘विशिष्ट’ आय देखनी हो, तो माध्यिका अधिक उपयोगी होती है।
- Mode: यह सबसे लोकप्रिय मान को दर्शाता है। जैसे जूते बनाने वाली कंपनी यह देखती है कि किस नंबर का जूता सबसे ज्यादा बिकता है (बहुलक)।
4.2 विक्षेपण के माप (Measures of Dispersion)
केवल औसत जानने से डेटा की पूरी तस्वीर स्पष्ट नहीं होती। मान लीजिए दो क्रिकेटरों का औसत 50 है, लेकिन एक हर मैच में 40-60 बनाता है और दूसरा कभी 0 तो कभी 100। यहाँ विचरण (Variance) काम आता है।
- Variance (विचरण): यह माध्य से डेटा के वर्गों के अंतर का औसत है। सूत्र: \sigma^2 = \frac{\sum (x_i – \bar{x})^2}{n}
- Standard Deviation (मानक विचलन): यह विचरण का वर्गमूल (\sigma) है। यह डेटा की स्थिरता (Stability) को मापने का सबसे अच्छा तरीका है।
5. उदाहरण सहित समझाइए (Step-by-Step Examples)
उदाहरण 1: नीचे दिए गए डेटा का माध्य, माध्यिका और बहुलक ज्ञात करें:
7, 4, 10, 9, 15, 4, 7, 4
हल:
1. माध्य (Mean):
2. माध्यिका (Median):
क्रम में व्यवस्थित करें: 4, 4, 4, 7, 7, 9, 10, 15
यहाँ n=8 (सम) है।
3. बहुलक (Mode):
यहाँ संख्या ‘4’ सबसे अधिक 3 बार आई है। अतः Mode = 4।
उदाहरण 2: यदि किसी डेटा का माध्य 12 और माध्यिका 15 है, तो बहुलक क्या होगा?
हल:
सूत्र का उपयोग करें: \text{Mode} = 3 \times \text{Median} – 2 \times \text{Mean}
\text{Mode} = 3 \times 15 – 2 \times 12
\text{Mode} = 45 – 24 = 21
6. महत्वपूर्ण बिंदु
- यदि डेटा के प्रत्येक पद में k जोड़ दिया जाए, तो नया माध्य भी \bar{x} + k हो जाता है।
- बहुलक एक से अधिक भी हो सकते हैं (Bimodal या Multimodal)।
- समांतर माध्य हमेशा गुणोत्तर माध्य (GM) और हरात्मक माध्य (HM) से बड़ा या बराबर होता है (AM \ge GM \ge HM)।
- माध्यिका निकालते समय डेटा को क्रमबद्ध करना कभी न भूलें।
- मानक विचलन कभी भी ऋणात्मक (Negative) नहीं हो सकता।
7. याद रखने की ट्रिक
1. “MMM” Trick:
Mean = Average (सबका साथ सबका विकास)
Median = Middle (बीच वाला बंदर)
Mode = Most (जो सबसे ज्यादा दिखे)
2. Empirical Formula Trick:
सूत्र “Mode = 3 Median – 2 Mean” को याद रखने के लिए देखें कि ‘Median’ शब्द ‘Mean’ से बड़ा है, इसलिए इसके साथ बड़ा अंक ‘3’ आएगा।
3. Standard Deviation:
हमेशा याद रखें: Standard Deviation = \sqrt{\text{Variance}}। परीक्षा में अक्सर विचरण देकर मानक विचलन पूछा जाता है, बस वर्गमूल निकाल दें।
8. Formula Section (Advanced)
- Mean Deviation about Mean: MD = \frac{\sum |x_i – \bar{x}|}{n}
- Coefficient of Variation (विचरण गुणांक): CV = \frac{\sigma}{\bar{x}} \times 100
- Range: L – S (Largest – Smallest)
- Interquartile Range: Q_3 – Q_1
9. प्रश्न और उत्तर (Short + Long)
Short Answer Questions
- प्रश्न: प्रथम 10 प्राकृतिक संख्याओं का माध्य क्या है?
उत्तर: प्रथम n संख्याओं का माध्य \frac{n+1}{2} होता है। अतः \frac{10+1}{2} = 5.5।
- प्रश्न: विचरण का गुणांक (CV) क्या दर्शाता है?
उत्तर: यह डेटा की सापेक्ष परिवर्तनशीलता (Relative Variability) को दर्शाता है। जिसका CV कम होता है, वह डेटा अधिक स्थिर (Consistent) माना जाता है।
Long Answer Questions
- प्रश्न: सांख्यिकी में ‘मानक विचलन’ (Standard Deviation) का महत्व स्पष्ट करें।
उत्तर: मानक विचलन यह मापता है कि डेटा अपने माध्य से कितना फैला हुआ है। वित्तीय विश्लेषण में इसे ‘जोखिम’ (Risk) के रूप में देखा जाता है। उदाहरण के लिए, यदि दो स्टॉक का औसत रिटर्न समान है, तो कम मानक विचलन वाला स्टॉक कम जोखिम भरा और अधिक विश्वसनीय माना जाएगा। यह डेटा की गुणवत्ता और स्थिरता की पहचान करने में मदद करता है।
- प्रश्न: वर्गीकृत डेटा (Grouped Data) के लिए माध्यिका कैसे निकाली जाती है?
उत्तर: इसके लिए सबसे पहले संचयी बारंबारता (Cumulative Frequency) निकाली जाती है। फिर \frac{n}{2} से माध्यिका वर्ग (Median Class) की पहचान की जाती है। सूत्र: L + \frac{\frac{n}{2} – cf}{f} \times h का उपयोग किया जाता है, जहाँ L निचली सीमा, cf पूर्ववर्ती संचयी बारंबारता, f आवृत्ति और h वर्ग अंतराल है।
10. परीक्षा के लिए महत्वपूर्ण प्रश्न
- यदि 5, 10, 15, x, 20 का माध्य 15 है, तो x का मान ज्ञात करें।
- एक डेटा सेट का विचरण 144 है, इसका मानक विचलन क्या होगा?
- बहुलक और माध्यिका के बीच का अंतर 12 है, तो माध्यिका और माध्य के बीच का अंतर ज्ञात करें।
- प्रसरण (Variance) की गणना करते समय वर्ग (Square) क्यों किया जाता है?
11. सारांश (Summary)
सांख्यिकी (Statistics) न केवल प्रतियोगी परीक्षाओं का एक हिस्सा है, बल्कि यह निर्णय लेने की एक शक्तिशाली तकनीक है। इस अध्याय में हमने माध्य, माध्यिका और बहुलक के बुनियादी सिद्धांतों को समझा, जो केंद्रीय प्रवृत्ति के स्तंभ हैं। इसके साथ ही हमने मानक विचलन और विचरण के माध्यम से डेटा के बिखराव को समझना सीखा। किसी भी परीक्षा में सांख्यिकी के प्रश्नों को सफलतापूर्वक हल करने की कुंजी नियमित अभ्यास और सूत्रों का सही अनुप्रयोग है। विशेष रूप से SSC और Railway की परीक्षाओं में ‘Mean, Median, Mode’ के आपसी संबंधों पर आधारित सवाल सीधे पूछे जाते हैं। इन नोट्स का उपयोग करके आप अपनी तैयारी को और अधिक प्रभावी बना सकते हैं। डेटा को डिकोड करना सीखें, क्योंकि भविष्य डेटा का ही है।
12. FAQs (अक्सर पूछे जाने वाले प्रश्न)
Q1. क्या माध्यिका हमेशा डेटा के सेट में मौजूद एक संख्या होती है?
नहीं, यदि पदों की संख्या सम (Even) है, तो माध्यिका दो मध्य पदों का औसत होती है, जो सेट में न भी हो।
Q2. माध्य, माध्यिका और बहुलक कब समान होते हैं?
एक ‘Normal Distribution’ (सामान्य वितरण) या सममित डेटा सेट में ये तीनों मान बराबर होते हैं।
Q3. परिसर (Range) की सबसे बड़ी कमी क्या है?
परिसर केवल उच्चतम और निम्नतम मानों पर निर्भर करता है, यह बीच के डेटा के बारे में कोई जानकारी नहीं देता।
⬅ Previous Chapter
📝 MCQ Test
Next Chapter ➡
Leave a Reply