सांख्यिकी: परिभाषा और प्रकार

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

सांख्यिकी में 'जनसंख्या' से क्या तात्पर्य है?

  • अध्ययन के लिए चुने गए व्यक्तियों का एक छोटा समूह。
  • एक चर के लिए एकत्र किए गए मान।
  • रुचि रखने वाले व्यक्तियों या वस्तुओं का पूरा समूह。 (correct)
  • डेटासेट का मध्य मान।

निम्नलिखित में से कौन सा केंद्रीय प्रवृत्ति का माप है?

  • माध्य (correct)
  • विचरण
  • अंतश्चतुर्थक श्रेणी
  • श्रेणी

सांख्यिकी में 'नमूना' क्या है?

  • चर के लिए मान एकत्र किए गए।
  • जनसंख्या को समूहों में बाटकर प्रत्येक समूह से नमूना लेना।
  • जनसंख्या का एक सबसेट जिसका अध्ययन के लिए चयन किया गया हो। (correct)
  • जनसंख्या में प्रत्येक व्यक्ति को समान मौका मिले।

'मोड' का क्या अर्थ है?

<p>डेटासेट में सबसे अधिक बार दिखाई देने वाला मान। (B)</p> Signup and view all the answers

निम्नलिखित में से कौन सा चरशीलता का माप है?

<p>श्रेणी (A)</p> Signup and view all the answers

अनुमान लगाने में 'पॉइंट एस्टीमेशन' का क्या मतलब है?

<p>जनसंख्या पैरामीटर के अनुमान के तौर पर एक माप प्रदान करना। (D)</p> Signup and view all the answers

'नल हाइपोथीसिस' (H0) क्या है?

<p>एक कथन जो जनसंख्या में कोई प्रभाव नहीं होने का सुझाव देता है। (A)</p> Signup and view all the answers

टी-टेस्ट का उपयोग किस लिए किया जाता है?

<p>दो समूहों के साधनों की तुलना करने के लिए। (B)</p> Signup and view all the answers

एक ग्राफ जो समय के साथ रुझानों को दिखाने के लिए प्रयोग किया जाता है, वह क्या है?

<p>लाइन ग्राफ (B)</p> Signup and view all the answers

सांख्यिकी में नैतिकता से क्या तात्पर्य है?

<p>डेटा के विश्लेषण, संग्रह और व्याख्या में नैतिक सिद्धांतों का उपयोग। (C)</p> Signup and view all the answers

Flashcards

सांख्यिकी (Statistics) क्या है?

डेटा को इकट्ठा करना, विश्लेषण करना, प्रस्तुत करना और व्याख्या करना।

वर्णनात्मक सांख्यिकी (Descriptive Statistics) क्या है?

डेटासेट की मुख्य विशेषताओं को संक्षेप में प्रस्तुत करने और वर्णन करने के लिए उपयोग किया जाता है।

मोड (Mode) क्या है?

एक डेटासेट में सबसे अधिक बार आने वाला मान।

पॉइंट एस्टीमेशन (Point Estimation) क्या है?

जनसंख्या के पैरामीटर का अनुमान लगाने के लिए एक वैल्यू प्रदान करना।

Signup and view all the flashcards

शून्य परिकल्पना (Null Hypothesis) क्या है?

एक कथन कि जनसंख्या में कोई प्रभाव या अंतर नहीं है।

Signup and view all the flashcards

ची-स्क्वायर टेस्ट (Chi-Square Test) क्या है?

श्रेणीबद्ध चरों की स्वतंत्रता का परीक्षण करने के लिए उपयोग किया जाता है।

Signup and view all the flashcards

रिग्रेशन एनालिसिस (Regression Analysis) क्या है?

एक आश्रित चर और एक या अधिक स्वतंत्र चरों के बीच संबंध को मॉडल करने के लिए उपयोग किया जाता है।

Signup and view all the flashcards

सैंपल स्पेस (Sample Space) क्या है?

एक प्रयोग के सभी संभावित परिणामों का सेट।

Signup and view all the flashcards

सशर्त संभावना (Conditional Probability) क्या है?

एक घटना की संभावना यह देखते हुए कि दूसरी घटना पहले ही हो चुकी है।

Signup and view all the flashcards

स्तरीकृत नमूनाकरण (Stratified Sampling) क्या है?

जनसंख्या को उपसमूहों में विभाजित किया जाता है, और प्रत्येक स्तर से एक यादृच्छिक नमूना लिया जाता है।

Signup and view all the flashcards

Study Notes

ज़रूर, मैं आपकी मौजूदा अध्ययन नोट्स को नई जानकारी के साथ अपडेट कर सकता हूँ।

  • सांख्यिकी डेटा के संग्रह, विश्लेषण, प्रस्तुति और व्याख्या का विज्ञान है।
  • यह विज्ञान का एक गणितीय निकाय है जो डेटा के संग्रह, विश्लेषण, व्याख्या या स्पष्टीकरण और प्रस्तुति से संबंधित है।
  • सांख्यिकी का उपयोग विज्ञान, अनुसंधान और व्यवसाय जैसे विभिन्न क्षेत्रों में किया जाता है।
  • सांख्यिकीय विधियों का उपयोग डेटा के संग्रह को संक्षेप या वर्णन करने के लिए किया जा सकता है; इसे वर्णनात्मक सांख्यिकी कहा जाता है।
  • इसके अतिरिक्त, डेटा में पैटर्न को इस तरह से मॉडल किया जा सकता है जो यादृच्छिकता और अनिश्चितता को ध्यान में रखता है, और फिर इसका उपयोग अध्ययन किए जा रहे जनसंख्या के बारे में अनुमान लगाने के लिए किया जा सकता है; इसे अनुमानित सांख्यिकी कहा जाता है।

सांख्यिकी के प्रकार

  • वर्णनात्मक सांख्यिकी: डेटा सेट की विशेषताओं को संक्षेप और वर्णन करने के लिए उपयोग किया जाता है।
  • अनुमानित सांख्यिकी: डेटा के नमूने के आधार पर जनसंख्या के बारे में अनुमान और भविष्यवाणियां करने के लिए उपयोग किया जाता है।

सांख्यिकी में मुख्य अवधारणाएँ

  • जनसंख्या: व्यक्तियों या रुचि की वस्तुओं का पूरा समूह।
  • नमूना: जनसंख्या का एक उपसमुच्चय जिसे अध्ययन के लिए चुना जाता है।
  • चर: एक विशेषता या गुण जिसे मापा या देखा जा सकता है।
  • डेटा: एक चर के लिए एकत्र किए गए मान या अवलोकन।

वर्णनात्मक सांख्यिकी

  • वर्णनात्मक सांख्यिकी का उपयोग डेटासेट की मुख्य विशेषताओं को संक्षेप और वर्णन करने के लिए किया जाता है।
  • ये आँकड़े डेटासेट से परे निष्कर्ष निकाले बिना डेटा को समझने और व्याख्या करने का एक सरल तरीका प्रदान करते हैं।
  • सामान्य वर्णनात्मक सांख्यिकी में केंद्रीय प्रवृत्ति के माप और परिवर्तनशीलता या फैलाव के माप शामिल हैं।

केंद्रीय प्रवृत्ति के माप

  • माध्य: डेटासेट का औसत मान। इसकी गणना सभी मानों को जोड़कर और मानों की संख्या से विभाजित करके की जाती है।
  • माध्यिका: आरोही या अवरोही क्रम में व्यवस्थित होने पर डेटासेट में मध्य मान। यदि मानों की संख्या सम है, तो माध्यिका दो मध्य मानों का औसत है।
  • मोड: डेटासेट में सबसे अधिक बार दिखाई देने वाला मान। डेटासेट में एक मोड (यूनीमोडल), एक से अधिक मोड (मल्टीमोडल) या कोई मोड नहीं हो सकता है यदि सभी मान केवल एक बार दिखाई देते हैं।

परिवर्तनशीलता के माप

  • रेंज: डेटासेट में अधिकतम और न्यूनतम मानों के बीच का अंतर।
  • विचरण: एक उपाय है कि डेटासेट में मान कितने फैले हुए हैं। इसकी गणना माध्य से वर्ग अंतर के औसत के रूप में की जाती है।
  • मानक विचलन: विचरण का वर्गमूल। यह माध्य से मानों की विशिष्ट दूरी का माप प्रदान करता है।
  • अंतर-चतुर्थक रेंज (IQR): डेटासेट के पहले चतुर्थक (25वां प्रतिशतक) और तीसरे चतुर्थक (75वां प्रतिशतक) के बीच का अंतर। यह डेटा के मध्य 50% के प्रसार को मापता है।

अनुमानित सांख्यिकी

  • अनुमानित सांख्यिकी में बड़े जनसंख्या के बारे में अनुमान या भविष्यवाणी करने के लिए नमूना डेटा का उपयोग करना शामिल है।
  • ये विधियाँ सांख्यिकीविदों को निष्कर्ष निकालने और सामान्यीकरण करने की अनुमति देती हैं जो तत्काल डेटासेट से आगे तक विस्तारित होती हैं।
  • अनुमानित सांख्यिकी संभाव्यता सिद्धांत और विभिन्न सांख्यिकीय परीक्षणों पर निर्भर करती है ताकि यह निर्धारित किया जा सके कि देखे गए परिणाम संयोग के कारण हैं या वास्तविक प्रभाव का प्रतिनिधित्व करते हैं।

आकलन

  • बिंदु आकलन: जनसंख्या पैरामीटर के अनुमान के रूप में एक एकल मान प्रदान करना।
  • विश्वास अंतराल: मूल्यों की एक सीमा प्रदान करना जिसके भीतर जनसंख्या पैरामीटर निश्चित स्तर के आत्मविश्वास के साथ गिरने की संभावना है।

परिकल्पना परीक्षण

  • शून्य परिकल्पना (H0): एक बयान कि जनसंख्या में कोई प्रभाव या कोई अंतर नहीं है।
  • वैकल्पिक परिकल्पना (H1): एक बयान जो शून्य परिकल्पना का खंडन करता है और सुझाव देता है कि जनसंख्या में एक प्रभाव या अंतर है।
  • महत्व स्तर (α): सत्य होने पर शून्य परिकल्पना को अस्वीकार करने की संभावना (टाइप I त्रुटि)।
  • पी-मान: यदि शून्य परिकल्पना सत्य है तो नमूना परिणामों (या अधिक चरम परिणामों) को देखने की संभावना। यदि पी-मान महत्व स्तर से कम है, तो शून्य परिकल्पना को अस्वीकार कर दिया जाता है।
  • टाइप I त्रुटि: सत्य होने पर शून्य परिकल्पना को अस्वीकार करना।
  • टाइप II त्रुटि: गलत होने पर शून्य परिकल्पना को अस्वीकार करने में विफलता।

सामान्य सांख्यिकीय परीक्षण

  • टी-टेस्ट: दो समूहों के साधनों की तुलना करने के लिए उपयोग किया जाता है।
  • ANOVA (विचरण का विश्लेषण): तीन या अधिक समूहों के साधनों की तुलना करने के लिए उपयोग किया जाता है।
  • ची-स्क्वायर टेस्ट: श्रेणीबद्ध चर की स्वतंत्रता का परीक्षण करने के लिए उपयोग किया जाता है।
  • प्रतिगमन विश्लेषण: एक निर्भर चर और एक या अधिक स्वतंत्र चर के बीच संबंध को मॉडल करने के लिए उपयोग किया जाता है।

प्रतिगमन विश्लेषण

  • प्रतिगमन विश्लेषण एक सांख्यिकीय विधि है जिसका उपयोग एक निर्भर चर और एक या अधिक स्वतंत्र चर के बीच संबंध को मॉडल करने के लिए किया जाता है।
  • यह समझने में मदद करता है कि निर्भर चर कैसे बदलता है जब एक या अधिक स्वतंत्र चर बदलते हैं।

प्रतिगमन के प्रकार

  • सरल रैखिक प्रतिगमन: इसमें एक स्वतंत्र चर और निर्भर चर के साथ एक रैखिक संबंध शामिल है।
  • एकाधिक रैखिक प्रतिगमन: इसमें दो या अधिक स्वतंत्र चर और निर्भर चर के साथ एक रैखिक संबंध शामिल है।
  • गैर-रैखिक प्रतिगमन: इसमें स्वतंत्र और निर्भर चर के बीच एक गैर-रैखिक संबंध शामिल है।

प्रतिगमन में मुख्य अवधारणाएँ

  • निर्भर चर: जिस चर की भविष्यवाणी या व्याख्या की जा रही है।
  • स्वतंत्र चर: निर्भर चर की भविष्यवाणी या व्याख्या करने के लिए उपयोग किए जाने वाले चर।
  • प्रतिगमन समीकरण: गणितीय समीकरण जो निर्भर और स्वतंत्र चर के बीच संबंध का वर्णन करता है।
  • अवशेष: देखे गए मानों और प्रतिगमन समीकरण द्वारा अनुमानित मानों के बीच अंतर।
  • आर-स्क्वायर: एक माप है कि प्रतिगमन मॉडल डेटा को कितनी अच्छी तरह फिट करता है, 0 से 1 तक होता है। एक उच्च आर-स्क्वायर एक बेहतर फिट इंगित करता है।

प्रायिकता

  • प्रायिकता इस बात की संभावना का माप है कि कोई घटना घटेगी। इसे 0 और 1 के बीच की संख्या के रूप में परिमाणित किया जाता है, जहाँ 0 असंभवता और 1 निश्चितता को इंगित करता है।

प्रायिकता की मूल अवधारणाएँ

  • प्रयोग: एक प्रक्रिया जिसके परिणामस्वरूप एक परिणाम होता है।
  • नमूना स्थान: एक प्रयोग के सभी संभावित परिणामों का समूह।
  • घटना: नमूना स्थान का एक उपसमुच्चय, जो एक विशिष्ट परिणाम या परिणामों के समूह का प्रतिनिधित्व करता है।
  • घटना की प्रायिकता: अनुकूल परिणामों की संख्या का संभावित परिणामों की कुल संख्या का अनुपात।

मूल प्रायिकता नियम

  • पूरक का नियम: किसी घटना के घटित न होने की प्रायिकता 1 घटा उस घटना के घटित होने की प्रायिकता है।
  • जोड़ नियम: दो घटनाओं में से किसी एक के घटने की प्रायिकता उनकी व्यक्तिगत प्रायिकताओं का योग है घटा दोनों घटनाओं के घटने की प्रायिकता।
  • गुणा नियम: दो स्वतंत्र घटनाओं दोनों के घटने की प्रायिकता उनकी व्यक्तिगत प्रायिकताओं का गुणनफल है।

सशर्त प्रायिकता

  • सशर्त प्रायिकता: किसी घटना के घटने की प्रायिकता यह देखते हुए कि कोई अन्य घटना पहले ही घट चुकी है।

संभाव्यता वितरण

  • संभाव्यता वितरण एक फ़ंक्शन है जो एक यादृच्छिक चर द्वारा ग्रहण किए जा सकने वाले संभावित मूल्यों को प्राप्त करने की संभावना का वर्णन करता है।
  • यह यादृच्छिक चर के प्रकार के आधार पर असतत या निरंतर हो सकता है।

असतत संभाव्यता वितरण

  • असतत संभाव्यता वितरण: असतत यादृच्छिक चर के प्रत्येक मान की प्रायिकता का वर्णन करता है।
  • उदाहरण: बर्नोली, द्विपद, पॉइसन
  • बर्नोली वितरण: एक एकल परीक्षण की सफलता या विफलता की प्रायिकता का प्रतिनिधित्व करता है।
  • द्विपद वितरण: स्वतंत्र परीक्षणों की एक निश्चित संख्या में सफलताओं की संख्या का प्रतिनिधित्व करता है।
  • पॉइसन वितरण: समय या स्थान के एक निश्चित अंतराल में होने वाली घटनाओं की संख्या का प्रतिनिधित्व करता है।

सतत संभाव्यता वितरण

  • सतत संभाव्यता वितरण: मूल्यों की एक दी गई सीमा के भीतर गिरने वाले एक सतत यादृच्छिक चर की प्रायिकता का वर्णन करता है।
  • उदाहरण: सामान्य, घातीय, समान
  • सामान्य वितरण: सममित वितरण जिसकी विशेषता इसका माध्य और मानक विचलन है।
  • घातीय वितरण: पॉइसन प्रक्रिया में घटनाओं के बीच के समय का वर्णन करता है।
  • समान वितरण: किसी दी गई सीमा के भीतर सभी मान समान रूप से संभावित होते हैं।

नमूनाकरण

  • नमूनाकरण पूरी जनसंख्या की विशेषताओं का अनुमान लगाने के लिए एक बड़ी जनसंख्या से व्यक्तियों या वस्तुओं के एक उपसमुच्चय का चयन करने की प्रक्रिया है।

नमूनाकरण विधियों के प्रकार

  • सरल यादृच्छिक नमूनाकरण: जनसंख्या के प्रत्येक सदस्य के चुने जाने की समान संभावना होती है।
  • स्तरीकृत नमूनाकरण: जनसंख्या को उपसमूहों (स्तरों) में विभाजित किया जाता है, और प्रत्येक स्तर से एक यादृच्छिक नमूना लिया जाता है।
  • समूह नमूनाकरण: जनसंख्या को समूहों में विभाजित किया जाता है, और समूहों का एक यादृच्छिक नमूना चुना जाता है। चुने गए समूहों के सभी सदस्यों को नमूने में शामिल किया गया है।
  • व्यवस्थित नमूनाकरण: यादृच्छिक शुरुआत के बाद जनसंख्या के प्रत्येक nth सदस्य का चयन किया जाता है।
  • सुविधा नमूनाकरण: आसानी से पहुंच योग्य व्यक्तियों का चयन करना।

नमूनाकरण वितरण

  • नमूनाकरण वितरण: एक आंकड़े (जैसे नमूना माध्य) का संभाव्यता वितरण जो एक जनसंख्या से समान आकार के बार-बार नमूनों से गणना की जाती है।
  • केंद्रीय सीमा प्रमेय (सीएलटी): बताता है कि नमूना माध्य का नमूनाकरण वितरण नमूना आकार बढ़ने पर सामान्य वितरण तक पहुंचता है, जनसंख्या वितरण के आकार की परवाह किए बिना।

डेटा दृश्य

  • डेटा दृश्य जानकारी और डेटा का ग्राफिकल प्रतिनिधित्व है।
  • यह चार्ट, ग्राफ और मानचित्र जैसे दृश्य तत्वों के माध्यम से डेटा में रुझानों, बाहरी मूल्यों और पैटर्न को समझने का एक तरीका प्रदान करता है।

डेटा दृश्य के सामान्य प्रकार

  • बार चार्ट: विभिन्न श्रेणियों के मूल्यों की तुलना करने के लिए उपयोग किया जाता है।
  • पाई चार्ट: एक पूरे में विभिन्न श्रेणियों के अनुपात को दिखाने के लिए उपयोग किया जाता है।
  • लाइन ग्राफ: समय के साथ रुझानों को दिखाने के लिए उपयोग किया जाता है।
  • स्कैटर प्लॉट: दो चर के बीच संबंध को दिखाने के लिए उपयोग किया जाता है।
  • हिस्टोग्राम: एक एकल चर के वितरण को दिखाने के लिए उपयोग किया जाता है।
  • बॉक्स प्लॉट: डेटासेट के माध्यिका, चतुर्थक और बाहरी मूल्यों को दिखाने के लिए उपयोग किया जाता है।

सांख्यिकी में नैतिकता

  • सांख्यिकी में नैतिकता में डेटा के संग्रह, विश्लेषण और व्याख्या के लिए नैतिक सिद्धांतों का अनुप्रयोग शामिल है।
  • यह सुनिश्चित करता है कि सांख्यिकीय अभ्यास ईमानदारी और पारदर्शिता के साथ किए जाएं।

मुख्य नैतिक विचार

  • डेटा गोपनीयता: व्यक्तियों के डेटा की गोपनीयता और गुमनामी की रक्षा करना।
  • सूचित सहमति: व्यक्तियों से उनका डेटा एकत्र करने से पहले स्वैच्छिक समझौता प्राप्त करना।
  • सटीकता और निष्पक्षता: यह सुनिश्चित करना कि डेटा पूर्वाग्रह या हेरफेर के बिना सटीक और निष्पक्ष रूप से एकत्र, विश्लेषण और रिपोर्ट किया गया है।
  • पारदर्शिता: सांख्यिकीय विश्लेषणों की विधियों, मान्यताओं और सीमाओं के बारे में खुला और ईमानदार होना।
  • गलत व्याख्या से बचना: सांख्यिकीय परिणामों को स्पष्ट और समझने योग्य तरीके से प्रस्तुत करना, और भ्रामक या धोखेबाज व्याख्याओं से बचना।

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

More Like This

Quantitative Data Analysis Techniques
12 questions
Introduction to Statistics
30 questions

Introduction to Statistics

BlamelessConnemara2892 avatar
BlamelessConnemara2892
Introduction to Statistics
10 questions
Understanding Descriptive Statistics
10 questions
Use Quizgecko on...
Browser
Browser