Tuesday 21 November 2017

एसटीएटीए विदेशी मुद्रा में ओएल के अवशेष


सूचना: आईडीआरई सांख्यिकी परामर्श समूह वेबसाइट को वर्डप्रेस सीएमएस में फरवरी में माइग्रेट कर देगा ताकि नई सामग्री के रख-रखाव और सृजन की सुविधा मिल सके। हमारे कुछ पुराने पृष्ठों को हटा दिया जाएगा या संग्रहीत किया जाएगा ताकि उन्हें अब बनाए रखा नहीं जाएगा हम रीडायरेक्ट बनाए रखने का प्रयास करेंगे ताकि पुरानी यूआरएल हम जितनी अच्छी तरह काम कर सकें उतना काम जारी रहेगा। डिजिटल रिसर्च और एजुकेशन फॉर डिजिटल रिसर्च एंड एजुकेशन में आपका स्वागत है स्टेट कंसल्टिंग ग्रुप द्वारा स्टेटा अध्याय 4 के साथ गिफ्ट रिगरेशन देकर सहायता करें। ओएलएस अध्याय आउटलाइन 4.1 मजबूत प्रतिगमन तरीके 4.1.1 मजबूत मानक त्रुटियों के साथ प्रतिगमन 4.1.2 क्लस्टर विकल्प का उपयोग 4.1.3 मजबूत प्रतिगमन 4.1.4 क्वांटाइल रेग्रेसन 4.2 प्रतिरोधी रेखीय प्रतिगमन 4.3 सेंसर या ट्रंकडेटेड डेटा के साथ प्रतिगमन 4.3.1 सेंसर किए गए डाटा के साथ प्रतिगमन 4.3.2 पृथक्कृत डाटा के साथ प्रतिगमन 4.4 मापन त्रुटि 4.5 के साथ प्रतिगमन 4.5 एकाधिक समीकरण प्रतिगमन मॉडल 4.5.1 अपेक्षाकृत असंबंधित प्रतिगमन 4.5। 2 मल्टीवीयेट रिपरेशन 4.6 सारांश 4.7 आत्म मूल्यांकन 4.8 अधिक जानकारी के लिए इस अध्याय में हम कई आज्ञाओं में जाएंगे जो ओएलएस से परे हों। यह अध्याय दूसरों की तुलना में कुछ अलग है, इसमें कई अलग-अलग अवधारणाएं शामिल हैं, जिनमें से कुछ आपके लिए नया हो सकते हैं। इन एक्सटेंशन, ओएलएस से परे, ओएलएस का बहुत अधिक लग रहा है और लगता है कि आपको रेखीय मॉडल के साथ काम करने के लिए अतिरिक्त उपकरण उपलब्ध कराएगा। विषयों में मजबूत प्रतिगमन विधियों, विवश रेखीय प्रतिगमन, सेंसर और तुच्छ डेटा के साथ प्रतिगमन, माप त्रुटि के साथ प्रतिगमन, और कई समीकरण मॉडल शामिल होंगे। 4.1 मजबूत प्रतिगमन तरीके यह एक दुर्लभ डेटासेट लगता है जो कई प्रतिगमन अंतर्निहित सभी मान्यताओं को पूरा करता है। हम जानते हैं कि मान्यताओं को पूरा करने में विफलता गुणांकों के पक्षपातपूर्ण अनुमान और मानक त्रुटियों के विशेष रूप से पक्षपाती अनुमानों का कारण बन सकती है। यह तथ्य मजबूत प्रतिगमन के तरीकों के विकास में बहुत सारी गतिविधियों को बताता है। मजबूत प्रतिगमन के तरीकों के पीछे के विचारों को अनुमान में समायोजन करना है जो डेटा की खामियों में से कुछ को ध्यान में रखते हैं हम मजबूत प्रतिगमन के लिए तीन तरीकों पर विचार करने जा रहे हैं: क्लस्टर विकल्प सहित मजबूत मानक त्रुटियों के साथ 1) प्रतिगमन, 2) स्थिर पुनरावृत्त कम से कम चौकों का उपयोग करके मजबूत प्रतिगमन, और 3) क्वांट्रेट प्रतिगमन, अधिक विशेष रूप से, माध्य प्रतिगमन। इससे पहले कि हम इन तरीकों पर गौर करें, प्राथमिक स्कूल अकादमिक प्रदर्शन सूचकांक (elemapi2.dta) डेटासेट का उपयोग करके मानक OLS प्रतिगमन को देखने दें। हम एक ऐसे मॉडल को देखेंगे जो एपीआई 2000 अंकों की औसत वर्ग के आकार का उपयोग करके 3 (एस्कएस 3), औसत वर्ग के आकार 4 से 6 (एसी 46), पूरी तरह से क्रेडेंशियल्ड शिक्षकों (पूर्ण) का प्रतिशत और आकार का स्कूल (नामांकन) पहले इन चर के लिए वर्णनात्मक आँकड़े पर गौर करें। एस्कस्क 3 और एस्कस्क 6 के लिए लापता मूल्यों को नोट करें। नीचे हम एपीसीएक्स 3 से एपीसीएक्स की भविष्यवाणी को देखते हैं। एसी 466 पूर्ण और नामांकन हम देखते हैं कि acsk3 को छोड़कर सभी चर महत्वपूर्ण हैं। हम टेस्ट कमान का उपयोग दोनों वर्ग के आकार के चर का परीक्षण करने के लिए कर सकते हैं, और हम पाते हैं कि इन दो चर का समग्र परीक्षण महत्वपूर्ण है यहाँ इस प्रतिगमन के लिए अवशिष्ट बनाम फिट प्लॉट है। ध्यान दें कि अवशिष्टों का पैटर्न बिल्कुल ठीक नहीं है जैसा हम उम्मीद करते हैं। अवशिष्टों का प्रसार बाईं तरफ से ग्राफ के मध्य दाईं ओर कुछ हद तक व्यापक है, जहां अवशेषों की परिवर्तनशीलता कुछ हद तक छोटी है, जिसमें कुछ विषमता का सुझाव दिया गया है। नीचे हम एप्लॉट्स दिखाते हैं हालांकि भूखंड छोटे हैं, आप कुछ बिंदुओं को देख सकते हैं जो चिंता का विषय हैं। कोई चरम बिंदु नहीं है (जैसा हमने अध्याय 2 में देखा था), लेकिन एक मुट्ठी भर अंक जो छूटे हुए हैं उदाहरण के लिए, ऊपरी दाएं ग्राफ में आप एक मुट्ठी भर अंक देख सकते हैं जो बाकी हिस्सों से बाहर निकलते हैं। अगर यह सिर्फ एक या दो अंक थे, तो हम गलतियों या आउटलाइयर की तलाश कर सकते हैं, लेकिन हम इस तरह के बड़ी संख्या में अंकों के बारे में विचार करने से अधिक अनिच्छुक होंगे जैसे आउटलाइनर इस प्रतिगमन के लिए यहां lvr2plot है। हम 4 अंक देख रहे हैं जो उनके उत्तोलन और उनके अवशिष्ट दोनों में कुछ हद तक ऊंचे हैं। इन परिणामों में से कोई भी नाटकीय समस्या नहीं है, लेकिन आरवीएफप्लोट से पता चलता है कि कुछ आउटलेट और कुछ संभव हेरोसेसेस्लास्टिक हो सकता है, एप्लॉट्स के पास कुछ टिप्पणियां हैं जो उच्चतर लाभ उठाने की तलाश में हैं, और एलवीआर 2 प्लॉट ऊपरी दायां चतुर्भुज में कुछ बिंदु दिखाता है जो प्रभावशाली हो सकता है हम इस मॉडल का अनुमान लगाने के लिए ओएलएस प्रतिगमन के अलावा किसी अन्य का उपयोग करना चाह सकते हैं। अगले कई खंडों में हम कुछ मजबूत प्रतिगमन विधियों को देखेंगे। 4.1.1 मजबूत मानक त्रुटियों के साथ प्रतिगमन Stata regress आदेश में ह्यूबर-व्हाईट सैंडविच के आकलनकर्ताओं का उपयोग करते हुए मानक त्रुटियों के आकलन के लिए एक मजबूत विकल्प शामिल है ऐसी मजबूत मानक त्रुटियों को मान्यताओं को पूरा करने में विफलता के बारे में छोटी चिंताओं के संग्रह से निपटना पड़ सकता है, जैसे कि सामान्यता, असभ्यता, या कुछ टिप्पणियों, जो बड़े अवशेष, उत्तोलन या प्रभाव का प्रदर्शन करते हैं ऐसी छोटी समस्याओं के लिए, मजबूत विकल्प प्रभावी रूप से इन चिंताओं से निपट सकते हैं मजबूत विकल्प के साथ, गुणांकों के बिंदु का अनुमान सामान्य ओएलएस के समान ही होता है, लेकिन मानक त्रुटियों को विविधता और सामान्यता की कमी से संबंधित मुद्दों पर ध्यान देते हैं। मजबूत विकल्प का उपयोग करते हुए ऊपर के समान प्रतिगमन है मानक त्रुटियों और टी-परीक्षणों में परिवर्तन (लेकिन गुणांक में कोई परिवर्तन नहीं) ध्यान दें। इस विशेष उदाहरण में, मजबूत मानक त्रुटियों का उपयोग करने से मूल ओएलएस प्रतिगमन से कोई भी निष्कर्ष नहीं बदला गया। 4.1.2 क्लस्टर विकल्प का उपयोग करना जैसा कि अध्याय 2 में वर्णित है, ओएलएस प्रतिगमन यह मानती है कि अवशिष्ट स्वतंत्र हैं Elemapi2 डेटासेट में 400 स्कूलों के डेटा शामिल हैं जो 37 स्कूल जिलों से आते हैं। यह बहुत संभव है कि प्रत्येक स्कूल जिले के भीतर स्कोर स्वतंत्र न हो, और यह उन अवशेषों को जन्म दे सकता है जो जिलों के भीतर स्वतंत्र नहीं हैं। हम यह संकेत देने के लिए क्लस्टर विकल्प का उपयोग कर सकते हैं कि टिप्पणियां जिलों (डीएनयू के आधार पर) में एकत्रित हो रही हैं और ये कि निरीक्षण जिलों के भीतर सम्बंधित हो सकते हैं, लेकिन जिलों के बीच स्वतंत्र होगा वैसे, अगर हमें जिलों की संख्या नहीं पता है, तो हम जल्दी से पता लगा सकते हैं कि नीचे कितने जिलों के रूप में दिखाया गया है, चुपचाप डनुम को तैयार करने और मैक्रो आर (आर) को प्रदर्शित करते हुए, जो तालिका में पंक्तियों की संख्या देता है , जो हमारे डेटा में स्कूल जिलों की संख्या है अब, हम क्लस्टर विकल्प से रिग्रेग चला सकते हैं। क्लस्टर से मजबूत होने के बाद हमें मजबूत विकल्प को शामिल करने की आवश्यकता नहीं है। ध्यान दें कि मानक त्रुटियों को काफी हद तक बदल दिया गया है, अधिक से अधिक, मजबूत विकल्प के कारण स्वयं की वजह से ही। मजबूत विकल्प के साथ, गुणांकों का अनुमान OLS के अनुमानों के समान है, लेकिन मानक त्रुटियों को ध्यान में रखा जाता है कि जिलों में टिप्पणियां गैर-स्वतंत्र हैं हालांकि इस विश्लेषण में मानक त्रुटियां बड़ी होती हैं, ये तीन वैरिएबल जो कि ओएलएस विश्लेषण में महत्वपूर्ण थे, इस विश्लेषण में भी महत्वपूर्ण हैं। इन मानक त्रुटियों की गणना 37 जिलों के सकल अंकों के आधार पर की जाती है, क्योंकि ये जिला स्तर स्कोर स्वतंत्र होना चाहिए। यदि आपके पास आपके समग्र नमूना आकार की तुलना में बहुत छोटी संख्या है तो यह संभव है कि मानक त्रुटियों OLS परिणामों से काफी अधिक हो सकती हैं उदाहरण के लिए, यदि केवल 3 जिले हैं, तो मानक त्रुटियों को केवल 3 जिलों के लिए कुल स्कोर पर गिना जाएगा। 4.1.3 मजबूत प्रतिगमन स्ताटा रेगॉग कमांड रेखांकित कम से कम चौराहेों का उपयोग करके एक मजबूत प्रतिगमन करता है, अर्थात आरएआरजी प्रत्येक अवलोकन के लिए वजन को बेहतर व्यवहार के साथ अधिक वजन के साथ सौंपता है। वास्तव में, बेहद भयानक मामलों, 1 से अधिक कुक डी के साथ, उनके वजन को गायब करने के लिए सेट किया जा सकता है ताकि वे सभी विश्लेषण में शामिल न हों। हम उत्पन्न विकल्प के साथ रैग का उपयोग करेंगे ताकि हम टिप्पणियों के वजन के लिए इस्तेमाल किए गए वजन का निरीक्षण कर सकें। ध्यान दें कि इस विश्लेषण में दोनों गुणांक और मानक त्रुटियां मूल ओएलएस प्रतिगमन से अलग हैं। नीचे हम रेग कमांड का उपयोग करके मजबूत प्रतिगमन का उपयोग करते हुए समान विश्लेषण दिखाते हैं। यदि आप पहले से प्रस्तुत किए गए ओएलएस परिणामों के साथ मजबूत अपगमन परिणामों (सीधे ऊपर) की तुलना करते हैं, तो आप देख सकते हैं कि गुणांक और मानक त्रुटियां काफी समान हैं, और टी मान और पी मान भी काफी समान हैं। जब हमने ओएलएस विश्लेषण किया तो डेटा में मिली छोटी समस्याओं के बावजूद, मजबूत प्रतिगमन विश्लेषण ने बहुत ही समान परिणाम दिखाए, जो वास्तव में ये मामूली समस्याएं हैं। यदि परिणाम काफी अलग थे, तो हम उन कारणों की जांच करना चाहते थे, जिनके कारण ओएलएस और मजबूत प्रतिगमन के परिणाम अलग थे, और दो परिणामों में मजबूत प्रतिगमन के परिणाम शायद अधिक भरोसेमंद होंगे। भविष्यवाणी (फिट) मूल्यों (पी), अवशिष्ट (आर), और उत्तोलन (टोपी) मानों (एच) की गणना और देखें। ध्यान दें कि हम अगर कमांड में ई (नमूना) शामिल हैं क्योंकि आरआरजी गायब होने के वजन उत्पन्न कर सकते हैं और आप उन टिप्पणियों के लिए मूल्यों और अवशेषों की भविष्यवाणी नहीं करना चाहते हैं। अब, विभिन्न पूर्वानुमानित मानों और भार पर ध्यान दें। सबसे पहले, हम वेट द्वारा क्रमबद्ध होंगे, तो हम पहले 15 टिप्पणियों को देखेंगे। ध्यान दें कि सबसे कम वजन एक-डेढ़ के करीब है, लेकिन जल्दी से .7 रेंज में पहुंचें। अब, पिछले 10 टिप्पणियों को देखने दें। 391 से 3 9 5 टिप्पणियों के लिए वजन सभी एक के करीब हैं लापता भविष्यवाणियों के कारण अन्तराल के लिए 396 टिप्पणियों के मूल्य गायब हैं। ध्यान दें कि ऊपर दिए गए अवलोकनों में निम्नतम वजन सबसे बड़ा अवशेष (200 से अधिक अवशिष्ट) वाले हैं और उच्चतम भार वाले नीचे दिए गए टिप्पणियां बहुत कम अवशेष हैं (3 से कम)। Rreg का उपयोग करने के बाद यह अनुमानित मूल्यों, अवशिष्टों और लीवरेज (टोपी) उत्पन्न करना संभव है, लेकिन ज्यादातर रिग्रेसन डायग्नोस्टिक कमांड रेग के बाद उपलब्ध नहीं हैं। हमें स्वयं के लिए उनमें से कुछ बनाना होगा। यहाँ, ज़ाहिर है, शून्य पर एक रेखा के साथ शेष (अनुमानित) बनाम अवशिष्टों का ग्राफ है। यह साजिश ओएलएस प्लॉट की तरह ज्यादा दिखती है, सिवाय इसके कि ओएलएस में सभी टिप्पणियों को समान रूप से भारित किया जाएगा, लेकिन जैसा कि हमने सबसे ज्यादा अवशेषों के साथ टिप्पणियों के ऊपर देखा है वे कम भारित होते हैं और इसलिए परिणामों पर कम प्रभाव होता है। एक lvr2plot प्राप्त करने के लिए हमें सामान्यीकृत स्क्वायर अवशिष्टों और दोनों अवशिष्टों और लीवर (टोपी) मूल्यों के साधनों के लिए कई चरणों के माध्यम से जाना होगा। सबसे पहले, हम अवशिष्ट स्क्वायर (आर 2) उत्पन्न करते हैं और फिर इसे स्क्वायर अवशिष्टों के योग से विभाजित करते हैं। इसके बाद हम इस मान के मतलब की गणना करते हैं और उसे आरएम नामक एक स्थानीय मैक्रो के रूप में सहेजते हैं (जिसका हम लाभ बनाम अवशिष्ट साजिश बनाने के लिए उपयोग करेंगे)। इसके बाद हम लीवरेज के मतलब की गणना करते हैं और इसे एचएम नामक एक स्थानीय मैक्रो के रूप में सहेजते हैं। अब, हम नीचे बताए अनुसार अवशिष्ट वर्ग के खिलाफ लाभ उठा सकते हैं। ओएलएस प्रतिगमन से साजिश के साथ नीचे की साजिश की तुलना करना, यह साजिश बहुत अच्छा व्यवहार है। अब ग्राफ़ के ऊपरी दाहिने वृत्त का चतुर्थ भाग में अंक नहीं हैं। हमारे अस्थायी चर को हटाकर इस विश्लेषण को बंद करें। 4.1.4 क्वांटाइल रिग्रेशन क्वांटला प्रतिगमन, सामान्य रूप से, और मध्य प्रतिगमन, विशेष रूप से, रेग के विकल्प के रूप में माना जा सकता है। स्टाटा कमांड क्यूआरजी मात्रात्मक प्रतिगमन करता है किसी भी विकल्प के बिना क्यूएग वास्तव में एक औसत प्रतिगमन करेगा जिसमें गुणांक का अनुमान लगाया जाएगा कि मध्य से पूर्ण विचलन को कम करके। बेशक, केंद्रीय प्रवृत्ति का एक अनुमान के रूप में, माध्य एक प्रतिरोधक उपाय है जो कि आउटलेरों से बहुत प्रभावित नहीं है जैसा कि मतलब है। यह स्पष्ट नहीं है कि औसत प्रतिगमन एक प्रतिरोधी आकलन प्रक्रिया है, वास्तव में, कुछ प्रमाण हैं कि यह उच्च लाभकारी मूल्यों से प्रभावित हो सकता है। Statas qreg कमांड का उपयोग करने के लिए क्वालिटल रिग्रेसन क्या दिखता है? एसीएसके 3 के लिए गुणांक और मानक त्रुटि काफी अलग है जब रीग्रेस कमांड (गुणक 1.2 बनाम 6.9 और मानक त्रुटियां 6.4 बनाम 4.3) का उपयोग करते हुए ओएलएस की तुलना में qreg का उपयोग करते हैं। गुणांक और अन्य चर के लिए मानक त्रुटियां भी भिन्न हैं, लेकिन नाटकीय रूप से भिन्न नहीं हैं फिर भी, क्यूएजी के परिणामों से संकेत मिलता है कि, ओएलएस परिणामों की तरह, एसीएस 3 के अलावा सभी चर महत्वपूर्ण हैं क्यूआरएफ़ कमांड में रैग से भी कम नैदानिक ​​विकल्प हैं केवल मूल्यों को हम प्राप्त कर सकते हैं अनुमानित मान और अवशिष्ट हैं। स्ताटा में तीन अतिरिक्त आदेश दिए गए हैं जो मात्रात्मक प्रतिगमन कर सकते हैं। Iqreg अंतरक्षेत्र रिग्रेन्स, मात्रा में अंतर के प्रतिगमन का अनुमान है। अनुमानियों के अनुमानित विचरण-सह-प्रकार मैट्रिक्स को बूटस्ट्रैपिंग के माध्यम से प्राप्त किया जाता है। sqreg अनुमान एक साथ - quantal प्रतिगमन यह प्रत्येक मात्रा के लिए क्यूएग के समान गुणांक पैदा करता है। एसकेएआरगे उन अनुमानकों का बूटस्ट्रैप विचरण-सह-मैट्रिक्स प्राप्त करता है जिसमें मात्रा-ब्लाकों के बीच भी शामिल है इस प्रकार, एक अलग-अलग मात्रा का वर्णन करने वाले गुणांक की तुलना कर आत्मविश्वास अंतराल का परीक्षण और निर्माण कर सकता है। bsqreg एक quantile के साथ sqreg के समान है sqreg, इसलिए, bsqreg से तेज़ है 4.2 बाधित रेखीय प्रतिगमन इस खंड को एचबीबी 2 डाटासेट का उपयोग करते हुए एक प्रतिगमन मॉडल को देखकर शुरू किया। एचएसबी 2 फ़ाइल हाईस्कूल और परे अध्ययन (रॉक, हिल्टन, पोलाक, एकस्ट्रोम एप गोर्टज़, 1 9 85) से 200 मामलों का नमूना है। इसमें निम्नलिखित चर शामिल हैं: id महिला । दौड़ एसईएस schtyp कार्यक्रम पढ़ें लिखना । गणित विज्ञान और समाज चर पढ़ें। लिखना । गणित विज्ञान और समाज पढ़ाई, लेखन, गणित, विज्ञान और सामाजिक अध्ययन (क्रमशः) पर मानकीकृत परीक्षणों के परिणाम हैं, और महिला को 1 अगर पुरुष, 0 पुरुष के रूप में चिह्नित किया जाता है। हम एक ओएलएस प्रतिगमन करके शुरू कर देते हैं जहां हम पढ़े जाने से सामाजिक स्कोर का अनुमान लगाते हैं। लिखना । गणित विज्ञान और महिला (लिंग) ध्यान रखें कि पढ़ने और लिखने के लिए गुणांक बहुत समान हैं, जो समझ में आता है क्योंकि वे भाषा क्षमता के दोनों उपाय हैं। इसके अलावा, गणित और विज्ञान के गुणांक समान हैं (जिसमें वे दोनों 0 से काफी अलग नहीं हैं)। मान लीजिए कि हमारे पास एक सिद्धांत है जो बताता है कि पढ़ने और लिखने के बराबर गुणांक होना चाहिए, और गणित और विज्ञान के समान गुणांक होने चाहिए। हम परीक्षण कमांड के उपयोग से गुणांक की समानता का परीक्षण कर सकते हैं। हम इसे testparm कमांड के साथ भी कर सकते हैं, जो विशेष रूप से उपयोगी है अगर आप यह जांच कर रहे थे कि क्या 3 या अधिक गुणांक समान थे। इन दोनों परिणामों से संकेत मिलता है कि पढ़ने और लेखन स्कोर के गुणांक में कोई महत्वपूर्ण अंतर नहीं है। चूंकि यह प्रतीत होता है कि गणित और विज्ञान के गुणांक भी बराबर हैं, साथ ही साथ उन लोगों की समानता का परीक्षण करें (टेस्टपार्म कमांड का उपयोग करके)। अब ये दोनों परीक्षण एक साथ करते हैं, साथ ही साथ यह परीक्षण करते हुए कि पढ़ने के लिए गुणांक लिखने और गणित के बराबर है, विज्ञान के बराबर है हम इसे दो परीक्षण आदेशों का प्रयोग करते हैं, दूसरे विकल्प के उपयोग से दूसरे इन परीक्षणों को एक साथ साथ परीक्षण करने के लिए दूसरे परीक्षण के साथ पहला परीक्षण जमा कर सकते हैं। ध्यान दें कि इस दूसरे टेस्ट में 2 डीएफ है, क्योंकि यह दोनों परिकल्पनाओं की जांच कर रही है, और यह परीक्षण महत्वपूर्ण नहीं है, गुणांक के इन जोड़ों का सुझाव एक दूसरे से महत्वपूर्ण नहीं है। हम प्रतिगमन मॉडल का अनुमान लगा सकते हैं जहां हम गुणक को एक-दूसरे के बराबर मानते हैं। उदाहरण के लिए, हम एक सीमित पैमाने पर शुरू करते हैं और बराबर लिखने के लिए पढ़ते हैं। सबसे पहले, हम एक बाधा को परिभाषित करेंगे और फिर हम cnsreg कमांड चलाएंगे। ध्यान दें कि पढ़ने और लिखने के लिए गुणांक, उनकी मानक त्रुटियों, टी-परीक्षण आदि के साथ समान हैं। यह भी ध्यान रखें कि एफ परीक्षण के लिए स्वतंत्रता की डिग्री चार, पांच नहीं है, जैसा कि ओएलएस मॉडल में है। इसका कारण यह है कि पढ़ने और लिखने के लिए केवल एक गुणांक अनुमान लगाया गया है। उनके मूल्यों के योग के बराबर एक वैल्यू की तरह अनुमानित सामान्य तौर पर, रूट एमएसई को विवश मॉडल में बढ़ाना चाहिए, क्योंकि रैखिक प्रतिबंधों के अधीन आकलन अप्रतिबंधित मॉडल (जो एसएसई को कम करने में असंतुलित मॉडल से गुणांक होगा) के अनुरूप फिट नहीं होता है। हालांकि, इस विशेष उदाहरण में (क्योंकि पढ़ने और लिखने के लिए गुणांक पहले से बहुत ही समान हैं) मॉडल फिट होने से फिट होने के कारण प्रत्येक दूसरे के बराबर पढ़ा और लिखना स्वतंत्रता की डिग्री में बदलाव के द्वारा भर जाता है। इसके बाद, हम एक दूसरे बाधा को परिभाषित करेंगे, विज्ञान के बराबर गणित की स्थापना करेंगे हम सी के लिए बाधा विकल्प भी संक्षिप्त करेंगे। अब लिखने और गणित विज्ञान और मॉडल के लिए स्वतंत्रता की डिग्री पढ़ने के लिए गुणांक तीन को गिरा दिया गया है। दोबारा, रूट एमएसई पूर्व मॉडल की तुलना में थोड़ा बड़ा है, लेकिन हमें केवल थोड़ा सा बड़ा जोर देना चाहिए। यदि वास्तव में जनसंख्या को पढ़ने और गणित विज्ञान पढ़ने के लिए गुणांक। तो ये संयुक्त (विवश) अनुमान अधिक स्थिर हो सकते हैं और अन्य नमूनों के लिए बेहतर बन सकते हैं। इसलिए, हालांकि इन अनुमानों में इस नमूने में पूर्वानुमान की थोड़ी अधिक उच्च मानक त्रुटि हो सकती है, फिर भी वे जनसंख्या से अधिक सामान्य हो सकते हैं, जिनसे वे आए थे। 4.3 संवेदी या छंटनी वाले डेटा के साथ प्रतिगमन जो विश्लेषण करता है उसमें सेंसर किए गए मूल्यों या छंटनी हुई डेटा का विश्लेषण कई शोध विषयों में आम है। होस्मर और लेमेशो (1 999) के अनुसार, एक सेंसर वाला मूल्य एक है जिसका मूल्य प्रत्येक विषय के लिए यादृच्छिक कारकों के कारण अधूरा है। दूसरी ओर, एक छोटा अवलोकन, जो अध्ययन के डिजाइन में एक चयन प्रक्रिया के कारण अधूरा है। हम सेंसर किए गए मानों के साथ डेटा का विश्लेषण करने से शुरू कर देंगे। 4.3.1 सेंसर किए गए डेटा के साथ प्रतिगमन इस उदाहरण में हमारे पास एएसीडिंडक्स नामक एक चर है जो मानकीकृत परीक्षण अंक और शैक्षणिक ग्रेड का भारित संयोजन है। एडीडिंडक्स पर अधिकतम संभव स्कोर 200 है, लेकिन यह स्पष्ट है कि 200 से अधिक 16 रन बनाने वाले 16 छात्र अपनी शैक्षणिक क्षमता में बिल्कुल समान नहीं हैं। दूसरे शब्दों में, अकादमिक क्षमता में परिवर्तनशीलता है, जब अकादमीक्स पर 200 के अंक के लिए स्कोर नहीं किया जा रहा है। चर एराडिंडक्स को सेंसर करने के लिए कहा जाता है, विशेष रूप से, यह सही सेंसर है उदाहरण पर देखें। हम डेटा के विवरण, कुछ वर्णनात्मक आंकड़े और चर के बीच संबंधों को देखकर शुरू करेंगे। अब, डेटा पर मानक OLS प्रतिगमन चलाने और पी 1 में अनुमानित स्कोर उत्पन्न करने दें। Tobit कमांड कमांड में से एक है जिसे सेंसर किए गए डेटा के साथ प्रतिगमन के लिए इस्तेमाल किया जा सकता है। कमांड के सिंटैक्स को उल विकल्प के अलावा के साथ रिग्रेग जैसा कि यह संकेत मिलता है कि सही सेंसर वाला मूल्य 200 है। हम पॉटी अनुमानित मानों का अनुमान लगाकर चलने वाले आदेश का पालन करेंगे। पी 1 और पी 2 स्कोर के सारांश से पता चलता है कि अल्प अनुमानित मूल्यों में एक बड़ा मानक विचलन और मूल्यों की एक बड़ी रेंज है। जब हम उन सभी विद्यार्थियों के लिए पी 1 और पी 2 की सूची देख रहे हैं जिन्होंने 200 से ज्यादा एसीयड इंडक्स बनाए हैं, तो हम देखते हैं कि हर मामले में दलालों की अनुमानित मान ओएलएस की भविष्यवाणी मूल्य से अधिक है। इन भविष्यवाणियों का अनुमान है कि यदि एसिड इंडक्स के मूल्य 200 से अधिक हो सकते हैं तो परिवर्तनशीलता क्या होगी। यहाँ पर क्लिक करने के लिए वाक्यविन्यास आरेख है: आप निम्न और ऊपरी दोनों संवेदी मानों को घोषित कर सकते हैं। सेंसर किए गए मूल्यों को तय किया जाता है कि सभी टिप्पणियों पर समान कम और ऊपरी मान लागू होते हैं। स्ताता में दो अन्य कमांड हैं जो आपको सेंसर किए गए डेटा के साथ प्रतिगमन करने में अधिक लचीलापन प्रदान करते हैं सीएनजीआर एक मॉडल का अनुमान लगाता है जिसमें सेंसर मूल्य अवलोकन से अवलोकन से भिन्न हो सकता है intreg एक मॉडल का अनुमान है, जहां प्रत्येक अवलोकन के लिए प्रतिसाद चर या तो बिंदु डेटा, अंतराल डेटा, बायां सेंसर वाला डेटा या सही-सेंसर वाला डेटा है 4.3.2 वांछित डेटा के साथ प्रतिगमन काट दिया गया डेटा तब होता है जब कुछ अवलोकनों को वैरिएबल के मूल्य की वजह से विश्लेषण में शामिल नहीं किया जाता है। हम डाटासेट, एनाडिंडक्स का उपयोग करके ट्रांस्केक्शन के साथ विश्लेषण का वर्णन करेंगे। कि पिछले अनुभाग में इस्तेमाल किया गया था अगर एडीडिंडक्स अब स्मृति में लोड नहीं किया जाता है तो आप इसे निम्न उपयोग कमांड के साथ प्राप्त कर सकते हैं। आइए सोचें कि एक विशेष सम्मान कार्यक्रम में भाग लेने के लिए, छात्रों को एडीडिंडक्स पर कम से कम 160 स्कोर करना होगा। इसलिए हम सभी टिप्पणियों को छोड़ देंगे जिसमें एसीडिंडक्स का मूल्य 160 से कम है। अब, हम उसी मॉडल का अनुमान लगा सकते हैं जो हमने सेन्सर किए गए डेटा पर अनुभाग में इस्तेमाल किया था, केवल इस बार हम दिखाएंगे कि एडीडिंडक्स के लिए 200 सेंसर नहीं है। यह स्पष्ट है कि गुणांकों के अनुमानों को इस तथ्य के कारण विकृत कर दिया गया है कि डेटा पर अब 56 टिप्पणियां नहीं हैं। यह रेंज की प्रतिबन्ध के प्रति रवैया चर और प्रक्षेपक चर दोनों पर है। उदाहरण के लिए, लिखने के गुणांक को .79 से .59 से गिरा दिया गया। इसका क्या मतलब यह है कि अगर हमारा लक्ष्य आबादी में एराडिनडक्स और प्रिविक्टर वैरिएबल के बीच संबंध को खोजना है, तो हमारे नमूने में एडीडिंडक्स का टकराव पक्षपाती अनुमानों को आगे बढ़ने वाला है। इन आंकड़ों का विश्लेषण करने के लिए एक बेहतर तरीका है छितरी हुई प्रतिगमन का उपयोग करना। स्ताट में यह ट्रिनक्रग कमांड का उपयोग करके पूरा किया जा सकता है जहां ट्रांस्केशन में इस्तेमाल किए गए एराडिंडक्स स्कोर की निचली सीमा को इंगित करने के लिए एल ओ विकल्प का उपयोग किया जाता है। Truncreg कमान से गुणांक OLS परिणामों के करीब हैं, उदाहरण के लिए लेखन के लिए गुणांक .77 है जो कि .79 के OLS परिणामों के करीब है। हालांकि, परिणाम अब भी अन्य चर पर कुछ हद तक अलग हैं, उदाहरण के लिए पढ़ने के लिए गुणांक .52 अन्तर्निहित डेटा के साथ मूल OLS में .72 की तुलना में, और .47 के OLS अनुमान से बेहतर है। प्रतिबंधित डेटा यद्यपि ट्रंककैग ओएलएस की तुलना में प्रतिबंधित डेटा फाइल के अनुमानों में सुधार कर सकता है, यह निश्चित रूप से पूर्ण अप्रतिबंधित डेटा फ़ाइल का विश्लेषण करने के लिए कोई विकल्प नहीं है। 4.4 मापन त्रुटि के साथ प्रतिगमन जैसे आप सबसे अधिक संभावना याद करेंगे, प्रतिगमन की मान्यताओं में से एक यह है कि भविष्यवक्ता चर बिना त्रुटि के मापा जाता है। समस्या यह है कि भविष्यवाचक चर में माप त्रुटि प्रतिगमन गुणांक के अनुमान के तहत होती है। मॉडल के गुणांक का आकलन करते समय Statav eivreg कमांड माप त्रुटि लेता है। एचएसबी 2 डाटासेट का उपयोग करते हुए प्रतिगमन को देखने देता है। भविष्यवक्ता पढ़ने वाला मानकीकृत टेस्ट स्कोर है हर परीक्षण में माप त्रुटि है हमें पढ़ने की सही विश्वसनीयता नहीं पता है। लेकिन विश्वसनीयता के लिए 9। का इस्तेमाल करना दूर होगा। अब हम एक ही अपगमन मॉडल का अनुमान Stata eivreg कमांड के साथ करेंगे, जो त्रुटियों-इन-वैरिएबल प्रतिगमन के लिए है। ध्यान दें कि एफ-अनुपात और आर 2 पढ़ने के लिए प्रतिगमन गुणांक के साथ-साथ बढ़े। इसके अतिरिक्त, पढ़ने के लिए मानक त्रुटि में वृद्धि हुई है। अब, पढ़ने के साथ एक मॉडल का प्रयास करें। गणित और भविष्यवाणियों के रूप में समाज सबसे पहले, हम एक मानक ओएलएस प्रतिगमन चलाएंगे I अब, निम्नलिखित reliabilities का उपयोग करके माप त्रुटि के लिए खाते का प्रयास करें: read -। 9, गणित -। 9, socst - .8 ध्यान दें कि समग्र एफ और आर 2 ऊपर चला गया, लेकिन पढ़ने के लिए गुणांक अब सांख्यिकीय रूप से महत्वपूर्ण नहीं है 4.5 एकाधिक समीकरण प्रतिगमन मॉडल यदि एक डेटासेट में पर्याप्त चर है तो हम एक से अधिक प्रतिगमन मॉडल का अनुमान लगा सकते हैं। उदाहरण के लिए, हम एक्स 1 से y1 का अनुमान लगा सकते हैं और एक्स 2 से y2 का भी अनुमान लगा सकते हैं। हालांकि आम में कोई चर नहीं है, ये दोनों मॉडल एक दूसरे से स्वतंत्र नहीं हैं क्योंकि डेटा समान विषयों से आते हैं। यह एक प्रकार के कई समीकरण प्रतिगमन का एक उदाहरण है जिसे प्रतीत होता है असंबंधित प्रतिगमन के रूप में जाना जाता है। हम गुणांक का अनुमान लगा सकते हैं और दो मॉडल में सहसंबद्ध त्रुटियों को ध्यान में रखते हुए मानक त्रुटियों को प्राप्त कर सकते हैं। कई समीकरण मॉडल की एक महत्वपूर्ण विशेषता यह है कि हम भविष्यवाणियों के सभी समीकरणों का परीक्षण कर सकते हैं। कई समीकरण प्रतिगमन का एक और उदाहरण है, अगर हम y1, y2 और y3 को एक्स 1 और एक्स 2 से अनुमान लगाने की कामना करें। यह एक तीन समीकरण प्रणाली है, जिसे बहुभिन्नरूपी प्रतिगमन के रूप में जाना जाता है, प्रत्येक मॉडल के लिए एक ही भविष्यवक्ता चर के साथ। दोबारा, हमारे पास विभिन्न समीकरणों में परीक्षण गुणक की क्षमता है। एकाधिक समीकरण मॉडल हमारे डेटा विश्लेषण टूल किट के लिए एक शक्तिशाली विस्तार हैं। 4.5.1 प्रतीत होता है असंबंधित प्रतिगमन प्रतीत होता है असंबंधित प्रतिगमन के उपयोग को स्पष्ट करने के लिए एचएसबी 2 डेटा फ़ाइल का इस्तेमाल करना जारी रखता है। यदि इसे साफ़ कर दिया गया हो, तो आप इसे फिर से स्मृति में लोड कर सकते हैं इस समय दो प्रतिगमन मॉडल को देखने देता है। यह ऐसा मामला है कि इन दोनों मॉडलों से त्रुटियां (अवशिष्ट) सहसंबद्ध होंगे। यह तब भी सच होगा जब भविष्यवक्ता महिला दोनों मॉडल में नहीं मिलती थी। त्रुटियों को सहसंबंधित किया जाएगा क्योंकि वेरिएबल के सभी मान एक ही सेट के अवलोकन पर एकत्र किए जाते हैं। यह एक स्थिति दर्जी है जो निश्चित रूप से असंबंधित प्रतिगमन के लिए सुनिश्चित कमांड का उपयोग कर रहा है। यहां हमारा पहला मॉडल ओएलएस का उपयोग कर रहा है और यहां हमारा दूसरा मॉडल OLS का उपयोग कर रहा है निश्चित आदेश के साथ हम दोनों मॉडलों का एक साथ समय पर सहसंबद्ध त्रुटियों का लेखा-जोखा कर सकते हैं, जिससे गुणांक और मानक त्रुटियों के कुशल अनुमान लगते हैं। यकीन के साथ corr विकल्प को शामिल करके हम दो मॉडल की त्रुटियों के बीच के संबंध के अनुमान भी प्राप्त कर सकते हैं। ध्यान दें कि गुणांक और उनके मानक त्रुटियों के अनुमान दोनों ऊपर दिखाए गए OLS मॉडल अनुमानों से अलग हैं। उत्पादन के नीचे एक ब्रेसन-पिगना परीक्षण प्रदान करता है कि क्या दो समीकरणों के अवशेष स्वतंत्र हैं (इस मामले में, हम कहेंगे कि अवशिष्ट स्वतंत्र नहीं थे, p0.0407)। अब जब हमने अनुमान लगाया है कि हमारे मॉडल ने भविष्यवक्ता चर का परीक्षण किया है महिला के लिए परीक्षण दोनों मॉडलों से जानकारी जोड़ती है गणित और पढ़ने के लिए परीक्षण वास्तव में ऊपर दिए गए z - परीक्षणों के बराबर होते हैं सिवाय इसके कि परिणाम ची-स्क्वायर परीक्षण के रूप में दिखाए जाते हैं। अब, 3 मॉडल का अनुमान लगाते हैं, जहां हम नीचे दिखाए गए अनुसार प्रत्येक मॉडल में एक ही पूर्वानुमान लगाने का उपयोग करते हैं। यदि अब आपके पास ठेस के लिए डमी वैरिएबल नहीं है आप उन्हें टैबलेट कमांड का उपयोग कर पुन: विश्राम कर सकते हैं। पहले 3 अनुमानों के साथ इन तीन मॉडलों का अनुमान लगाते हैं। ये प्रतिगामी गुणांक और मानक त्रुटियों का सटीक अनुमान प्रदान करते हैं लेकिन ये परिणाम प्रत्येक विश्लेषण के अवशेषों को ग्रहण करते हैं दूसरों की पूरी तरह से स्वतंत्र हैं इसके अलावा, अगर हम महिला का परीक्षण करना चाहते हैं हमें इसे तीन बार करना पड़ता है और सभी तीन परीक्षणों से जानकारी को एक समग्र परीक्षण में शामिल करने में सक्षम नहीं होता। अब एक ही मॉडल का अनुमान लगाने के लिए सुनिश्चित करें। चूंकि सभी 3 मॉडल में एक ही अनुमान है, हम नीचे दिए गए वाक्यविन्यास का उपयोग कर सकते हैं, जो नीचे पढ़ा है। लिखने और गणित प्रत्येक महिला द्वारा भविष्यवाणी की जाएगी। prog1 और prog3 ध्यान दें कि गुणांक ऊपर दिए गए OLS परिणामों में समान हैं और नीचे दिए गए निश्चित परिणाम हैं, हालांकि मानक समीकरण अलग-अलग हैं, केवल थोड़ा, कई समीकरणों में अवशेषों के बीच संबंध होने के कारण। अधिक उपयुक्त मानक त्रुटियों को प्राप्त करने के अलावा, सुनिश्चित करें कि हम समीकरणों के भविष्यवक्ताओं के प्रभावों का परीक्षण करने की अनुमति दें। हम इस परिकल्पना की जांच कर सकते हैं कि सभी तीन परिणाम चर के लिए महिला का गुणांक 0 है, जैसा कि नीचे दिखाया गया है। हम यह भी अवधारणा का परीक्षण कर सकते हैं कि महिला के गुणांक पढ़ने और गणित के लिए 0 है। ध्यान दें कि readfemale का मतलब है कि परिणामस्वरूप चर पढ़ने के लिए महिला के लिए गुणांक हम इस परिकल्पना की जांच भी कर सकते हैं कि प्रोग 1 और प्रोग 3 के गुणांक सभी तीन परिणाम चर के लिए 0 हैं, जैसा नीचे दिखाया गया है। 4.5.2 बहुभिन्नरूपी प्रतिगमन अब मल्टीवीयेट रीग्रेशन का उपयोग करके mvreg कमांड का उपयोग करके एक ही विश्लेषण को देखने के लिए जो हमने ऊपर दिए गए निश्चित उदाहरण में देखा है, निम्नलिखित 3 मॉडल का अनुमान लगाया है। यदि आपके पास स्मृति में hsb2 डेटा फ़ाइल न हो, तो आप इसे नीचे का उपयोग कर सकते हैं और फिर prog1 - prog3 के लिए डमी चर बना सकते हैं। नीचे पढ़ने के लिए हम भविष्यवाणी करने के लिए mvreg का उपयोग करते हैं। लिखने और महिला से गणित prog1 और prog3 ध्यान दें कि आउटपुट का सबसे ऊपरी भाग निश्चित आउटपुट के समान है, इसमें प्रत्येक परिणाम वैरिएबल के लिए मॉडल का एक समग्र सारांश देता है, हालांकि परिणाम कुछ हद तक भिन्न होते हैं और निश्चित तौर पर चीग स्क्वायर का परीक्षण का समग्र फिट मॉडल, और mvreg एक एफ परीक्षण का उपयोग करता है। आउटपुट का निचला भाग निश्चित आउटपुट के समान दिखाई देता है, हालांकि, जब आप मानक त्रुटियों की तुलना करते हैं, तो आप देख सकते हैं कि परिणाम समान नहीं हैं। ये मानक त्रुटियाँ ओएलएस मानक त्रुटियों से मेल खाती हैं, इसलिए इन परिणामों से अवशेषों के बीच के संबंधों को ध्यान में नहीं रखा जाता है (जैसे निश्चित परिणाम)। अब, परीक्षण महिला देता है ध्यान दें, महिलाएं केवल तीन समीकरणों में से एक में सांख्यिकीय रूप से महत्वपूर्ण थीं Mvreg के बाद टेस्ट कमान का उपयोग करने से हमें एक साथ सभी तीन समीकरणों में महिला का परीक्षण करने की अनुमति मिलती है और, अनुमान लगाओ कि यह क्या महत्वपूर्ण है यह सुनिश्चित करने के साथ मिलकर हमारे अनुरूप है जो कि चींटी स्क्वायर टेस्ट का उपयोग करके यह परीक्षण किया था। हम prog1 और prog3 का भी परीक्षण कर सकते हैं। दोनों अलग-अलग और संयुक्त याद रखें ये बहुभिन्नरूपी परीक्षण हैं। पारंपरिक बहुभिन्नरूपी विश्लेषण से परिचित कई शोधकर्ताओं ने उपरोक्त परीक्षणों को नहीं पहचाना। वे विल्क्स लैम्ब्डा, पिलाइज़ ट्रेस या होटेलिंग-लॉले ट्रेस आँकड़े, आँकड़ों से परिचित नहीं हैं, जिन्हें वे परिचित हैं। सिनसिनाटी विश्वविद्यालय के डेविड ई। मूर द्वारा लिखित mvtest कमांड का उपयोग करके इन आंकड़ों को प्राप्त करना संभव है। mvtest जो यूसीएलए को स्टाटा 6 और इसके बाद के संस्करण के साथ काम करने के लिए अपडेट किया गया है, इस तरह इंटरनेट पर डाउनलोड किया जा सकता है। अब हमने इसे डाउनलोड किया है, हम इसे इस तरह उपयोग कर सकते हैं। हम सभी प्रक्षेपक चर सहित एक mvtest के साथ समाप्त हो जाएगा यह मॉडल का एक समग्र बहुभिन्नरूपी परीक्षण है। यकीनन और mvreg कमांड दोनों आपको इस तथ्य को ध्यान में रखते हुए बहु-समीकरण मॉडल का परीक्षण करने की अनुमति देते हैं कि समीकरण स्वतंत्र नहीं हैं निश्चित आदेश आपको प्रत्येक समीकरण के अनुमान प्राप्त करने की अनुमति देता है जो समीकरणों की गैर-स्वतंत्रता के लिए समायोजित करता है, और यह आपको ऐसे समीकरणों का अनुमान लगाने की अनुमति देता है जो आवश्यक रूप से वही भविष्यवक्ता नहीं होते हैं। इसके विपरीत, mvreg उन समीकरणों तक सीमित है, जिनके पास भविष्यवाणियों का एक ही सेट है, और यह व्यक्तिगत समीकरणों के लिए प्रदान किए गए अनुमान OLS अनुमानों के समान हैं। हालांकि, mvreg (विशेषकर जब mvtest के साथ मिलाया जाता है) आपको भविष्यवाणियों के अधिक पारंपरिक बहुभिन्नरूपी परीक्षण करने की अनुमति देता है। इस अध्याय में विभिन्न प्रकार के विषयों को शामिल किया गया है जो साधारण कम से कम वर्गों के प्रतिगमन से परे हैं, लेकिन फिर भी हम ऐसे कई विषयों में शामिल रहें हैं जिनसे हम चाहते थे कि हम सर्वेक्षण डेटा के विश्लेषण, ग़लत डेटा, पैनल डेटा विश्लेषण, और अधिक से निपटने में शामिल हों। और, हमारे द्वारा कवर किए गए विषयों के लिए, हम चाहते हैं कि हम और भी विस्तार में जा सकें। इस अध्याय के लिए हमारे मुख्य लक्ष्यों में से एक यह है कि आपको कुछ ऐसी तकनीकों के बारे में पता होना चाहिए जो डेटा का विश्लेषण करने के लिए स्ताटा में उपलब्ध हैं जो कि ओएलएस प्रतिगमन की मान्यताओं और संभावित कुछ उपाय नहीं हैं। यदि आप यूसीएलए अनुसंधान समुदाय के सदस्य हैं, और आपके पास और प्रश्न हैं, तो हम आपको अपने डेटा विश्लेषण के लिए विशिष्ट मुद्दों पर चर्चा करने के लिए हमारी परामर्श सेवाओं का उपयोग करने के लिए आमंत्रित करते हैं। 4.7 स्व मूल्यांकन 1. अध्याय 2 (एटीएस. उक्ला.एस्टस्टैटवॉबबुकअस्रेक्रिम का उपयोग करें) में अपराध डेटा फ़ाइल का उपयोग करें और पीटकट्रो से हत्या की भविष्यवाणी के प्रतिगमन मॉडल को देखें। गरीबी pcths और एक एकल ओएलएस का उपयोग कर और अपग्रेड के बाद एक avlots और एक lvr2plot बनाते हैं। क्या कोई ऐसी स्थिति है जो चिंताजनक दिखती है, इस विश्लेषण को मजबूत मानक त्रुटियों के साथ प्रतिगमन का उपयोग कर दोहराएं और विश्लेषण के लिए एपलेट्स दिखाएं। मजबूत प्रतिगमन का उपयोग करके विश्लेषण दोहराएं और मैन्युअल रूप से निर्मित lvr2plot करें। Qreg का उपयोग करके परिणाम भी चलाएं विभिन्न विश्लेषण के परिणामों की तुलना करें। मजबूत प्रतिगमन से वज़न को देखो और वजन पर टिप्पणी करें। 2. Using the elemapi2 data file (use ats. ucla. edustatstatawebbooksregelemapi2 ) pretend that 550 is the lowest score that a school could achieve on api00 . i. e. create a new variable with the api00 score and recode it such that any score of 550 or below becomes 550. Use meals . ell and emer to predict api scores using 1) OLS to predict the original api score (before recoding) 2) OLS to predict the recoded score where 550 was the lowest value, and 3) using tobit to predict the recoded api score indicating the lowest value is 550. Compare the results of these analyses. 3. Using the elemapi2 data file (use ats. ucla. edustatstatawebbooksregelemapi2 ) pretend that only schools with api scores of 550 or higher were included in the sample. Use meals . ell and emer to predict api scores using 1) OLS to predict api from the full set of observations, 2) OLS to predict api using just the observations with api scores of 550 or higher, and 3) using truncreg to predict api using just the observations where api is 550 or higher. Compare the results of these analyses. 4. Using the hsb2 data file (use ats. ucla. edustatstatawebbooksreghsb2 ) predict read from science . socst . math and write . Use the testparm and test commands to test the equality of the coefficients for science . socst and math . Use cnsreg to estimate a model where these three parameters are equal. 5. Using the elemapi2 data file (use ats. ucla. edustatstatawebbooksregelemapi2 ) consider the following 2 regression equations. Estimate the coefficients for these predictors in predicting api00 and api99 taking into account the non-independence of the schools. Test the overall contribution of each of the predictors in jointly predicting api scores in these two years. Test whether the contribution of emer is the same for api00 and api99 . Click here for our answers to these self assessment questions. 4.8 For more informationResidual analysis and regression diagnostics There are many tools to closely inspect and diagnose results from regression and other estimation procedures, i. e. after you have performed a command like regress you can use, what Stata calls a command. Postestimation commands are found in two places: in the menu and . Below you will find a few examples for the most common options there are many more, including specific ones for different types of regression. For more details for the regress command check help regress postestimation. help logistic postestimation for logistic regression etc. Residuals, predicted values and other result variables The predict command lets you create a number of derived variables in a regression context, variables you can inspect and plot. Click the paperclip to see the options: menu dialog Creates py with the predicted values predict res1, residual Copies the residuals predict cd, cooksd Copies Cooks distance Heres a list of derived variables you can copy. Predicted values (OLS), predicted probabilities for logistic regression, probit.

No comments:

Post a Comment