रिग्रेशन सांख्यिकीय मॉडल को परिभाषित करना

प्रतिगमन चर के बीच संबंधों का विश्लेषण करता है

रिग्रेशन एक डेटा खनन तकनीक है जो किसी विशेष डेटासेट को देखते हुए संख्यात्मक मानों ( निरंतर मान भी कहा जाता है ) की एक श्रृंखला की भविष्यवाणी करने के लिए उपयोग की जाती है। उदाहरण के लिए, अन्य चर के बाद, किसी उत्पाद या सेवा की लागत की भविष्यवाणी करने के लिए प्रतिगमन का उपयोग किया जा सकता है।

व्यापार और विपणन योजना, वित्तीय पूर्वानुमान, पर्यावरण मॉडलिंग और रुझानों के विश्लेषण के लिए कई उद्योगों में रिग्रेशन का उपयोग किया जाता है।

रिग्रेशन बनाम वर्गीकरण

रिग्रेशन और वर्गीकरण डेटा खनन तकनीकों को समान समस्याओं को हल करने के लिए उपयोग किया जाता है, लेकिन वे अक्सर भ्रमित होते हैं। दोनों भविष्यवाणी विश्लेषण में उपयोग किए जाते हैं, लेकिन प्रतिगमन का उपयोग संख्यात्मक या निरंतर मूल्य की भविष्यवाणी करने के लिए किया जाता है जबकि वर्गीकरण अलग-अलग श्रेणियों में डेटा निर्दिष्ट करता है।

उदाहरण के लिए, रिग्रेशन का इस्तेमाल उसके स्थान, स्क्वायर फीट, आखिरी बेची जाने वाली कीमत, समान घरों की कीमत और अन्य कारकों के आधार पर घर के मूल्य की भविष्यवाणी करने के लिए किया जाएगा। वर्गीकरण क्रम में होगा यदि आप घरों को श्रेणियों में व्यवस्थित करना चाहते हैं, जैसे चलने योग्यता, बहुत आकार या अपराध दर।

रिग्रेशन तकनीक के प्रकार

प्रतिगमन का सबसे सरल और सबसे पुराना रूप रैखिक प्रतिगमन है जो दो चर के बीच संबंध का अनुमान लगाने के लिए प्रयोग किया जाता है। यह तकनीक सीधी रेखा के गणितीय सूत्र का उपयोग करती है (y = mx + b)। सादे शब्दों में, इसका मतलब यह है कि, वाई और एक्स-अक्ष के साथ ग्राफ दिया गया है, एक्स और वाई के बीच का रिश्ता कुछ आउटलाइनर्स के साथ सीधी रेखा है। उदाहरण के लिए, हम मान सकते हैं कि, जनसंख्या में वृद्धि के कारण, खाद्य उत्पादन एक ही दर पर बढ़ेगा - इसके लिए दो आंकड़ों के बीच एक मजबूत, रैखिक संबंध की आवश्यकता है। इसे देखने के लिए, एक ग्राफ पर विचार करें जिसमें वाई-अक्ष ट्रैक जनसंख्या में वृद्धि करता है, और एक्स-अक्ष खाद्य उत्पादन को ट्रैक करता है। चूंकि वाई मान बढ़ता है, एक्स मान एक ही दर पर बढ़ेगा, जिससे उनके बीच संबंध सीधे सीधी रेखा बन जाएगा।

कई तकनीकों जैसे उन्नत प्रतिगमन, एकाधिक चर के बीच संबंधों की भविष्यवाणी करते हैं - उदाहरण के लिए, क्या आय, शिक्षा और जहां कोई रहना चुनता है, के बीच एक सहसंबंध है? अधिक चर के अतिरिक्त भविष्यवाणी की जटिलता में काफी वृद्धि होती है। मानक, पदानुक्रमिक, setwise और stepwise सहित कई प्रकार की कई प्रतिगमन तकनीकों हैं, जिनमें से प्रत्येक अपने स्वयं के आवेदन के साथ है।

इस बिंदु पर, यह समझना महत्वपूर्ण है कि हम भविष्यवाणी (आश्रित या अनुमानित चर) की भविष्यवाणी करने का प्रयास कर रहे हैं और डेटा जिसे हम भविष्यवाणी (स्वतंत्र या भविष्यवाणियों चर) बनाने के लिए उपयोग कर रहे हैं। हमारे उदाहरण में, हम उस स्थान की भविष्यवाणी करना चाहते हैं जहां कोई व्यक्ति आय (शिक्षा) और भविष्यवाणी ( पूर्वानुमानित चर) दोनों को जीने का विकल्प चुनता है।