02 में से 01
Excel में डुप्लिकेट डेटा रिकॉर्ड्स निकालें
एक्सेल जैसे स्प्रेडशीट प्रोग्राम अक्सर भागों के इन्वेंट्री, बिक्री रिकॉर्ड और मेलिंग सूचियों जैसी चीजों के लिए डेटाबेस के रूप में उपयोग किए जाते हैं।
एक्सेल में डेटाबेस डेटा के सारणी शामिल होते हैं जिन्हें आम तौर पर रिकॉर्ड नामक डेटा की पंक्तियों में व्यवस्थित किया जाता है।
एक रिकॉर्ड में, पंक्ति में प्रत्येक सेल या फ़ील्ड में डेटा संबंधित है - जैसे कि कंपनी का नाम, पता और फोन नंबर।
एक सामान्य समस्या जो डेटाबेस के आकार में बढ़ती है वह डुप्लिकेट रिकॉर्ड या डेटा की पंक्तियों का है।
यह डुप्लिकेशन तब हो सकता है यदि:
- पूरे रिकॉर्ड डेटाबेस में एक से अधिक बार दर्ज किए जाते हैं जिसके परिणामस्वरूप दो या दो से अधिक समान रिकॉर्ड होते हैं
- एकाधिक अभिलेखों में एक या अधिक फ़ील्ड होते हैं - जैसे नाम और पता - जिसमें एक ही डेटा होता है।
किसी भी तरह से, डुप्लिकेट रिकॉर्ड्स पूरी तरह से समस्याओं का कारण बन सकता है - जैसे कि मेल विलय में डेटाबेस जानकारी का उपयोग होने पर दस्तावेज़ों की कई प्रतियां मेल करना - इसलिए नियमित रूप से डुप्लिकेट रिकॉर्ड स्कैन करना और निकालना अच्छा विचार है आधार।
और उपर्युक्त छवि में से एक जैसे छोटे नमूने में डुप्लिकेट रिकॉर्ड चुनना आसान है, लेकिन डेटा टेबल में आसानी से सैकड़ों हो सकते हैं यदि हजारों रिकॉर्ड डुप्लिकेट रिकॉर्ड चुनने में बहुत मुश्किल नहीं बनाते - विशेष रूप से आंशिक रूप से मेल खाते हैं।
इस कार्य को पूरा करना आसान बनाने के लिए, एक्सेल को डेटा टूल में बनाया गया है, जिसे आश्चर्य की बात नहीं है, डुप्लिकेट निकालें , जिसका उपयोग समान और आंशिक रूप से मेल खाने वाले रिकॉर्ड खोजने और निकालने के लिए किया जा सकता है।
हालांकि, निकालें डुप्लिकेट उपकरण को डिज़ाइन किया गया है, समान और आंशिक रूप से मेल खाने वाले रिकॉर्ड अलग से निपटाए जाने चाहिए।
ऐसा इसलिए है क्योंकि निकालें डुप्लिकेट संवाद बॉक्स चयनित डेटा तालिका के लिए फ़ील्ड नाम प्रदर्शित करता है और आप चुनते हैं कि मिलान करने वाले रिकॉर्ड्स की खोज में कौन से फ़ील्ड शामिल हैं:
- समान अभिलेखों के लिए, सभी क्षेत्रों की खोज करें - सभी कॉलम या फ़ील्ड नामों के बगल में चेक अंक छोड़ दें;
- आंशिक रूप से मेल खाने वाले रिकॉर्ड के लिए - मिलान करने के लिए केवल उन फ़ील्ड के बगल में चेक अंक छोड़ दें।
फील्ड नाम बनाम कॉलम पत्र
जैसा कि बताया गया है, निकालें डुप्लिकेट टूल में एक संवाद बॉक्स होता है जहां आप वांछित फ़ील्ड या कॉलम नामों को चेक करके खोज करने के लिए कौन से मिलान फ़ील्ड चुनते हैं।
डायलॉग बॉक्स प्रदर्शित करने वाली जानकारी - फ़ील्ड नाम या कॉलम अक्षरों - इस बात पर निर्भर करता है कि उपरोक्त छवि में दिखाई देने वाले डेटा तालिका के शीर्ष पर आपके डेटा में हेडिंग्स या हेडर की एक पंक्ति है या नहीं।
यदि ऐसा होता है - सुनिश्चित करें कि डायलॉग बॉक्स के दाईं ओर स्थित विकल्प - मेरे डेटा में हेडर हैं - चेक किया गया है और एक्सेल डायलॉग बॉक्स में फील्ड नाम के रूप में इस पंक्ति में नाम प्रदर्शित करेगा।
यदि आपके डेटा में हेडर पंक्ति नहीं है, तो डायलॉग बॉक्स डेटा की चयनित श्रेणी के लिए संवाद बॉक्स में उचित कॉलम अक्षरों को प्रदर्शित करेगा।
डेटा की संगत रेंज
निकालें डुप्लिकेट उपकरण को ठीक से काम करने के लिए, डेटा तालिका डेटा की एक संगत रेंज होनी चाहिए - जिसमें यह खाली रिक्त स्थान, कॉलम, और यदि संभव हो, तो तालिका में स्थित कोई खाली कक्ष नहीं होना चाहिए।
डेटा तालिका में रिक्त स्थान नहीं है, जब सामान्य रूप से डेटा प्रबंधन की बात आती है और न केवल डुप्लिकेट डेटा की खोज करते समय। एक्सेल के अन्य डेटा टूल्स - जैसे कि सॉर्टिंग और फ़िल्टरिंग - डेटा तालिका डेटा की एक संगत श्रृंखला होने पर सबसे अच्छा काम करती है।
डुप्लिकेट डेटा रिकॉर्ड्स उदाहरण निकालें
उपर्युक्त छवि में, डेटा तालिका में ए थॉम्पसन के लिए दो समान रिकॉर्ड और आर होल्ट के लिए दो आंशिक रूप से मेल खाने वाले रिकॉर्ड शामिल हैं - जहां सभी फ़ील्ड छात्र संख्या को छोड़कर मेल खाते हैं।
नीचे सूचीबद्ध चरणों में विस्तारित डुप्लिकेट डेटा टूल का उपयोग कैसे करें:
- ए थॉम्पसन के लिए दो समान रिकॉर्डों को हटा दें।
- आर होल्ट के लिए दूसरे आंशिक मिलान रिकॉर्ड को हटा दें।
निकालें डुप्लिकेट संवाद बॉक्स खोलना
- नमूना डेटाबेस में डेटा युक्त किसी भी सेल पर क्लिक करें।
- रिबन पर डेटा टैब पर क्लिक करें।
- डेटा तालिका में सभी डेटा को हाइलाइट करने और निकालें डुप्लिकेट संवाद बॉक्स खोलने के लिए निकालें डुप्लिकेट आइकन पर क्लिक करें।
- निकालें डुप्लिकेट संवाद बॉक्स हमारे डेटा नमूने से सभी कॉलम शीर्षलेख या फ़ील्ड नाम प्रदर्शित करता है
- फ़ील्ड नामों के बगल में स्थित चेक अंक इंगित करते हैं कि कौन से कॉलम Excel डुप्लिकेट रिकॉर्ड खोजने में मिलान करने का प्रयास करेंगे
- डिफ़ॉल्ट रूप से, जब संवाद बॉक्स खुलता है तो सभी फ़ील्ड नामों की जांच की जाती है
समान रिकॉर्ड्स ढूँढना
- चूंकि हम इस उदाहरण में पूरी तरह से समान रिकॉर्ड खोज रहे हैं, इसलिए हम सभी कॉलम शीर्षलेखों को चेक कर देंगे
- ओके पर क्लिक करें
इस बिंदु पर निम्नलिखित परिणाम देखा जाना चाहिए:
- संवाद बॉक्स को बंद करना चाहिए और एक संदेश द्वारा प्रतिस्थापित किया जाना चाहिए: 1 डुप्लिकेट मान पाए और हटा दिए गए; 7 अद्वितीय मूल्य बने रहते हैं।
- डुप्लिकेट ए थॉम्पसन रिकॉर्ड वाली पंक्ति डेटाबेस से हटा दी जाएगी
- भले ही आर होल्ट के लिए दो आंशिक मिलान रिकॉर्ड हैं, क्योंकि सभी फ़ील्ड मेल नहीं खाते हैं - दो रिकॉर्ड के लिए छात्र संख्या भिन्न है - एक्सेल इसे एक अद्वितीय डेटा रिकॉर्ड मानता है
02 में से 02
निकालें डुप्लिकेट के साथ आंशिक मिलान रिकॉर्ड्स खोजें और निकालें
एक समय में एक फ़ील्ड की जांच
चूंकि एक्सेल केवल डेटा रिकॉर्ड्स को हटा देता है जो डेटा के चयनित फ़ील्ड के लिए बिल्कुल मेल खाते हैं, सभी आंशिक रूप से मेल खाने वाले डेटा रिकॉर्ड्स को खोजने का सबसे अच्छा तरीका एक ही समय में केवल एक फ़ील्ड के लिए चेक मार्क को निकालना है, जैसा कि नीचे दिए गए चरणों में किया गया है।
नाम, आयु या कार्यक्रम को छोड़कर सभी क्षेत्रों में मेल खाने वाले रिकॉर्ड के लिए बाद की खोज आंशिक मिलान वाले रिकॉर्ड के लिए सभी संभावित संयोजनों को हटा देगी।
आंशिक मिलान रिकॉर्ड ढूँढना
- यदि आवश्यक हो तो डेटा तालिका में डेटा वाले किसी भी सेल पर क्लिक करें
- रिबन पर डेटा टैब पर क्लिक करें।
- डेटा तालिका में सभी डेटा को हाइलाइट करने और निकालें डुप्लिकेट संवाद बॉक्स खोलने के लिए निकालें डुप्लिकेट आइकन पर क्लिक करें।
- डेटा तालिका के लिए सभी फ़ील्ड नाम या कॉलम शीर्षलेख चयनित हैं।
- उन रिकॉर्ड्स को ढूंढने और निकालने के लिए जिनके पास प्रत्येक फ़ील्ड में कोई मिलान नहीं है, उन फ़ील्ड नामों के अलावा चेक मार्क को हटाएं जिन्हें Excel को अनदेखा करना है।
- इस उदाहरण के लिए चेक मार्क को हटाने के लिए छात्र आईडी कॉलम शीर्षक के बगल में स्थित चेक बॉक्स पर क्लिक करें।
- एक्सेल अब केवल उन रिकॉर्ड्स को खोज और हटा देगा जिनके पास अंतिम नाम , प्रारंभिक और प्रोग्राम फ़ील्ड में मिलान डेटा है।
- ओके पर क्लिक करें
- संवाद बॉक्स को बंद करना चाहिए और एक संदेश द्वारा प्रतिस्थापित किया जाना चाहिए: 1 डुप्लिकेट मान पाए और हटा दिए गए; 6 अद्वितीय मूल्य रहते हैं।
- एसटी 348-252 की छात्र आईडी के साथ आर होल्ट के लिए दूसरा रिकॉर्ड वाला पंक्ति डेटाबेस से हटा दी जाएगी।
- संदेश बॉक्स को बंद करने के लिए ठीक क्लिक करें
इस बिंदु पर, उदाहरण डेटा तालिका सभी डुप्लिकेट डेटा से मुक्त होना चाहिए।