Excel में डेटा की डुप्लिकेट पंक्तियां निकालें

02 में से 01

Excel में डुप्लिकेट डेटा रिकॉर्ड्स निकालें

डुप्लिकेट निकालें - फ़ील्ड नाम द्वारा समान रिकॉर्ड्स के लिए खोज। © टेड फ्रेंच

एक्सेल जैसे स्प्रेडशीट प्रोग्राम अक्सर भागों के इन्वेंट्री, बिक्री रिकॉर्ड और मेलिंग सूचियों जैसी चीजों के लिए डेटाबेस के रूप में उपयोग किए जाते हैं।

एक्सेल में डेटाबेस डेटा के सारणी शामिल होते हैं जिन्हें आम तौर पर रिकॉर्ड नामक डेटा की पंक्तियों में व्यवस्थित किया जाता है।

एक रिकॉर्ड में, पंक्ति में प्रत्येक सेल या फ़ील्ड में डेटा संबंधित है - जैसे कि कंपनी का नाम, पता और फोन नंबर।

एक सामान्य समस्या जो डेटाबेस के आकार में बढ़ती है वह डुप्लिकेट रिकॉर्ड या डेटा की पंक्तियों का है।

यह डुप्लिकेशन तब हो सकता है यदि:

किसी भी तरह से, डुप्लिकेट रिकॉर्ड्स पूरी तरह से समस्याओं का कारण बन सकता है - जैसे कि मेल विलय में डेटाबेस जानकारी का उपयोग होने पर दस्तावेज़ों की कई प्रतियां मेल करना - इसलिए नियमित रूप से डुप्लिकेट रिकॉर्ड स्कैन करना और निकालना अच्छा विचार है आधार।

और उपर्युक्त छवि में से एक जैसे छोटे नमूने में डुप्लिकेट रिकॉर्ड चुनना आसान है, लेकिन डेटा टेबल में आसानी से सैकड़ों हो सकते हैं यदि हजारों रिकॉर्ड डुप्लिकेट रिकॉर्ड चुनने में बहुत मुश्किल नहीं बनाते - विशेष रूप से आंशिक रूप से मेल खाते हैं।

इस कार्य को पूरा करना आसान बनाने के लिए, एक्सेल को डेटा टूल में बनाया गया है, जिसे आश्चर्य की बात नहीं है, डुप्लिकेट निकालें , जिसका उपयोग समान और आंशिक रूप से मेल खाने वाले रिकॉर्ड खोजने और निकालने के लिए किया जा सकता है।

हालांकि, निकालें डुप्लिकेट उपकरण को डिज़ाइन किया गया है, समान और आंशिक रूप से मेल खाने वाले रिकॉर्ड अलग से निपटाए जाने चाहिए।

ऐसा इसलिए है क्योंकि निकालें डुप्लिकेट संवाद बॉक्स चयनित डेटा तालिका के लिए फ़ील्ड नाम प्रदर्शित करता है और आप चुनते हैं कि मिलान करने वाले रिकॉर्ड्स की खोज में कौन से फ़ील्ड शामिल हैं:

फील्ड नाम बनाम कॉलम पत्र

जैसा कि बताया गया है, निकालें डुप्लिकेट टूल में एक संवाद बॉक्स होता है जहां आप वांछित फ़ील्ड या कॉलम नामों को चेक करके खोज करने के लिए कौन से मिलान फ़ील्ड चुनते हैं।

डायलॉग बॉक्स प्रदर्शित करने वाली जानकारी - फ़ील्ड नाम या कॉलम अक्षरों - इस बात पर निर्भर करता है कि उपरोक्त छवि में दिखाई देने वाले डेटा तालिका के शीर्ष पर आपके डेटा में हेडिंग्स या हेडर की एक पंक्ति है या नहीं।

यदि ऐसा होता है - सुनिश्चित करें कि डायलॉग बॉक्स के दाईं ओर स्थित विकल्प - मेरे डेटा में हेडर हैं - चेक किया गया है और एक्सेल डायलॉग बॉक्स में फील्ड नाम के रूप में इस पंक्ति में नाम प्रदर्शित करेगा।

यदि आपके डेटा में हेडर पंक्ति नहीं है, तो डायलॉग बॉक्स डेटा की चयनित श्रेणी के लिए संवाद बॉक्स में उचित कॉलम अक्षरों को प्रदर्शित करेगा।

डेटा की संगत रेंज

निकालें डुप्लिकेट उपकरण को ठीक से काम करने के लिए, डेटा तालिका डेटा की एक संगत रेंज होनी चाहिए - जिसमें यह खाली रिक्त स्थान, कॉलम, और यदि संभव हो, तो तालिका में स्थित कोई खाली कक्ष नहीं होना चाहिए।

डेटा तालिका में रिक्त स्थान नहीं है, जब सामान्य रूप से डेटा प्रबंधन की बात आती है और न केवल डुप्लिकेट डेटा की खोज करते समय। एक्सेल के अन्य डेटा टूल्स - जैसे कि सॉर्टिंग और फ़िल्टरिंग - डेटा तालिका डेटा की एक संगत श्रृंखला होने पर सबसे अच्छा काम करती है।

डुप्लिकेट डेटा रिकॉर्ड्स उदाहरण निकालें

उपर्युक्त छवि में, डेटा तालिका में ए थॉम्पसन के लिए दो समान रिकॉर्ड और आर होल्ट के लिए दो आंशिक रूप से मेल खाने वाले रिकॉर्ड शामिल हैं - जहां सभी फ़ील्ड छात्र संख्या को छोड़कर मेल खाते हैं।

नीचे सूचीबद्ध चरणों में विस्तारित डुप्लिकेट डेटा टूल का उपयोग कैसे करें:

  1. ए थॉम्पसन के लिए दो समान रिकॉर्डों को हटा दें।
  2. आर होल्ट के लिए दूसरे आंशिक मिलान रिकॉर्ड को हटा दें।

निकालें डुप्लिकेट संवाद बॉक्स खोलना

  1. नमूना डेटाबेस में डेटा युक्त किसी भी सेल पर क्लिक करें।
  2. रिबन पर डेटा टैब पर क्लिक करें।
  3. डेटा तालिका में सभी डेटा को हाइलाइट करने और निकालें डुप्लिकेट संवाद बॉक्स खोलने के लिए निकालें डुप्लिकेट आइकन पर क्लिक करें।
  4. निकालें डुप्लिकेट संवाद बॉक्स हमारे डेटा नमूने से सभी कॉलम शीर्षलेख या फ़ील्ड नाम प्रदर्शित करता है
  5. फ़ील्ड नामों के बगल में स्थित चेक अंक इंगित करते हैं कि कौन से कॉलम Excel डुप्लिकेट रिकॉर्ड खोजने में मिलान करने का प्रयास करेंगे
  6. डिफ़ॉल्ट रूप से, जब संवाद बॉक्स खुलता है तो सभी फ़ील्ड नामों की जांच की जाती है

समान रिकॉर्ड्स ढूँढना

  1. चूंकि हम इस उदाहरण में पूरी तरह से समान रिकॉर्ड खोज रहे हैं, इसलिए हम सभी कॉलम शीर्षलेखों को चेक कर देंगे
  2. ओके पर क्लिक करें

इस बिंदु पर निम्नलिखित परिणाम देखा जाना चाहिए:

02 में से 02

निकालें डुप्लिकेट के साथ आंशिक मिलान रिकॉर्ड्स खोजें और निकालें

डुप्लिकेट निकालें - फील्ड नाम से आंशिक मिलान रिकॉर्ड्स के लिए खोज रहे हैं। © टेड फ्रेंच

एक समय में एक फ़ील्ड की जांच

चूंकि एक्सेल केवल डेटा रिकॉर्ड्स को हटा देता है जो डेटा के चयनित फ़ील्ड के लिए बिल्कुल मेल खाते हैं, सभी आंशिक रूप से मेल खाने वाले डेटा रिकॉर्ड्स को खोजने का सबसे अच्छा तरीका एक ही समय में केवल एक फ़ील्ड के लिए चेक मार्क को निकालना है, जैसा कि नीचे दिए गए चरणों में किया गया है।

नाम, आयु या कार्यक्रम को छोड़कर सभी क्षेत्रों में मेल खाने वाले रिकॉर्ड के लिए बाद की खोज आंशिक मिलान वाले रिकॉर्ड के लिए सभी संभावित संयोजनों को हटा देगी।

आंशिक मिलान रिकॉर्ड ढूँढना

  1. यदि आवश्यक हो तो डेटा तालिका में डेटा वाले किसी भी सेल पर क्लिक करें
  2. रिबन पर डेटा टैब पर क्लिक करें।
  3. डेटा तालिका में सभी डेटा को हाइलाइट करने और निकालें डुप्लिकेट संवाद बॉक्स खोलने के लिए निकालें डुप्लिकेट आइकन पर क्लिक करें।
  4. डेटा तालिका के लिए सभी फ़ील्ड नाम या कॉलम शीर्षलेख चयनित हैं।
  5. उन रिकॉर्ड्स को ढूंढने और निकालने के लिए जिनके पास प्रत्येक फ़ील्ड में कोई मिलान नहीं है, उन फ़ील्ड नामों के अलावा चेक मार्क को हटाएं जिन्हें Excel को अनदेखा करना है।
  6. इस उदाहरण के लिए चेक मार्क को हटाने के लिए छात्र आईडी कॉलम शीर्षक के बगल में स्थित चेक बॉक्स पर क्लिक करें।
  7. एक्सेल अब केवल उन रिकॉर्ड्स को खोज और हटा देगा जिनके पास अंतिम नाम , प्रारंभिक और प्रोग्राम फ़ील्ड में मिलान डेटा है।
  8. ओके पर क्लिक करें
  9. संवाद बॉक्स को बंद करना चाहिए और एक संदेश द्वारा प्रतिस्थापित किया जाना चाहिए: 1 डुप्लिकेट मान पाए और हटा दिए गए; 6 अद्वितीय मूल्य रहते हैं।
  10. एसटी 348-252 की छात्र आईडी के साथ आर होल्ट के लिए दूसरा रिकॉर्ड वाला पंक्ति डेटाबेस से हटा दी जाएगी।
  11. संदेश बॉक्स को बंद करने के लिए ठीक क्लिक करें

इस बिंदु पर, उदाहरण डेटा तालिका सभी डुप्लिकेट डेटा से मुक्त होना चाहिए।