Google पुस्तकें में 'Ngram Viewer' टूल का उपयोग कैसे करें

एक Ngram, जिसे आमतौर पर एन-ग्राम भी कहा जाता है, टेक्स्ट में किसी प्रकार की वस्तु के एन (संख्या) को खोजने के लिए पाठ या भाषण सामग्री का सांख्यिकीय विश्लेषण होता है। यह सभी प्रकार की चीजें हो सकती है, जैसे फोनेम, उपसर्ग, वाक्यांश, या पत्र। यद्यपि एन-ग्राम शोधकर्ता के बाहर कुछ हद तक अस्पष्ट है, लेकिन वास्तव में यह विभिन्न क्षेत्रों में उपयोग किया जाता है, और इसमें कंप्यूटर प्रोग्राम बनाने वाले लोगों के लिए बहुत सारे प्रभाव पड़ते हैं जो प्राकृतिक बोली जाने वाली भाषा को समझते हैं और जवाब देते हैं। संक्षेप में, इस विचार में Google की रूचि होगी।

Google पुस्तकें न्रामम व्यूअर के मामले में, विश्लेषण किए जाने वाले पाठ में सार्वजनिक पुस्तकालयों से Google पुस्तकें खोज इंजन को पॉप्युलेट करने के लिए Google द्वारा स्कैन किए गए विशाल पुस्तकों से आता है। Google पुस्तकें Ngram व्यूअर के लिए, वे उस पाठ को संदर्भित करते हैं जिसे आप "कॉर्पस" के रूप में खोजने जा रहे हैं। Ngram व्यूअर में निगम भाषा से विभाजित हैं, हालांकि आप अलग-अलग ब्रिटिश और अमेरिकी अंग्रेजी का विश्लेषण कर सकते हैं या उन्हें एक साथ जोड़ सकते हैं। यह ब्रिटिश से अमेरिकी शब्दों के उपयोग को टॉगल करने और चार्ट बदलने के लिए सुपर दिलचस्प होने के समाप्त होता है।

कैसे Ngram काम करता है

  1. Books.google.com/ngrams पर Google पुस्तकें Ngram व्यूअर पर जाएं।
  2. आइटम वेब-वेब खोजों के विपरीत केस-संवेदी हैं, इसलिए उचित संज्ञाओं को कैपिटल करना सुनिश्चित करें।
  3. आप जिस वाक्यांश या वाक्यांश का विश्लेषण करना चाहते हैं उसमें टाइप करें। प्रत्येक वाक्यांश को अल्पविराम से अलग करना सुनिश्चित करें। Google आपको शुरू करने के लिए "अल्बर्ट आइंस्टीन, शेरलॉक होम्स, फ्रेंकस्टीन" सुझाता है।
  4. अगला, तिथि सीमा टाइप करें। डिफ़ॉल्ट 1800 से 2000 है, लेकिन हाल ही की किताबें हैं (2011 को हाल ही में Google के दस्तावेज़ों पर सूचीबद्ध किया गया था, लेकिन यह बदल सकता है।)
  5. एक कॉर्पस चुनें। आप विदेशी भाषा ग्रंथों या अंग्रेजी की खोज कर सकते हैं, और मानक विकल्पों के अतिरिक्त, आप नीचे "अंग्रेजी (200 9) या अमेरिकी अंग्रेज़ी (200 9) जैसी चीजें देख सकते हैं। ये पुराने निगम हैं जिन्हें Google ने अपडेट किया है, लेकिन आपके पास पुराने डेटा सेट के विरुद्ध अपनी तुलना करने का कोई कारण हो सकता है। अधिकांश उपयोगकर्ता उन्हें अनदेखा कर सकते हैं और सबसे हालिया निगम पर ध्यान केंद्रित कर सकते हैं।
  6. अपने चिकनाई स्तर सेट करें। Smoothing का मतलब है कि ग्राफ अंत में कितनी चिकनी है। सबसे सटीक प्रतिनिधित्व 0 का एक चिकनाई स्तर होगा, लेकिन इसे पढ़ना मुश्किल हो सकता है। डिफ़ॉल्ट 3 पर सेट है। ज्यादातर मामलों में, आपको इसे समायोजित करने की आवश्यकता नहीं है।
  1. पुस्तकें खोजें बटन दबाएं। (आप खोज प्रॉम्प्ट पर भी एंटर दबा सकते हैं।)

Ngram क्या दिखा रहा है?

Google पुस्तकें Ngram Viewer एक ग्राफ आउटपुट करेगा जो समय के माध्यम से पुस्तकों में किसी विशेष वाक्यांश के उपयोग का प्रतिनिधित्व करता है। यदि आपने एक से अधिक शब्द या वाक्यांश दर्ज किए हैं, तो आप विभिन्न खोज शब्दों के विपरीत रंग-कोडित लाइन देखेंगे। यह Google Trends के समान ही है, केवल खोज में लंबे समय तक कवर शामिल है।

यहां एक असली जीवन उदाहरण है। हम हाल ही में सिरका पाई के बारे में उत्सुक थे। प्रेरी श्रृंखला पर लौरा इंगल्स वाइल्डर के लिटिल हाउस में उनका उल्लेख है, लेकिन हमने कभी ऐसी बात नहीं सुनी होगी। सिरका पाई के बारे में अधिक जानने के लिए हमने पहले Google की वेब खोज का उपयोग किया था। जाहिर है, उन्हें अमेरिकी दक्षिणी व्यंजन का हिस्सा माना जाता है और वास्तव में सिरका से बने होते हैं। वे कई बार सुनते हैं जब हर साल हर किसी के पास ताजा उपज तक पहुंच नहीं थी। क्या यह पूरी कहानी है?

हमने Google Ngram व्यूअर की खोज की, और शुरुआती और 1800 के दशक के उत्तरार्ध में पाई के कुछ उल्लेख हैं, 1 9 40 के दशक में बहुत से उल्लेख हैं, और हाल के दिनों में उल्लेखों की बढ़ती संख्या (शायद कुछ पाई नॉस्टलगिया।) ठीक है, कुछ है डेटा के साथ 3 के चिकनाई स्तर पर समस्या। 1800 के दशक में उल्लेखों पर एक पठार है। निश्चित रूप से पांच साल के लिए हर साल एक विशेष पाई के बराबर उल्लेख नहीं थे? क्या चल रहा है क्योंकि उस समय के दौरान बहुत सारी किताबें प्रकाशित नहीं हुईं, और क्योंकि हमारा डेटा चिकनी हो गया है, यह तस्वीर को विकृत करता है। शायद एक किताब थी जिसमें सिरका पाई का उल्लेख किया गया था, और यह सिर्फ स्पाइक से बचने के लिए औसत हो गया था। 0 को चिकनाई सेट करके, हम देख सकते हैं कि यह बिल्कुल सही है। 1869 में स्पाइक केंद्र, और 18 9 7 और 1 9 00 में एक और स्पाइक है।

क्या कोई भी सिरका के बारे में बात नहीं करता था शेष समय? उन्होंने शायद उन पाई के बारे में बात की थी। जगह पर तैरने वाले व्यंजनों की संभावना थी। उन्होंने किताबों में उनके बारे में अभी नहीं लिखा , और यह इन Ngram खोजों की एक सीमा है।

उन्नत Ngram खोज

याद रखें कि हमने कैसे कहा कि Ngrams में विभिन्न प्रकार की टेक्स्ट खोजों का समावेश हो सकता है? Google आपको Ngram व्यूअर के साथ भी थोड़ा सा ड्रिल करने की अनुमति देता है। यदि आप मछलियों को मछली के बजाय क्रिया की खोज करना चाहते हैं, तो आप टैग का उपयोग करके ऐसा कर सकते हैं। इस मामले में, आप "fish_VERB" की खोज करेंगे

Google उन आदेशों की पूरी सूची प्रदान करता है जिनका आप उपयोग कर सकते हैं और उनकी वेबसाइट पर अन्य उन्नत दस्तावेज़।