Google की गैरी इलीलेस से पता चलता है कि खोज सूचकांक एक tiered प्रणाली का उपयोग करता है जहां सबसे लोकप्रिय सामग्री को अधिक तेज़, अधिक महंगे भंडारण पर अनुक्रमित किया जाता है।
Google के नवीनतम एपिसोड में इस विषय पर चर्चा की गई है ऑफ द रिकॉर्ड सर्च करें पॉडकास्ट जो खोज सूचकांक चयन में भाषा की जटिलताओं से संबंधित है।
Google यह बताता है कि Google अपने खोज सूचकांक का निर्माण कैसे करता है, Illyes का कहना है कि सामग्री को तीन प्रकार के भंडारण पर अनुक्रमित किया जाता है:
- राम (रैंडम एक्सेस मेमोरी): सबसे तेज और सबसे महंगी
- एसएसडी (सॉलिड स्टेट ड्राइव): बहुत तेज़ लेकिन लागत निषेधात्मक
- एचडीडी (हार्ड डिस्क ड्राइव): सबसे धीमा और कम से कम महंगा
Google उन दस्तावेज़ों के लिए सबसे तेज़ संग्रहण रखता है, जिनके बार-बार खोज परिणामों में परोसे जाने की संभावना है।
विज्ञापन
नीचे पढ़ना जारी रखें
Illyes राज्यों:
“और फिर, जब हम अपने सूचकांक का निर्माण करते हैं, और हम उन सभी संकेतों का उपयोग करते हैं जो हमारे पास हैं। चलो, एक, पेज रैंक को चुनें, फिर हम यह अनुमान लगाने की कोशिश करते हैं कि हम उन दस्तावेजों की कितनी सेवा करेंगे जिन्हें हमने अनुक्रमित किया था।
तो क्या यह हर सेकंड की तरह होगा? क्या हमारे पास एक क्वेरी होगी जो उन डॉक्स को ट्रिगर करती है? या यह सप्ताह में एक बार होगा या यह वर्ष में एक बार होगा?
और उसके आधार पर, हम इंडेक्स बनाने के लिए विभिन्न प्रकार के स्टोरेज का उपयोग कर सकते हैं। ”
Illyes इस बात का उदाहरण देता है कि RAM पर क्या संग्रहीत किया जाएगा, SSD पर क्या संग्रहीत किया जाएगा, और HDD पर क्या संग्रहीत किया जाएगा।
वह सामग्री जो हर सेकंड एक्सेस की जाती है, वह रैम या एसएसडी पर संग्रहीत की जाएगी। यह Google के संपूर्ण सूचकांक की एक छोटी राशि का प्रतिनिधित्व करता है।
विज्ञापन
नीचे पढ़ना जारी रखें
Google के सूचकांक का थोक हार्ड ड्राइव पर संग्रहीत किया जाता है क्योंकि, इलियास के शब्दों में, हार्ड ड्राइव सस्ते, सुलभ और बदलने में आसान हैं।
“इसलिए, उदाहरण के लिए, उन दस्तावेजों के लिए जिन्हें हम जानते हैं कि हर सेकंड सामने आ सकते हैं, उदाहरण के लिए, वे कुछ सुपर फास्ट पर समाप्त होंगे। और सुपर फास्ट रैम होगा। जैसे हमारे सर्विंग इंडेक्स का हिस्सा रैम पर होता है।
फिर हमारे पास एक और स्तरीय होगा, उदाहरण के लिए, ठोस राज्य ड्राइव के लिए क्योंकि वे तेज हैं और रैम के रूप में महंगे नहीं हैं। लेकिन फिर भी सूचकांक के थोक उस पर नहीं होगा।
सूचकांक का थोक कुछ ऐसा होगा जो सस्ता, सुलभ, आसानी से बदली जा सकने वाली और बैंक को तोड़ने वाला न हो। और यह हार्ड ड्राइव या फ्लॉपी डिस्क होगी। “
बेशक इलियास फ्लॉपी डिस्क के बारे में मजाक कर रहे हैं, यह पॉडकास्ट पर उनसे प्राप्त होने वाला सूखा हास्य है।
मेरी जानकारी के लिए यह पहली बार है जब Google ने अपने खोज इंडेक्स स्टोरेज टियर के बारे में जानकारी सार्वजनिक की है। यह जानना सबसे दिलचस्प है कि सबसे अधिक खोजी गई सामग्री रैम और एसएसडी पर संग्रहीत है।
रैम और एसएसडी पर Google के सूचकांक के एक प्रतिशत को भी संग्रहीत करने की लागत अत्यधिक होनी चाहिए। यद्यपि यह संभव है कि तेज़ संग्रहण की लागत उचित है कि लोगों के अंदर दस्तावेज़ कितने महत्वपूर्ण हैं।
सामग्री की मांग इतनी अधिक होनी चाहिए कि Google खोजकर्ताओं को इसे प्राप्त करने में देरी का जोखिम नहीं उठाना चाहता।
विज्ञापन
नीचे पढ़ना जारी रखें
चूंकि यह एसईओ से संबंधित है इसलिए एक प्रकार के भंडारण को दूसरे पर अनुकूलित करने का कोई तरीका नहीं है। और यह बताने का कोई तरीका नहीं है कि आपकी साइट पर कौन से स्टोरेज टियर हैं।
मेरा अनुमान है कि वेब पेजों का एक निश्चित प्रतिशत राम या एसएसडी पर अनुक्रमित है। इसे एसईओ में वापस लाना, यह एक अच्छी बात है क्योंकि इसका मतलब है कि अधिकांश साइटें एक स्तर के खेल मैदान पर प्रतिस्पर्धा कर रही हैं जब यह सूचकांक भंडारण गति की बात आती है।