सवाल ब्लेड चेसिस असफलता की संभावना


मेरे संगठन में हम ब्लेड सर्वर खरीदने के बारे में सोच रहे हैं - रैक सर्वर के बजाय। बेशक प्रौद्योगिकी विक्रेता भी उन्हें बहुत अच्छा ध्वनि बनाते हैं। एक चिंता, जिसे मैंने अक्सर विभिन्न मंचों में पढ़ा है, यह है कि सर्वर चेसिस की सैद्धांतिक संभावना है - जिसके परिणामस्वरूप सभी ब्लेड नीचे आ जाएंगे। यह साझा बुनियादी ढांचे के कारण है।

इस संभावना पर मेरी प्रतिक्रिया अनावश्यकता और एक के बजाय दो चेसिस (निश्चित रूप से बहुत महंगा) होगी।

कुछ लोग (उदा। एचपी विक्रेताओं समेत) हमें मनाने की कोशिश करते हैं कि कई अनावश्यकता (अनावश्यक बिजली आपूर्ति इत्यादि) के कारण चेसिस असफल होने की बहुत संभावना नहीं है।

मेरी तरफ एक और चिंता यह है कि अगर कुछ नीचे चला जाता है, तो स्पेयर पार्ट्स की आवश्यकता हो सकती है - जो हमारे स्थान (इथियोपिया) में मुश्किल है।

तो मैं अनुभवी प्रशासकों से पूछूंगा, जिन्होंने ब्लेड सर्वर प्रबंधित किया है: आपका अनुभव क्या है? क्या वे पूरी तरह से नीचे जाते हैं - और समझदार साझा बुनियादी ढांचा क्या है, जो असफल हो सकता है?

वह प्रश्न साझा भंडारण में बढ़ाया जा सकता है। फिर मैं कहूंगा कि हमें केवल एक के बजाय दो स्टोरेज इकाइयों की आवश्यकता है - और फिर विक्रेताओं का कहना है कि ये चीजें इतनी चट्टानी ठोस हैं कि कोई विफलता की उम्मीद नहीं है।

खैर - मैं शायद ही विश्वास कर सकता हूं कि इस तरह का एक महत्वपूर्ण बुनियादी ढांचा बिना किसी अनावश्यकता के बहुत विश्वसनीय हो सकता है - लेकिन हो सकता है कि आप मुझे बता सकें कि क्या आपके पास सफल ब्लेड-आधारित परियोजनाएं हैं, जो इसके मूल भागों (चेसिस, भंडारण ... में अनावश्यकता के बिना काम करती हैं ... )

फिलहाल, हम एचपी को देखते हैं - क्योंकि आईबीएम बहुत महंगा दिखता है।


47
2017-12-02 16:41


मूल


महान सवाल मैं बाद में अपना जवाब और कुछ वास्तविक जीवन विफलता परिदृश्य पोस्ट करूंगा। - ewwhite
क्या आपने देखा है कि डेल ने अपने सी सर्वर में क्या किया है? जैसे सी 6100 में 2 यू बॉक्स में 4 नोड्स हैं, जो 4 स्लॉट ब्लेड चेसिस के बराबर हैं। एक 10 यू ब्लेड चेसिस के बजाय आपको पांच 2 यू रैक सर्वर मिल सकते हैं। अब विफलता का एक बिंदु नहीं है लेकिन आप बैकप्लेन फायदे खो देते हैं। संभवतः एचपी / आईबीएम के बराबर उत्पाद है। - jqa


जवाब:


पूर्ण चेसिस विफलता की कम संभावना है ...

एक को बनाए रखने से पहले आपको अपनी सुविधा में मुद्दों का सामना करना पड़ेगा पूर्ण एक ब्लेड संलग्नक की विफलता।

मेरा अनुभव मुख्य रूप से साथ है एचपी सी 7000 तथा एचपी सी 3000 ब्लेड बाड़ों। मैंने डेल और सुपरमिक्रो ब्लेड समाधान भी प्रबंधित किए हैं। विक्रेता थोड़ा मायने रखता है। लेकिन संक्षेप में, एचपी गियर तारकीय रहा है, डेल ठीक रहा है, और सुपरमरिको की गुणवत्ता, लचीलापन की कमी थी और केवल खराब डिजाइन किया गया था। मैंने एचपी और डेल पक्ष पर कभी विफलताओं का अनुभव नहीं किया है। सुपरमिक्रो के पास गंभीर आउटेज थे, जिससे हमें मंच छोड़ने के लिए मजबूर किया गया। एचपी और डेल पर, मुझे कभी भी पूर्ण चेसिस विफलता का सामना नहीं हुआ है।

  • मेरे पास थर्मल इवेंट्स हैं। एयर कंडीशनिंग एक सह-स्थान सुविधा में विफल रही है जो तापमान को 115 डिग्री फ़ारेनहाइट / 46 डिग्री सेल्सियस तक 10 घंटे के लिए भेजती है।
  • पावर surges और लाइन विफलताओं: एक ए / बी फ़ीड के एक तरफ खोना। व्यक्तिगत बिजली आपूर्ति विफलताओं। आमतौर पर मेरे ब्लेड सेटअप में छह बिजली की आपूर्ति होती है, इसलिए पर्याप्त चेतावनी और अनावश्यकता होती है।
  • व्यक्तिगत ब्लेड सर्वर विफलताओं। एक सर्वर के मुद्दे संलग्नक में दूसरों को प्रभावित नहीं करते हैं।
  • एक इन-चेसिस आग...

मैंने विभिन्न प्रकार के वातावरण देखा है और आदर्श डेटा सेंटर स्थितियों के साथ-साथ कुछ कठोर स्थानों में स्थापित करने का लाभ भी प्राप्त हुआ है। एचपी सी 7000 और सी 3000 पक्ष पर, मुख्य बात यह है कि चेसिस है पूरी तरह से मॉड्यूलर। घटकों को पूरी इकाई को प्रभावित करने वाली घटक विफलता के प्रभाव को कम करने के लिए डिज़ाइन किया गया है।

इस तरह के बारे में सोचें ... मुख्य सी 7000 चेसिस सामने, (निष्क्रिय) मिडप्लेन और बैकप्लेन असेंबली शामिल है। संरचनात्मक घेरे में केवल सामने और पीछे के घटक होते हैं और सिस्टम के वजन का समर्थन करते हैं। लगभग हर हिस्से को प्रतिस्थापित किया जा सकता है ... मेरा विश्वास करो, मैंने कई को अलग कर दिया है। मुख्य अनावश्यकता प्रशंसक / ठंडा करने, बिजली और नेटवर्किंग प्रबंधन में हैं। प्रबंधन प्रोसेसर (एचपी के ऑनबोर्ड प्रशासक) को अनावश्यकता के लिए जोड़ा जा सकता है, हालांकि सर्वर उनके बिना चला सकते हैं।

enter image description here

पूरी तरह से आबादी वाले घेरे - सामने देखें। नीचे की छः बिजली की आपूर्ति चेसिस की पूरी गहराई को चलाती है और संलग्नक के पीछे एक मॉड्यूलर पावर बैकप्लेन असेंबली से जुड़ती है। पावर सप्लाई मोड कॉन्फ़िगर करने योग्य हैं: उदा। 3 + 3 या एन + 1। तो संलग्नक में निश्चित रूप से बिजली की अनावश्यकता है। enter image description here

पूरी तरह से आबादी वाले घेरे - पीछे देखें। पीछे के वर्चुअल कनेक्ट नेटवर्किंग मॉड्यूल में एक आंतरिक क्रॉस-कनेक्ट होता है, इसलिए मैं एक तरफ या दूसरी खो सकता हूं और फिर भी सर्वर से नेटवर्क कनेक्टिविटी बनाए रखता हूं। छह गर्म-स्वीकार्य बिजली की आपूर्ति और दस गर्म-स्वीकार्य प्रशंसकों हैं। enter image description here

खाली संलग्नक - सामने देखें। ध्यान दें कि संलग्नक के इस हिस्से में वास्तव में कुछ भी नहीं है। सभी कनेक्शन मॉड्यूलर midplane के लिए पारित कर रहे हैं। enter image description here

मिडप्लेन असेंबली हटा दी गई। नीचे मिडप्लेन असेंबली के लिए छह पावर फीड नोट करें। enter image description here

मिडप्लेन असेंबली यहां जादू पैदा होता है। 16 अलग डाउनप्लेन कनेक्शन नोट करें: प्रत्येक ब्लेड सर्वर के लिए एक। मेरे पास व्यक्तिगत संलग्नक सॉकेट / बे पूरे संलग्नक को मारने या अन्य सर्वरों को प्रभावित किए बिना विफल हो गए हैं। enter image description here

बिजली आपूर्ति बैकप्लेन। मानक एकल चरण मॉड्यूल के नीचे 3o इकाई। मैंने अपने डेटा सेंटर में बिजली वितरण बदल दिया और बिजली वितरण की नई विधि से निपटने के लिए बस बिजली आपूर्ति बैकप्लेन को बदल दिया enter image description here

चेसिस कनेक्टर क्षति। यह विशेष संलग्नक असेंबली के दौरान गिरा दिया गया था, एक रिबन कनेक्टर से पिन को तोड़ दिया। यह दिनों के लिए अनजान हो गया, जिसके परिणामस्वरूप चलने वाले ब्लेड चेसिस आग पकड़ रहे थे ... enter image description here

मिडप्लेन रिबन केबल के चारों ओर बने अवशेष हैं। इसने चेसिस तापमान और पर्यावरण की निगरानी में से कुछ को नियंत्रित किया। बिना किसी घटना के चलने वाले ब्लेड सर्वर चलते रहे। प्रभावित हिस्सों को निर्धारित समय के दौरान मेरे अवकाश में बदल दिया गया था, और सब ठीक थे। enter image description here


49
2017-12-03 00:03



सी 7000 के लिए +1। हमने पिछले दो वर्षों से ठोस प्रदर्शन किया है, और संलग्नक या ब्लेड पर कभी भी कोई समस्या, हार्डवेयर या प्रदर्शन नहीं था। - tombull89
इसके साथ सहमत होना है - हमारे पास डेल से विभिन्न प्रकार के ब्लेड चेसिस हैं और वे बहुत अधिक बुलेट प्रूफ रहे हैं। मुझे लगता है कि हमारे पास एक चेसिस पर एक नियंत्रक मॉड्यूल विफल रहा है और इसका शुद्ध परिणाम यह है कि हम किसी अन्य नियंत्रक और एक इंजीनियर को फिट करने के लिए डेल समर्थन के लिए लिया गया दिन के लिए खुद को चेसिस को दूरस्थ रूप से प्रबंधित नहीं कर सका। विफलता या नियंत्रक को बदलने के लिए ऑपरेशन के कारण कोई वास्तविक ब्लेड डाउनटाइम नहीं। - Rob Moir
मुझे @ewwhite से सहमत होना है। मैं चेसिस की किसी भी विफलता के बिना लगभग 8yrs nonstop के लिए c7000 चला रहा हूं। एचवीएसी विफलता के कारण हमने उन्हें कुछ घंटों तक 130'एफ में भी चलाया था और कुछ भी असफल नहीं हुआ था। ध्यान में रखने की बड़ी बात यह है कि कई पावर पैनलों पर अपने पावर लोड को विभाजित करना और असफलता के एक बिंदु को खत्म करने के लिए अपने स्विचिंग को कई स्विचों पर विभाजित करना सुनिश्चित करें। एकमात्र चीज जिसे हमने कभी खराब किया है, कुछ ब्लेड सर्वर हार्ड ड्राइव हैं, लेकिन आप इसे पारंपरिक सर्वरों में भी देखते हैं। - mrTomahawk


मैं अब आठ साल से ब्लेड सर्वरों की छोटी संख्या का प्रबंधन कर रहा हूं, और मेरे पास अभी तक एक सिस्टम-व्यापी विफलता है जिसने कई ब्लेड ऑफ़लाइन ले लिए हैं। मैं बिजली से संबंधित समस्याओं के कारण वास्तविक नज़दीक आया हूं, लेकिन अभी तक एक चेसिस-चौड़ी विफलता नहीं है जो बाहरी स्रोतों के लिए जिम्मेदार नहीं है।

आपका अवलोकन कि चेसिस एकल-बिंदु-विफलता का प्रतिनिधित्व करता है, सही है, हालांकि वे इन दिनों बड़ी मात्रा में अनावश्यकता में निर्माण करते हैं। मेरे द्वारा उपयोग किए जाने वाले सभी ब्लेड सिस्टमों में ब्लेड के समानांतर पावर फीड होते हैं, और कई नेटवर्क जैक अलग-अलग पथों से गुजरते हैं, और ब्लेड से फाइबर-चैनल एकाधिक पथों के मामले में बैक-ऑफ-रैक ऑप्टिकल पोर्ट्स में होते हैं। यहां तक ​​कि चेसिस सूचना प्रणाली के कई पथ थे।

उपयुक्त नेटवर्क इंजीनियरिंग (अनावश्यक एनआईसी उपयोग, भंडारण के लिए एमपीआईओ) के साथ एकल समस्या घटना पूरी तरह से जीवित हैं। इन प्रणालियों के साथ मेरे समय में मुझे निम्नलिखित समस्याएं आई हैं, जिनमें से कोई भी एक से अधिक ब्लेड को प्रभावित नहीं करता है यदि कोई है:

  • ब्लेड-रैक में दो बिजली-आपूर्ति विफल हो जाती है। लोड का समर्थन करने के लिए दूसरे 4 में पर्याप्त रिडंडेंसी थी।
  • 3-चरण बिजली आपूर्ति के लिए एक चरण खोना। इन आपूर्तियों को इन दिनों दुर्लभ हैं, लेकिन अन्य दो चरणों में भार का समर्थन करने के लिए पर्याप्त क्षमता थी।
  • एक अंतर-चेसिस प्रबंधन पाश खोना। किसी अन्य फोन पर एक विक्रेता तकनीक से पहले यह इस तरह से देखा गया था।
  • इंटर-चेसिस प्रबंधन लूप को पूरी तरह से खोना। हमने प्रबंधन-कंसोल पहुंच खो दी, लेकिन सर्वर चलते रहे जैसे कि कुछ भी गलत नहीं था।
  • किसी ने गलती से बैक-ऑफ-रैक नेटवर्क बैकप्लेन को रीबूट किया। उस चेसिस में सबकुछ अनावश्यक एनआईसी का उपयोग कर रहा था, इसलिए सेवा में कोई रुकावट नहीं हुई; सभी यातायात दूसरे बैकप्लेन में चले गए।

हालांकि लागत के बारे में टॉमटॉम का मुद्दा बहुत सच है। पूर्ण लागत-समानता प्राप्त करने के लिए आपके ब्लेड चेसिस को पूरी तरह से लोड किया जाना चाहिए और संभवतः बैक-ऑफ-रैक स्विच जैसी विशेष चीज़ों का उपयोग नहीं करना होगा। ब्लेड-रैक उन क्षेत्रों में समझ में आता है जहां आपको वास्तव में घनत्व की आवश्यकता होती है क्योंकि आप अंतरिक्ष-बाधित हैं


19
2017-12-02 17:16



सिवाय इसके कि सुपरमिक्रो ट्विन आर्किटेक्चर आपको प्रति कंप्यूटर दो सॉकेट के साथ प्रति टीयू दो कंप्यूटर देता है - जो कि आपको सबसे ज्यादा ब्लेड के साथ मिलता है। यह निश्चित रूप से बहुत घना है;) मुझे पता है कि केवल उच्च घनत्व आईवी पुल का उपयोग कर डेल ब्लेड हैं ... लेकिन वे तुलना में अधिक सीमित हैं। - TomTom
@tomtom लेकिन supermicro जुड़वां प्रस्ताव अनावश्यक psus? हमने अभी एक बनाया है और मुझे वह विकल्प कहीं भी नहीं मिला। हमने मामले में हाथ रखने के लिए एक ठंडा अतिरिक्त psu खरीदा है। - Jeff Atwood
@ जेफएटवुड, मैंने सुपरमिक्रो के 1 यू जुड़वाओं में अनावश्यक पीएसयू नहीं देखा है, लेकिन 2 यू 4-नोड जुड़वां जुड़वाओं की उनकी रेखा उनके पास है। उदाहरण। - Charles
इसके अलावा, कौन परवाह करता है। रैक में अतिरिक्त बिजली की आपूर्ति है। प्रतिस्थापन सेकंड लेता है। - TomTom


वह प्रश्न साझा भंडारण में बढ़ाया जा सकता है। फिर मैं कहूंगा कि हमें दो की जरूरत है   केवल एक के बजाय भंडारण इकाइयों - और फिर विक्रेताओं का कहना है कि यह चीजें इतनी चट्टान हैं   ठोस, कि कोई विफलता की उम्मीद है।

दरअसल नहीं। आप अब तक चिंतित हैं, यह वाक्य उन्हें "अपनी आंखों के सामने सामान को पढ़ने" में डाल देता है। पूर्ण प्रतिकृति के साथ एच भंडारण इकाइयों के लिए एक ज्ञात उद्यम सुविधा है। प्वाइंट यह है कि एक SAN (स्टोरेज यूनिट एक ब्लेड चेसिस की तुलना में बहुत अधिक जटिल है जो अंत में सिर्फ "बेवकूफ धातु" है। कुछ बैकप्लेन को छोड़कर ब्लेड चेसिस में सबकुछ बदल सकता है - सभी मॉड्यूल इत्यादि बदल सकते हैं, और व्यक्तिगत ब्लेड हैं असफल होने की अनुमति है। कोई भी नहीं कहता है कि ब्लेड सेंटर स्वयं ब्लेड को उच्च उपलब्धता देता है।

यह एक SAN से बहुत अलग है जो कि 100% समय तक होना चाहिए - लगातार राज्य में - तो वहां आपके पास प्रतिकृति आदि जैसी चीजें हैं।

यह कहा गया: अपनी संख्या देखें। मैंने कुछ समय के लिए ब्लेड खरीदने पर विचार किया है और उन्होंने कभी भी वित्तीय संवेदना नहीं बनाई है। चेसिस बहुत महंगा हैं और ब्लेड सामान्य कंप्यूटर की तुलना में वास्तव में सस्ता नहीं हैं। मैं सुझाव देता हूं कि सुपरमिक्रो ट्विन आर्किटेक्चर को वैकल्पिक रूप से देखें।


14
2017-12-02 16:51



जुड़वां और जुड़वां जुड़वां (2 यू 4-नोड) हैं महान ब्लेड के विकल्प। इंटेल भी जुड़वां और जुड़वां जुड़वां सर्वर की एक पंक्ति बनाता है। - Charles
@ चार्ल्स आप वें जुड़वां जुड़वां के बारे में पता है? 4 यू में 8 मशीनें;) - TomTom
मैंने एक देखा है, लेकिन इसे खेलने या मूल्यांकन करने का मौका नहीं मिला है। - Charles


मेरे द्वारा अनुभव किए गए ब्लेड सर्वर आईबीएम के हैं। वे विशेष रूप से पूरी तरह से मॉड्यूलर हैं और इसमें बहुत अधिक अनावश्यकता है। इसलिए, अगर कुछ विफल होने जा रहा है तो यह पीएसयू या मॉड्यूलर स्विच इत्यादि जैसे घटकों में से एक होगा। लेकिन फिर भी, उन में भी अनावश्यकता है।

आईबीएम ब्लेड से जुड़े होने के बाद से मैंने पहले पूरी तरह विफलता नहीं देखी है।

अन्य ब्रांडों के साथ मुझे संदेह है कि वे एक समान फैशन में बनाए जाएंगे।
एक विक्रेता से बात करना और बहुत सी पढ़ना अच्छा विचार होगा।
यह एक बड़ा निवेश है।


4
2017-12-02 20:23





एक ही घेरे में कई ब्लेड सर्वर आउटेज की वजह से विफलता समान रैक में कई सर्वर आउटेज की ओर अग्रसर विफलताओं के लिए तुलनीय (संभावना और कारण) तुलनात्मक हैं।

असफलता के एकल बिंदु को कम करने के लिए प्रारंभिक सेट (दो अलग बिजली के एसी स्रोत, जिनमें से प्रत्येक डीसी बिजली की आपूर्ति को अलग करने के लिए चल रहे पूरे भार को संभाल सकता है, जैसे कि आधा पूरे भार को संभाल सकता है; दो अलग नेटवर्क अनुलग्नक, जिनमें से कोई भी पूरे अपेक्षित भार को संभाल सकता है) और किसी चीज के बीच का अंतर जो चेसिस में सभी ब्लेड लेता है या रैक में सभी 2 यू सर्वर बहुत छोटा होता है।


1
2017-12-03 18:45





एक चिंता, जिसे मैं अक्सर विभिन्न मंचों में पढ़ता हूं, वह है   सर्वर चेसिस नीचे जाने की सैद्धांतिक संभावना है - जो   परिणामस्वरूप सभी ब्लेड नीचे ले जाएगा। यह साझा करने के कारण है   आधारिक संरचना।

वास्तव में! लगभग 5 साल पहले, दो एचपी प्रोलियंट पी-क्लास ब्लेड बाड़ों के प्रबंधन के दौरान, मुझे कई बार चेसिस व्यापक मुद्दों का सामना करना पड़ा।

मेरे पास ब्लेड सर्वर चालू नहीं हो पाए हैं, अगर उन्हें बंद कर दिया गया था (सर्वर अक्सर बंद नहीं होते हैं, लेकिन हमारे लिए एक बहुत ही वास्तविक समस्या बन जाती है)। मेरे पास सर्वर अचानक बंद हो गया है और फिर से स्विच करने में सक्षम नहीं है। आखिरकार, मेरे पास सभी सर्वर बंद हो गए और फिर से आने में सक्षम नहीं थे।

जैसा कि मुझे याद है, बहुत सारे मुद्दों को खराब पावर बैकप्लेन या नियंत्रक बैकप्लेन के लिए जिम्मेदार ठहराया गया था। हमने उन लोगों को कई बार प्रतिस्थापित किया था और तकनीक से प्राप्त गैर-विशिष्ट, ऑफ-द-रिकॉर्ड संदेश थे, कि वे इस पीढ़ी के ब्लेड बाड़ों के साथ समस्याओं का हिस्सा थे।

मैंने तब फैसला किया कि ब्लेड सर्वर का लाभ केवल जोखिम के लायक नहीं था, अगर भविष्य में खरीदारियों में मुझे कुछ कहना है।

उस मामले के लिए मेरे अगले नियोक्ता और मेरे वर्तमान में तेजी से आगे बढ़ें। उनके पास पहले ही एचपी प्रोलियंट सी-क्लास बाड़ों चल रहा था, इसलिए ब्लेड के लिए मेरी ल्यूक गर्म महसूस वास्तव में कोई फर्क नहीं पड़ता। 5 सालों में मैंने सी-क्लास बाड़ों से निपटाया है, मैंने पी-क्लास के साथ ऐसा कुछ भी अनुभव नहीं किया है, जहां एक संपूर्ण संलग्नक मुझ पर असफल रहा। वे बिना किसी बड़ी समस्या के चल रहे हैं।

(उस समय के अलावा जब बारिश तूफान छत के माध्यम से बारिश हुई, 4 कहानियां, कंप्यूटर रूम की मुहर में एक छोटा छेद, एक केबल और चेसिस में)


1
2017-12-06 23:46





डीएलएल और एचपी ब्लेड चेसिस दोनों में एक अनावश्यक मध्य-विमान की कमी है। यह वह जगह है जहां आईबीएम ब्लेडेंटर एक विजेता साबित होता है। मेरे ज्ञान के लिए यह एकमात्र ब्लेड चेसिस है जो एक अनावश्यक मध्य-विमान प्रदान करता है। हालांकि एचपी ब्लेड के लिए प्रबंधन सॉफ्टवेयर का एक शानदार सूट प्रदान करता है, लेकिन हमने पूरे चेसिस की विफलता के एक बिंदु से बचने के लिए हमारी कंपनी के लिए ब्लेडसेन्टर ई खरीदा है।


-1
2017-10-11 19:04



यह वास्तव में आईबीएम विपणन सामग्री मुझे बताता है; कि वे एकमात्र विक्रेता हैं जो पूरी तरह से अनावश्यक ब्लेड समाधान के साथ हैं। हालांकि इस धागे में अन्य संदेशों को पढ़ने के बाद ऐसा लगता है कि एचपी समाधान इस तरह की विशेषता है। - Martijn