सवाल एक दोहरी सीपीयू सर्वर पर, क्या एक सीपीयू दूसरे के मुकाबले गर्म हो सकता है?


मेरे पास कई वीएम होस्ट करने के लिए libvirt के साथ लिनक्स चल रहा एक दोहरी ओपटेरॉन सर्वर है। वीएम ठीक काम करते हैं और सर्वर ठीक प्रक्रिया करता है, लेकिन मुझे लगता है कि एक सीपीयू हमेशा 6 9 सी (70 सी पर थ्रॉटल) चलाता है और दूसरा 15 सी के बारे में चलता है।

यह मेरे लिए सामान्य प्रतीत नहीं होता है? क्या वे दोनों तापमान में थोड़ा करीब नहीं होना चाहिए?

मुझे यकीन नहीं है कि आगे किसी भी तरह से डियानोस कैसे करें। शायद सीपीयू में से एक पर पर्याप्त थर्मल पेस्ट नहीं है?

संपादित करें: मदरबोर्ड है ASUS KGPE-D16 और दोहरी द्वारा ठंडा नोक्टुआ एनएच-यू 9 डीओ प्रशंसकों

ध्यान दें कि मुझे लगता है कि तापमान पूर्ण मूल्यों के बजाय परिवेश से ऊपर degress हो सकता है? जब सर्वर निष्क्रिय हो रहा है, तो CPU तापमान 2C और 13C तक गिर जाता है। मैं lmsensors विन्यास का उपयोग कर रहा हूँ यहाँ


47
2017-11-27 12:28


मूल


सर्वर बनाने / मॉडल क्या है? - ewwhite
सीपीयू लोड का वितरण कैसा है? mpstat -P ALL 1 लिनक्स पर मदद मिलेगी - Christopher Perrin
टूटा तापमान सेंसर की तरह लगता है - matcheek
15 सी बहुत टूटा सेंसर है .... - Reaces
यदि आप सर्वर को रीबूट कर सकते हैं, तो एक टूटा या बुरी तरह कैलिब्रेटेड सेंसर की तरह लगता है, BIOS पर एक नज़र डालें जो सही मान प्रदर्शित करना चाहिए।


जवाब:


समस्या एक खराब फिट Heatsink होने के समाप्त हो गया। शायद खराब फिट सही वर्णन नहीं है। बाहर निकलता है, आपको हीटसिंक पर थर्मल पेस्ट डालना होता है, न कि प्लास्टिक कवर जो हेटसिंक पर जाता है।

enter image description here

प्लास्टिक कवर को हटाने के बाद, सीपीयू अच्छा और ठंडा है, सभी को धन्यवाद!


106
2017-11-28 00:18



+1 सिर्फ इसलिए कि यह मजाकिया है - HBruijn
तुम्हारा मतलब है कि किसी ने प्लास्टिक के कवर को जगह में छोड़ा और फिर उस पर पेस्ट डाला और फिर उस पर हीटसिंक डाला? महाकाव्य। - TomTom
Baaaaaahaaahaaahahahaa !! - Craig
मुझे प्यार है कि आप नियमों और शर्तों, सीमित वारंटी और पृष्ठभूमि में रिटर्न पॉलिसी कैसे देख सकते हैं। :) - Lightness Races in Orbit
अगर यह आपको कम बेवकूफ महसूस करता है, (और यह नहीं होगा), मैंने अपने नए कार्यालय कॉफी निर्माता के साथ भी ऐसा ही किया। कॉफ़ी पीने के लिए बहुत ठंडा था और सुरक्षा कार्डबोर्ड की डिस्क हीटिंग तत्व से निकलने से पहले मैं दुकान पर लौटने के लिए इसे वापस पैक कर रहा था :) - Martin James


मेरे अनुभव में, अलग-अलग तापमान पर चलाने के मामले में जोड़े गए घटकों के लिए सामान्य है, क्योंकि एयरफ्लो हर जगह समान नहीं है। मेरे कोलो बॉक्स से एचडीडी तापमान का ग्राफ यहां दिया गया है। ड्राइव प्रतिबिंबित हैं, इसलिए उन पर वर्कलोड समान के करीब हैं।

munin graph of HDD temps over past year

जैसा कि आप देख सकते हैं, वे एक दूसरे को ट्रैक करते हैं, लेकिन वे समान नहीं हैं; वे औसत पर, केवल 6 सी अलग हैं। चाहे आपके सेंसर पूर्ण तापमान या अधिक तापमान की रिपोर्ट करें, लोड के तहत 55 सी का अंतर बहुत बुरी तरह गलत लगता है। अगर आपको विश्वास है कि डेटा सही है, तो क्विज़ेंट अंतर 10 सी तक गिर जाता है, जो एयरफ्लो के कारण मुझे लगता है कि अंतर है, मुझे एक खराब फिट हेट्सकीक पर संदेह होगा।


23
2017-11-27 12:53



Mpstat का उपयोग (क्रिस्टोफर पेरिन से, धन्यवाद!) मैंने पुष्टि की कि भार काफी समान रूप से वितरित किया गया है। चीजें अभी +3 सी और + 20 सी पर निष्क्रिय हैं। मैं यह देखने के लिए हेट्सकीक के साथ झुकाव करने की कोशिश करने जा रहा हूं कि यह ढीला है या नहीं। क्या आपको लगता है कि यह थर्मल पेस्ट मुद्दा हो सकता है? - samoz
यह बहुत संभव है (और इससे पहले कि आप इसे शुरू करना शुरू करें)। - MadHatter


यह नहीं। जब तक आप एयरफ्लो के साथ कुछ गंभीर समस्याएं न हो। या कूलर में से एक बुरा है। तापमान अलग-अलग होगा - लेकिन इतना नहीं (70 बनाम 15 डिग्री सेल्सियस)।

यह देखते हुए कि 15 डिग्री कम कितनी कम होगी (ए) आपका सेंसर बंद है (आप वास्तव में उस शांत कमरे में सर्वर को स्टोर करते हैं?)।

मैं यह भी मानूंगा कि सीपीयू में से कोई भी किसी भी कारण से बिल्कुल काम नहीं करता है।

छोटे अंतर सामान्य हैं। कुछ छोटे बड़े हो सकते हैं (मेरे दिमाग में वायु प्रवाह आ रहा है)। लेकिन यहां हम एक कोल्ड होने के बारे में बात करते हैं।


7
2017-11-27 12:31





यह या तो शीतलन या असमान लोडिंग हो सकता है (अस्थायी अंतर को देखते हुए आपकी स्थिति शायद असमान लोड हो रही है)। आपको सभी कोरों को समान रूप से लोड करने के लिए प्राइम 95 जैसे कुछ का उपयोग करना चाहिए और देखें कि temps अभी भी भिन्न है या नहीं। यदि वे नहीं करते हैं तो आपको वीएम को संतुलित करने की आवश्यकता है, जांचें कि आपके ऐप्स बहुप्रचारित और व्यस्त हैं। यह कैसे करें आपके सॉफ़्टवेयर और व्यक्तिगत वर्कलोड पर निर्भर करता है, इसलिए वास्तव में प्रश्न के दायरे से बाहर है। ध्यान रखें कि ऐसा करने के लिए कोई वास्तविक लाभ नहीं है यदि आपके पास एक एकल सीपीयू / कोर को शीर्ष पर रखने के लिए पर्याप्त भार नहीं है, वास्तव में आपका वीएम जानबूझकर एक दूसरे सीपीयू का उपयोग करने से बच सकता है ताकि यह बहु-शक्ति पर बिजली बचत मोड में जा सके -सीपीयू सिस्टम।

यदि आपने इसे ठंडा करने के लिए नीचे संकुचित कर दिया है। 10 सी तक का एक छोटा अंतर बहुत छोटा (या बहुत अधिक!) थर्मल पेस्ट हो सकता है। एक बड़ा अंतर सीपीयू कूलर के बीच एक महत्वपूर्ण समस्या या अंतर इंगित करता है। यह हो सकता है कि किसी ने एयरफ्लो को अवरुद्ध कर दिया हो, एक हीटसिंक ढीला हो गया है, इत्यादि।


2
2017-11-27 12:38





मुझे दोषपूर्ण अस्थायी के साथ सहमत होना होगा। सेंसर, 15 सी के रूप में केवल 5 9 एफ है !!! जब तक कि कंप्यूटर एक बेहद बेवकूफ डेटासेंटर में नहीं है, तो मुझे लगता है कि परिवेश का हवा का तापमान 59 एफ से अधिक होगा! आप वीएम को कम तापमान कोर में असाइन करने का प्रयास करते हैं और देखते हैं कि कोई बदलाव है या नहीं; यदि नहीं, तो मुझे सेंसर को दोषपूर्ण होने पर संदेह होगा।

आप भी आउटपुट देखना चाहते हैं dmesg (बूट संदेश) और देखें कि वहां साधारण से कुछ भी है या नहीं।


0
2017-12-01 11:42