सवाल सर्वश्रेष्ठ सिस्टम प्रशासक दुर्घटना [बंद]


मैं आपके पास सिस्टम प्रशासक दुर्घटनाओं की मनोरंजक कहानियों की तलाश में हूं। सीईओ के ईमेल को हटाने, गलत हार्ड ड्राइव स्वरूपण इत्यादि।

मैं अपनी कहानी को एक उत्तर के रूप में जोड़ दूंगा।


87
2018-05-13 21:00


मूल


यह भी देखें serverfault.com/questions/5066 - Zoredache
यह वास्तव में एक सर्वेक्षण के बाद एक सवाल है। यह शायद समुदाय विकी पर सेट किया जाना चाहिए। - Zoredache
हाँ, यह निश्चित रूप से एक समुदाय विकी होना चाहिए। सवाल के इरादे में, हालांकि, मेरी पसंदीदा कहानी 500 मील ईमेल है - ibiblio.org/harris/500milemail.html - हालांकि, जाहिर है, वह मैं नहीं था। - Mihai Limbăşan
500 मील बस अद्भुत है - Hubert Kario
इसे "खराब सिस्टम प्रशासक दुर्घटना" कहा जाना चाहिए। - Rilindo


जवाब:


मुझे लिनक्स "killall" कमांड के बीच अंतर खोजने में मजा आया था (निर्दिष्ट नाम से मेल खाने वाली सभी प्रक्रियाओं को मारता है, ज़ोंबी को रोकने के लिए उपयोगी) और सौरलिस "killall" कमांड (सभी प्रक्रियाओं को मारता है और सिस्टम को रोकता है, जो उत्पादन सर्वर को रोकने के लिए उपयोगी है चोटी के घंटों के बीच और अपने सभी सहकर्मियों को एक हफ्ते तक हंसने के लिए)।


133
2018-05-13 23:20



वहाँ किया गया था कि। हमने उसके बाद सौर-बक्से पर हत्यारे-आदेश को अलियास किया: उर्फ ​​हत्यारा = 'ओरोली को गूंजता है?' =) - Commander Keen
'Ifconfig -a4' के बीच सोलारिस पर भी एक महत्वपूर्ण अंतर है (सभी इंटरफेस 'आईपीवी 4 जानकारी दिखाएं) और' ifconfig -a 4 '(सभी इंटरफेस को 0.0.0.4 पर सेट करें)। - Zanchey
+1 "ओह, यह हवा सौरलिस में लॉग इन है?" - Mark Harrison
@ कमांडर, मैं आपकी टिप्पणी को ऊपर उठाने जा रहा था, लेकिन वहां हैं ठीक ठीक इस पल में 42 अपवॉट्स ... मैं बस नहीं कर सका। - Massimo
इसके अलावा, hostname -f लिनक्स पर लिनक्स पर पूरी तरह से योग्य डोमेन नाम प्रिंट करता है। सोलारिस पर, यह होस्टनाम को सेट करता है -f। - 200_success


मैं अपने कॉर्पोरेट वेब प्रॉक्सी का प्रभारी था जो उस समय नेटस्केप का उत्पाद था। व्यवस्थापक रूपों में चारों ओर खेलते समय (यह एक वेब आधारित इंटरफेस था) एक बड़ा था (और मैं कसम खाता हूँ कि लाल था) बटन ने कहा उपयोगकर्ता डेटाबेस हटाएं। कोई समस्या नहीं, मैंने सोचा। आइए देखते हैं कि जब मैं इसे हिट करता हूं तो मुझे क्या विकल्प मिलते हैं। निश्चित रूप से कोई विकल्प नहीं होने पर एक पुष्टिकरण संकेत होगा।

हाँ, कोई पुष्टि नहीं। कोई विकल्प नहीं कोई और उपयोगकर्ता नहीं

तो, श्री सोलारिस सिसाडमिन के पास गए और कहा कि मुझे टेप से बहाल करने की बेहद जरूरी ज़रूरत है, जिसमें उन्होंने जवाब दिया, "मैं उस बॉक्स को वापस नहीं करता हूं।"

"उह, फिर आओ," मैंने दोबारा जवाब दिया।

"मैं उस बॉक्स को वापस नहीं करता हूं। यह बैकअप रोटेशन में जोड़ने के लिए मेरी चीजों की सूची पर है लेकिन मुझे अभी तक इसके आसपास नहीं मिला है।"

"यह सर्वर लगभग 8 महीने तक उत्पादन में रहा है!" मैं चीख उठी।

कंधे उचकाने की क्रिया, उसने जवाब दिया। "माफ़ कीजिये।"


73
2018-05-14 12:26



यह निश्चित रूप से उन सभी लोगों के लिए एक कहानी है जो उन अजीब बातों के बारे में शिकायत करते हैं 'क्या आप निश्चित हैं?' संवाद;) - MikeyB
मुझे सच में यकीन नहीं है कि आप उस पर चिल्लाने वाला होना चाहिए ... - Mikeage
यह वास्तव में एक दुर्घटना नहीं है - आपने प्रयोजन पर हटाएं उपयोगकर्ता डेटाबेस बटन दबाया, दोस्त पर आओ ... - Wayne Koorts
हां आप ठीक हैं। बटन दबाकर दुर्घटना नहीं हुई थी। असल में डेटाबेस को हटाने का दुर्घटना हिस्सा था। जो कुछ... - squillman
उस बटन को दो या तीन पुष्टिकरण संकेतों के बाद किया जाना चाहिए था। उपयोगकर्ता डेटाबेस को हटाने के लिए यह एक उपयोगी सुविधा कैसा है? मैं पूरी तरह से प्रोग्रामर को दोषी ठहराता हूं जो बटन को वहां रखता है। और तथ्य यह है कि डीबी का बैक अप नहीं लिया गया था। "जीनियस की सीमाएं हो सकती हैं, लेकिन मूर्खता इस प्रकार विकलांग नहीं है।" (एल्बर्ट हूबार्ड के लिए अटारी)। धारणा के साथ निर्माण करना कि मनुष्य उत्सुक नहीं हैं, लापरवाही एपिस सिर्फ एक आपदा का निर्माण कर रहा है। - Jared Updike


कई साल पहले जिस कंपनी के लिए मैंने काम किया था वह एक ग्राहक था जिसने अपने एनटी 4.0 सर्वर का रात का बैकअप चलाया था जाज ड्राइव (एक उच्च क्षमता ज़िप डिस्क की तरह)।

हमने एक बैच फ़ाइल स्थापित की, जो रातोंरात एक निर्धारित नौकरी के रूप में भाग गया। हर सुबह वे ड्राइव से पिछली रात डिस्क एकत्र करेंगे, और शाम को छोड़ने से पहले वे अनुक्रम में अगली डिस्क डालेंगे।

वैसे भी, बैच फ़ाइल इस तरह कुछ देखा (जैज़ ड्राइव ड्राइव एफ था:) ...

@echo off
F:
deltree /y *.*
xcopy <important files> F:

वैसे भी, एक रात वे डिस्क को डालने के लिए भूल गए। ड्राइव करने के लिए परिवर्तन एफ: असफल (ड्राइव में कोई डिस्क नहीं), और बैच फ़ाइल चलती रही। बैच फ़ाइल के लिए डिफ़ॉल्ट कार्य निर्देशिका? सी:। पहली बार मैंने कभी बैकअप दिनचर्या देखी है नष्ट सर्वर का बैक अप ले रहा था।

मैंने उस दिन sysadminning (और अपवाद हैंडलिंग) के बारे में कुछ सीखा।

जिम।

पीएस: फिक्स? "डेलट्री / वाई एफ: \ *। *"।


66
2018-05-13 20:00



... हमें समझाना होगा कि जैज़ ड्राइव क्या हैं? क्या मैं वास्तव में वह पुराना हूँ ?? - Spencer Ruport
यह एक आईओएमईजीए चीज थी (ज़िप ड्राइव याद रखें?) ज़िप ड्राइव का बड़ा भाई था, और यह बिना किसी सिर के हार्ड डिस्क की तरह था, बस प्लेटर्स, जो एक छोटी सी खिड़की के साथ प्लास्टिक के मामले में अंदर गया, और जब डाला गया ड्राइव, ड्राइव पर हेडर डाला। जहां 1 या 2 जीबी, महंगा, और अधिक गरम हो जाता है, तो पाठक के अंदर कारतूस छोड़ने के लिए अनुशंसा नहीं की गई थी (यह एक पुराने आईओएमईजीए बॉस द्वारा कहा गया था) - Andor
हे, मुझे पसंद है कि जाज ड्राइव को बस-जैसी-मृत-और-अप्रासंगिक ज़िप ड्राइव की तुलना में समझाया गया है। - Luke
यदि यह आपको बूढ़ा महसूस करता है, तो ऐसे सिसडमिन हैं जिन्होंने पहले कभी डेलट्री नहीं देखी है। - Joseph
मुझे कई प्रोग्रामर को समझाया गया है कि जब आप किसी ऐसे ऑपरेशन का प्रयास करते हैं जो किसी राज्य को बदलता है, और फिर भी असफल हो सकता है और आपको पिछली स्थिति में छोड़ देता है, तो आपको यह जांचना होगा कि क्या आप सफल हुए हैं या नहीं, अगर आप कुछ खतरनाक करने जा रहे हैं क्या आप पिछले राज्य में होना चाहिए। मुझे यह समझाने की ज़रूरत क्यों है? - carlito


रूट @ dbhost # ढूंढें / -नाम कोर -exec आरएम-एफ {} \;

Me: "आप अंदर नहीं आ सकते? ठीक है। डीबी नाम क्या है?"

क्यू: "कोर।"

Me: "ओह।"


61
2018-05-13 18:31



और तब से, 'फ़ाइल' कमांड का उपयोग क्लीनअप crontab में जोड़ा गया था ... :) - MikeyB
हे भगवान.... - squillman
ओह मेरे भगवान ... वाह। मैं इस बारे में एक मानसिक नोट बनाने जा रहा हूं, इसलिए मैंने इसे कभी नहीं किया। - Glenn Willen


मैं जिस तरह से अपनी कहानी को "युवा / हरा था" के साथ पसंद करता हूं, जैसे कि वे इसे फिर कभी नहीं करेंगे। दुर्घटनाएं भी सबसे अनुभवी पेशेवरों के साथ हो सकती हैं।

मेरा सबसे बुरा क्षण इतना बुरा है कि मुझे अभी भी इसके बारे में सोचने में झुकाव मिल रहा है ...

हमारे पास उत्पादन डेटा के साथ एक SAN था। कंपनी के लिए महत्वपूर्ण है। मेरे "सलाहकार" ने कुछ डिस्क स्थान को खाली करने के लिए विभाजन का विस्तार करने का निर्णय लिया। क्या आप देख सकते हैं कि यह कहां जा रहा है? उन्होंने कहा कि सैन सॉफ्टवेयर उत्पादन के समय में यह लाइव कर सकता है और कोई भी नोटिस नहीं करेगा। अलार्म घंटी बजना शुरू कर देना चाहिए था, लेकिन स्पष्ट रूप से चुप थे। उन्होंने कहा कि उन्होंने बिना किसी समस्या के "इसे कई बार पहले" किया होगा। लेकिन यह बात है - उसने मुझे बटन पर क्लिक करने के लिए कहा, "क्या आप निश्चित हैं?"! जैसा कि मैं कंपनी के लिए नया था, मैंने माना कि इस लड़के को पता था कि वह किस बारे में बात कर रहा था। बड़ी गलती। अच्छी खबर यह थी कि एलयूएन बढ़ा दिया गया। बुरी खबर थी ... अच्छी तरह से मुझे पता था कि जब मैंने विंडोज बॉक्स पर डिस्क लिखने की त्रुटियों को देखना शुरू किया था तो बुरी खबर थी।

मुझे खुशी है कि मैं भूरे रंग के पैंट पहन रहा था।

हमें यह बताना था कि लंच के समय 1TB डेटा गायब क्यों हुआ था। वह वास्तव में एक बहुत बुरा दिन था।

यह वास्तव में एक अच्छा सिद्धांत है - इससे पहले कि आप कुछ ऐसा करें जो आपको संदेह है, कल्पना करें कि कुछ गलत होने पर प्रबंधन को समझाने की कल्पना करें। यदि आप अपने कार्यों को समझाने के लिए एक अच्छे उत्तर के बारे में नहीं सोच सकते हैं तो ऐसा मत करें।


60
2018-05-13 18:22



अंतिम अनुच्छेद के लिए +1 - "अपने हाथों पर बैठो" तकनीक, प्रतिबिंब के लिए एक महत्वपूर्ण मिनट - Andy
थोड़ी देर के लिए लाइव सिस्टम के साथ काम करने के बाद आपको एक निश्चित कौशल मिलता है: खतरनाक और क्या नहीं है इसके लिए एक मकड़ी भावना। रूट प्रॉम्प्ट पर रिटर्न दबाए जाने से पहले एक अतिरिक्त सेकंड को रोकना, या यह सुनिश्चित करना कि SQL अद्यतन कथन उचित है जहां क्लॉज (जो पहले से ही एक चुनिंदा गिनती (*) में चलाया गया है)। - jplindstrom
मुझे एक पॉपअप चाहिए जो कुछ कहता है "क्या आप जारी रखने से पहले अपना रेज़्यूम प्रिंट करना चाहते हैं?" .. और केवल एक विकल्प है: "हां" - warren
अंतिम पैराग्राफ में सलाह के लिए +1 - Jeroen Huinink
+1, ditto। मुझे एक सिसडमिन मित्र से सुनना याद है कि उनके खराब प्रदर्शन गति के बारे में उनके वार्षिक प्रदर्शन मूल्यांकन में समस्याएं थीं, जिन्हें उन्होंने कथित तौर पर (और सही ढंग से) खारिज कर दिया था "मुझे तेजी से टाइप करने के लिए भुगतान नहीं किया जाता है। मुझे बहुत कुछ दर्ज करने के लिए भुगतान किया जाता है धीरे और विचारपूर्वक। "। - MadHatter


Nagios हमें एक सुबह pinged जब व्यापार के घंटे कहने लगे कि यह एक गैर-महत्वपूर्ण सर्वर से कनेक्ट नहीं हो सका। ठीक है, सर्वर के कमरे में वृद्धि। यह एक पुराना सर्वर है, '02 में खरीदा गया डेल 1650, और हम जानते थे कि 1650 के हार्डवेयर समस्याएं हैं। पीएफवाई पावर बटन दबाता है। कुछ भी तो नहीं। इसे फिर से दबाएं, और इसे 'पावर पावर ऑन' करने के लिए पांच सेकंड तक रखें ... जो बीएमसी की त्रुटि सुरक्षा को ओवरराइड करता है, क्योंकि डीआरएसी के बिना चेसिस पर बिजली के बिना बीएमसी लॉग की जांच करने का कोई तरीका नहीं है।

मशीन पोस्ट शुरू होती है, और फिर फिर से मर जाती है। मैं इसके ऊपर खड़ा हूँ और जाओ, "मैं धुआं गंध करता हूं।" हम सर्वर को इसकी रेलों पर खींचते हैं, और बिजली की आपूर्ति में से एक गर्म महसूस करता है, इसलिए पीएफवाई इसे खींचता है और बॉक्स को बैक अप बंद करने वाला है। मैं कहता हूं, "नहीं, वह बिजली आपूर्ति धुआं नहीं है, वह मदरबोर्ड धूम्रपान है।"

हम फिर से मामला खोलते हैं और जलती हुई गंध के स्रोत की तलाश करते हैं। मदरबोर्ड पर वोल्टेज नियामक को उतारने वाले एक प्रेरक कॉइल और कैपेसिटर को बाहर कर देता है, और सब कुछ में पिघला हुआ तांबा और संधारित्र गोद छिड़काव करता है, सामानों का एक गुच्छा छोटा करता है और मूल रूप से एक बड़ी गड़बड़ी करता है।

मेरे लिए सबसे बुरा हिस्सा यह स्वीकार कर रहा था कि मैंने जलाया मदरबोर्ड की गंध और जला हुआ बिजली की आपूर्ति के बीच अंतर को पहचानने के लिए पर्याप्त हार्डवेयर धूम्रपान किया था।


54
2018-05-14 14:49



इस नौकरी के चयन मानदंड में शामिल हैं: गंध की अच्छी भावना। प्रतिभाशाली। - mlp
मेरी बडी ने डिस्क रेल ड्राइव का एक सेट अब तक डिस्क में खराब कर दिया है कि वे सर्किट बोर्ड में गए और इसे छोटा कर दिया। सुंदर गुलाबी धुआं। बहुत अलग है। - squillman


तीन दिन पहले (गंभीरता से) मुझे एक दूरस्थ सर्वर में लॉग इन किया गया था, जो कि Windows Server 2008 फ़ाइल सर्वर पर सर्विस पैक 2 स्थापित करता था।

मैंने देर रात के लिए आवश्यक रीबूट शेड्यूल करने का फैसला किया, जब शिक्षकों को अपने साल के रिपोर्ट कार्ड खत्म करने पर लॉग इन नहीं किया जाएगा। मैंने कुछ टाइप किया:

 23:59 बजे "शटडाउन -आर-टी 0" 

... जो ठीक काम कर सकता है।

लेकिन फिर मैंने दूसरा अनुमान लगाया। क्या मेरा 'शट डाउन' वाक्यविन्यास सही था? मैंने टाइपिंग द्वारा उपयोग सहायता देखने की कोशिश की

 शट डाउन / एच 

... और तुरंत मेरे आरडीपी कनेक्शन खो दिया। घबराहट, मैंने वाक्यविन्यास के लिए Google को मारा। एक त्वरित खोज से पता चला कि शटडाउन के सर्वर 2008 संस्करण में ए / एच स्विच शामिल है, जो (जैसा कि आपने अनुमान लगाया होगा) मशीन को हाइबरनेट करता है।

शिक्षकों ने मुझे यह रिपोर्ट करने के लिए मिनटों में फोन करना शुरू कर दिया कि वे उन रिपोर्ट कार्ड को खोल या सहेज नहीं सकते थे जिन पर वे काम कर रहे थे। चूंकि मैं ऑफसाइट था और सर्वर रूम लॉक था, मुझे सीधे स्कूल प्रिंसिपल को फोन करना पड़ा और उसे मशीन को वापस चालू करने की प्रक्रिया के माध्यम से चलना पड़ा।

आज मैं माफी मांगने के रूप में सभी को घर का बना कुकीज़ लाया।


47
2018-05-13 23:53



कमांड लाइन पर त्रुटिपूर्ण उपयोगकर्ता इंटरफ़ेस डिज़ाइन का एक आदर्श उदाहरण: "कम आश्चर्य के सिद्धांत" के साथ जो भी हुआ? - Mei
डॉस / विंडोज पर यह नहीं है? - Jared Updike
यह आमतौर पर है /? विन पर, लेकिन ऐसी कई सुविधाएं हैं जो यूनिक्स से पोर्ट की गई हैं या यूनिक्स लोगों द्वारा लिखी गई हैं (जिनमें एमएस में कुछ ऐसे शामिल हैं) जो हैं- एच - Richard Gadsden
..पर तुम अभी भी हमेशा की कोशिश /? प्रथम! - warren
यही कारण है कि मुझे लिनक्स पसंद है। man shutdown। मुझे पता है कि मैं समस्याओं का कारण नहीं बनूंगा man! - Josh


पिछली नौकरी में, हमारे पास एक महान गृहगणित प्रणाली थी जो कंपनी के भीतर दर्ज, बाएं या रुकने वाले मेल के प्रत्येक टुकड़े को लॉग और संग्रहीत करता था।

अपने पूरे मेलबॉक्स को दूर करो? कोई बात नहीं! मेल के एक टुकड़े की तलाश में है कि किसी ने आपको एक सप्ताह / महीना / वर्ष पहले भेजा था, लेकिन आप याद नहीं कर सकते कि इसे किसने भेजा या विषय क्या था? कोई बात नहीं! हम आपके लिए फरवरी से सब कुछ एक विशेष फ़ोल्डर में फिर से वितरित करेंगे।

किसी बिंदु पर, कंपनी के सीईओ के लिए एक प्रतिद्वंद्वी और संदेह के तहत एक आंतरिक विक्रेता के बीच जाने वाली मेल की निगरानी करने की आवश्यकता आई थी। इसलिए हमने हर रात भागने की तुलना में एक स्क्रिप्ट स्थापित की और पिछले दिन से सीईओ को प्रासंगिक मेल दिया। कोई बात नहीं!

एक महीने बाद एक डबल प्लस तत्काल समस्या का शब्द उच्च से नीचे आया। ऐसा लगता है कि सीईओ $ OTHERCOMPANY को भेजे गए मेल की सूची के माध्यम से पढ़ रहा था, वह इस पर आया:

To: somebody@$OTHERCOMPANY
From: CEO
Subject: CEO has read your message (subject line here)

स्वाभाविक रूप से, सीईओ एक महत्वपूर्ण व्यक्ति और सब कुछ है, वह Outlook में उन सभी "भेजें पठन रसीद" संवादों पर क्लिक करने में बहुत व्यस्त था और उन्होंने अपने ग्राहक को केवल उन सभी को भेजने के लिए कॉन्फ़िगर किया था। निगरानी फ़िल्टर द्वारा पकड़े गए संदेशों में से एक में रीड-रसीद अनुरोध सेट था। मान लीजिए कि आउटलुक ने क्या किया? निश्चित रूप से 'गुप्त' निगरानी को खराब कर दिया।

हमारा अगला कार्य: सीईओ से उस कंपनी को आउटगोइंग पठन रसीदों को अवरुद्ध करने के लिए मेल फ़िल्टर में नियम जोड़ना। हाँ, यह सबसे आसान तरीका था। :)


37
2018-05-13 18:35



हालांकि यह मेरे देश में कानूनी नहीं है। बिल्कुल भी। - mafu
आह, ठीक है तुंहारे देश। :) कनाडा में, यह ठीक है। - MikeyB
ईमेल की निगरानी करने या अपनी कंपनी के सर्वर छोड़ने पर निगरानी करना कानूनी नहीं है? आप किस देश में रहते हैं? - Andrew Ensley
न्यूज़पीक के लिए +1 - Fahad Sadah