▓▓那些年那些新人捅的簍子▓▓

1.2021年6月,字節的一位實習生誤刪了公司機器學習平臺 Lagrange Lite 全量 Batch 模型的備份,原因是扁平化管理,實習生與正式員工有同樣的文檔權限。有人表示刪的都是離線數據,影響不大。還有人表示重新訓練模型和延遲上線,理論上都會對指標有負向,只是不那麼明顯了。
 
2.亞馬遜扁平化管理,SDE啥活兒都要幹,權限一視同仁。AWS的一個新人在上班第一天做熟悉開發環境自助培訓時,他本來想連測試環境,結果連不上,老員工給了他一個配置,他沒分清哪個是測試的,哪個是生產的,不小心連上了生產環境數據庫,於是把整個數據庫給 Rebuild 了,導致全美 Netflix 停服數小時
 
3.2014年某領導安排妹子在生產服務器上本意卸載重新安裝 Oracle,但腳本中有一句話:rm -rf $ORACLE_BASE/*
不幸變量 ORACLE_BASE 未賦值!
於是乎 Tomcat/MySQL...全刪了
由於沒有及時發現,造成部分數據寫入磁盤,加大了不可恢復的機率!
更悲劇的是,找到脫機備份,發現備份文件只有1KB,裏面只有幾行熟悉的 mysqldump 註釋。可用的、最接近的備份時間是2013年年底!
欲知後事如何,請看:https://www.cnblogs.com/zhouyu629/p/3734494.html
 
4.2021年3月,一位實習生爲了炫耀自己的新工作,拍攝並分享了德國柏林海德丁監獄內鑰匙的照片。當地司法部門得知這起泄密事件後,監獄隨即連夜換鎖,舊鑰匙也被立即銷燬。
柏林司法部發言人對媒體說:“所有牢房和通道的門鎖都被更換了,該實習生也被禁止進入監獄,他的實習也就此終止。”他還補充稱,更換600把鎖的費用可能會由這名見習生負擔,預估5萬歐元。
 
5.某雲計算廠商,一位試用期員工,在業務巡檢系統上,原本應輸入“last reboot”命令,結果看文檔的時候這條命令自動折行了,他只看到了後一句“reboot”,於是這句“reboot”就被自動化工具給廣播出去了,生產環境裏所有節點重啓!//感謝網友向昀哥提供這條訊息
 
6.某年某電商平臺雙十一之前,代碼原本應該用“disconnect”命令來斷開與 Redis 之間的連接,沒想到新人代碼中寫的卻是“shutdown”命令!於是乎……
 
昀哥寫作於2021年6月24日
關鍵詞:責任事故,安全,運維,實習生,新人
-全文完,如果覺得有收穫,記得點推薦或“收藏”-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章