一、雲端時代的錯覺:
「都上雲了,還需要 DR 嗎?」
很多人在第一次聽到「雲端」兩個字時,內心都會自動補完一句:
「雲端不是很穩嗎?
不是有三個 AZ、五個 Region、七層冗餘嗎?」
於是 DR 就常常被默默放進「之後再說」清單裡,
跟「文件整理」、「權限重構」、「老系統下線」排在同一排。
直到某天:
-
雲端服務區域大當機
-
帳號權限被誤刪
-
IaC 套版一鍵誤炸整個環境
你才會發現一個殘酷的事實:
雲端幫你撐「硬體」,
但「人生選擇錯誤」還是你要自己承擔。
二、先講清楚一件事:
雲端 DR 在保什麼?
不論你用哪一家雲,DR 都不是在救「機器」,而是在救三樣東西:
-
資料:還在嗎?完整嗎?
-
服務:起得來嗎?順序對嗎?
-
時間:老闆能等多久?
也就是我們熟悉的兩個靈魂指標:
-
RPO:我能接受掉多少資料?
-
RTO:我能接受停多久?
接下來,我們就來看看不同雲端環境,
是怎麼回答這兩個問題的。
三、同一雲、不同區域(Multi-AZ / Multi-Region)
最常見,也最容易被高估的 DR
這一型 DR 的特色是:
-
都在同一家雲
-
只是換 AZ 或 Region
-
心理上最有安全感
常見作法
-
資料庫跨 AZ 同步
-
服務做 Load Balancer
-
重要服務跨 Region 備援
優點
-
架構相對簡單
-
延遲低
-
工程師比較不會失眠
現實的提醒
-
帳號誤刪 = 全區一起消失
-
IaC 寫錯 = 災難同步擴散
-
服務 Bug = 兩邊一起躺
這種 DR 很像:
「我把雞蛋放在同一間超大的籃子裡,
只是角落不一樣。」
四、跨雲 DR(Multi-Cloud)
理論上完美,實務上最考驗信仰
這是老闆最愛聽的一種:
「我們主系統在 AWS,
DR 在 Azure,
這樣最安全吧?」
聽起來很厲害,
工程師聽到通常會先深呼吸三秒。
常見作法
-
資料定期同步到另一家雲
-
重要服務保留最低可啟動版本
-
DNS 或流量切換
優點
-
不會被單一雲商綁死
-
區域級、雲商級災難都撐得住
-
PowerPoint 看起來超強
隱藏成本
-
架構、工具、權限全部雙份
-
Debug 時不知道該罵誰
-
人員要同時懂兩家雲
這種 DR 很像:
「我買了兩台不同品牌的車,
理論上很安全,
但保養時我開始懷疑人生。」
五、雲端+地端(Hybrid DR)
現實世界最常見的折衷方案
這一型通常出現在:
-
金融
-
製造
-
政府
-
或「有歷史包袱」的公司
常見作法
-
主系統在雲
-
DR 在地端,或反過來
-
透過複寫、快照同步
優點
-
彈性高
-
合規性好
-
舊系統不用一次殺光
現實問題
-
頻寬永遠不夠用
-
DR 演練時最容易卡
-
誰是主、誰是備常常講不清楚
這種 DR 很像:
「我白天住城市,
晚上住老家,
行李永遠沒帶齊。」
六、SaaS 的 DR:
你以為不用管,其實最無力
很多人對 SaaS 的 DR 想法是:
「那是廠商的事吧?」
某種程度上,對。
但只對一半。
你能掌控的
-
資料匯出
-
權限控管
-
帳號保護
你無法掌控的
-
廠商什麼時候修好
-
資料回不回得來
-
老闆為什麼一直問你
SaaS 的 DR 本質是:
「你不是在復原系統,
你是在復原耐心。」
七、雲端 DR 最常見的三大幻想
1️⃣ 「我們有備份就好」
→ 備份 ≠ 服務會起來
2️⃣ 「切換應該很快」
→ 沒演練過的切換,
通常都會很有教育意義
3️⃣ 「雲不會掛」
→ 會,而且通常掛得很有新聞價值
八、結語:
最好的 DR,不是最貴,而是你真的跑得動
不同雲端環境的 DR 方案,
沒有標準答案,
只有適不適合。
你需要問的永遠是:
-
出事時,我們多久能回來?
-
回來的是不是對的狀態?
-
誰負責按那個按鈕?
如果你的 DR 計畫:
-
文件太厚
-
架構太美
-
演練太少
那它通常只在簡報裡很可靠。
真正好的 DR,是那種:
你希望一輩子用不到,
但真的來時,
它會默默把事情做好。

沒有留言:
張貼留言