2025年12月14日 星期日

Nutanix_3 AHV 實際設定範例(含網路容錯)

 👉 「雙 ToR Switch + 流量分離 + 容錯」


一、環境假設(先對齊條件)

硬體

  • 每台 Nutanix Host:

    • NIC1 → ToR Switch A

    • NIC2 → ToR Switch B

    • 10GbE x2

  • Switch:

    • Aruba / Cisco / Juniper(概念通用)

    • 不使用 MLAG(先走穩定的 Active–Backup)

VLAN 規劃(範例)

用途VLAN ID
Management10
Storage / CVM20
VM Data30
Backup / Replication40


二、AHV 預設網路結構(先搞懂)

AHV 底層是:

[ NIC ][ Bond ][ Open vSwitch (br0) ][ VLAN ]

不需要手動建立 vSwitch,AHV 已經幫你做好,只要設定 Bond 和 VLAN。


三、設定 NIC Bond(容錯核心)

1️⃣ 查看目前 NIC 狀態

manage_ovs show_interfaces

你會看到類似:

eth0 UP eth1 UP


2️⃣ 建立 Active–Backup Bond(最穩)

ovs-vsctl add-bond br0 bond0 eth0 eth1 \ bond_mode=active-backup \ other_config:bond-detect-mode=miimon \ other_config:bond-miimon-interval=100

✔ 特點

  • 不吃 Switch 設定

  • 任一 Port / Switch 掛了,立刻切換

  • AHV 官方最常用

📌 驗證:

ovs-appctl bond/show bond0

你會看到 Active / Backup 狀態。


四、設定 Management Network(CVM / Host)

1️⃣ 建立 Management VLAN

ovs-vsctl add-port br0 vlan10 tag=10 -- set interface vlan10 type=internal

2️⃣ 設定 IP(Host)

ip addr add 192.168.10.21/24 dev vlan10 ip link set vlan10 up

CVM IP 通常在部署時就設定完成
Host 與 CVM 共用 Management VLAN 是正常的


五、設定 Storage / CVM Replication VLAN(重點)

⚠️ 強烈建議獨立 VLAN

1️⃣ 建立 VLAN 20

ovs-vsctl add-port br0 vlan20 tag=20 -- set interface vlan20 type=internal ip link set vlan20 up

2️⃣ 綁定 CVM Storage Network

在 CVM 中執行:

ncli cluster add-to-storage-network \ ip-address=192.168.20.21 \ netmask=255.255.255.0

📌 驗證:

ncli cluster get-storage-network

你會看到 Storage Traffic 已走 VLAN 20。


六、VM Data Network 設定(Prism UI)

這段 不用 CLI,用 Prism 比較安全

Prism → Network → Create Network

項目設定
NameVM-Network
VLAN ID30
TypeVLAN
IPAM視需求

完成後:

  • VM NIC 直接掛這個 Network

  • VM 流量走 VLAN 30

  • 與 Storage 完全隔離


七、Backup / Replication Network(進階)

如果你有:

  • Leap

  • Near-Sync Replication

  • 備份主機

建立 VLAN 40(方式同上)

ovs-vsctl add-port br0 vlan40 tag=40 -- set interface vlan40 type=internal ip link set vlan40 up

再於 Prism / DR 設定中指定該 Network。


八、實測容錯(一定要做)

測試 1:拔一條網路線

  • VM:不中斷

  • CVM:不中斷

  • Storage:不中斷

測試 2:關閉 Switch A

# Switch A power off

結果:

  • bond0 Active 自動切到 eth1

  • Prism 不會報 Critical

測試 3:檢查事件

Prism → Alerts → Network


九、常見錯誤與修正建議

❌ LACP 沒開 MLAG
✔ 改用 Active–Backup

❌ Storage 跟 VM 共 VLAN
✔ 分 VLAN,效能與穩定度差很多

❌ 沒監控 NIC Error
✔ Prism + SNMP + LibreNMS(你這套很適合)


十、AHV 網路設定心法(一句話版)

AHV 不怕設定少,只怕設定亂。
只要做到:
雙 NIC + 雙 Switch + 流量分離 + Active–Backup
你就已經打敗 80% 的現場環境。

沒有留言:

張貼留言

Nutanix_14 DR 架構:讓你的資料比你的早餐還安全

  如果你的資料比你的生活還重要,那麼 災難復原(Disaster Recovery, DR) 就不是選項,而是必須。想像一下,你正準備喝下午茶,突然電腦爆炸、資料消失、老闆打電話來問「報告呢?」——這種場景是不是比恐怖片還刺激?不用怕,Nutanix 來救你。今天我們就來聊...