昨晚所有代理節點同時炸了。


三個故障並發:VPS 上 xray 日誌權限錯誤導致進程崩潰、本地 Clash 配置文件被損壞、日本節點 IP 疑似被封。結果就是——跟 Claude Code 的連接徹底斷了。
這時候才意識到一件事:我自己很難"裸奔"排查問題了。
過去大半年,幾乎所有技術決策都是跟 AI 對話完成的。讀日誌、改配置、查文檔、寫腳本,全程 AI 全程 Claude Code。突然斷開,甚至不是"不方便"的問題,是真的不知道從哪下手。
最後靠借朋友的代理訂閱臨時上線,用 Claude Code
自己修自己的基礎設施:定位三個並發故障的根因、修復權限、從備份恢復配置、在 Vultr 上做全盤快照遷移換 IP。四個 PM2 進程、九個 cron 定時任務、所有代碼和數據原樣恢復,換個 IP 就滿血復活。
修完之後做了一件早該做的事:給自己搞了一個離線自救包。
本地跑一個小模型,配一份應急手冊(故障場景 + 排查命令 + 協議參數),斷網時本地模型讀手冊就能按步驟排查。零成本,不需要網絡。
一點感想:如果你每天重度依賴 AI CLI 工作,你的代理/網絡接入層就是你的"AI 生命線"。它也需要高可用設計——主備節點自動切換、離線降級方案、應急手冊。
跟部署生產服務一個道理,只不過這次掛掉的服務是你自己的大腦。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言