昨天全球互聯網中斷,世界學到了什麼。



在11月18日,世界目睹了近年來最具破壞性的互聯網中斷之一。主要平台,從社交網絡到人工智能工具、音樂服務、設計平台,甚至狀態儀表板,都短暫地離線。

根本原因追溯到一次故障的Cloudflare更新,這一更新在幾分鍾內波及全球互聯網。

這一事件清楚地提醒我們,今天的數字生態系統已變得多麼深度互聯。

到底發生了什麼?

Cloudflare 的 Bot Management 更新中的一個配置文件意外地超出了其預期的大小。當這個超大的文件在 Cloudflare 的全球網路中同步時,它超載了關鍵系統並觸發了廣泛的 HTTP 500 錯誤。網站在技術上並沒有 "宕機",但是用戶根本無法訪問它們。

由於Cloudflare位於數百萬個網站與用戶之間,過載造成了連鎖反應。DNS查詢下降,API調用失敗,甚至Cloudflare自己的儀表板也難以加載。像X、ChatGPT、Spotify和Canva這樣的大型平台立即感受到了影響。

重要的是,這並不是一次網路攻擊。Cloudflare 確認此次中斷是內部意外造成的,強調了在互聯網規模下運營的復雜性。

Cloudflare是如何修復它的?

一旦確定問題,工程師們回滾了有缺陷的更新,將流量重新引導以穩定過載區域,並逐步恢復服務——CDN 節點、DNS 解析器、WARP、分析等。逐步恢復確保了在恢復期間的穩定性。

接下來會發生什麼?

Cloudflare正在實施新的保護措施,以防止類似事件的發生:

對文件大小和配置的限制更嚴格。

全球推廣前的多層測試。

改進的內部監測和預警系統。

更強的冗餘,以防止故障級聯。

這些措施旨在增強全球互聯網的韌性。

這有什麼重要性?

此次故障突顯了集中式基礎設施的強大與脆弱。然而,結果令人寬慰:
問題很快被識別出來,這不是安全漏洞,預防措施已經在進行中。

今天的互聯網更加具有韌性,並繼續作爲我們數字世界的支柱而發展。

希望你覺得它有益 🙏。
#BNB
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)