Perdebatan mengenai daya pemrosesan grafis sudah basi. Mereka yang berhasil di masa depan adalah mereka yang menguasai di mana data berada. Seiring dengan terus meledaknya penciptaan data global, perusahaan-perusahaan yang tertinggal akan terkunci dari tahap inovasi berikutnya.
Ringkasan
Volume data sedang meledak, dengan proyeksi penciptaan global akan melebihi 200 zettabyte pada akhir 2025, lebih banyak daripada semua output manusia sebelumnya digabungkan.
Penyimpanan cloud terpusat adalah hambatan AI, meningkatkan biaya hingga 80% dengan biaya egress dan memperlambat transfer data skala besar hingga berhari-hari.
Jaringan penyimpanan terdesentralisasi menawarkan solusi, membagi data di antara node independen dan menyematkan bukti kriptografi untuk jejak audit yang siap untuk kepatuhan.
Regulasi seperti Undang-Undang AI UE meningkatkan taruhan, memaksa bukti asal data—menjadikan penyimpanan sebagai prioritas strategis, bukan utilitas latar belakang.
Penciptaan data diproyeksikan akan mencapai puncaknya 200 zettabyte di seluruh dunia pada akhir 2025; itu cukup untuk men-stream setiap film yang pernah dibuat lebih dari 100 miliar kali. Perkiraan ini melibatkan lebih banyak materi digital daripada yang dihasilkan umat manusia dalam setiap tahun sebelumnya digabungkan.
Sejalan dengan lonjakan ini, tim peneliti telah mengungkap model bahasa triliun parameter pertama yang dirilis secara publik. Model raksasa ini, yang korpus latihannya saja akan mengisi seluruh arsip nasional sepuluh tahun yang lalu, adalah contoh dari Leviathan semacam itu yang mengkonsumsi petabyte per jam.
Tanpa saluran penyimpanan yang dapat menginjeksi, menampung, dan mengalirkan data pada skala baru ini, bahkan prosesornya yang tercepat sekalipun akan menderita dalam frustrasi yang tidak terpakai.
Cloud terpusat adalah bottleneck baru
Sebagian besar organisasi masih bergantung pada segelintir silo penyimpanan hyperscale yang dirancang untuk aplikasi web, bukan ilmu pengetahuan perbatasan. Beban finansialnya sangat berat.
Sebuah audit industri yang diterbitkan pada bulan April mengungkapkan bahwa biaya egress dan retrieval yang tersembunyi dapat meningkatkan biaya penyimpanan yang sebenarnya hingga 80%, menjadikan pelatihan ulang model rutin sebagai usaha yang merusak anggaran. Lebih buruk lagi, memindahkan puluhan petabyte antar wilayah dapat memakan waktu berhari-hari; sebuah keabadian ketika keunggulan kompetitif diukur dalam siklus iterasi.
Sentralisasi, oleh karena itu, lebih dari sekadar membengkakkan faktur; ia menyematkan ketidaksetaraan secara langsung ke dalam ekonomi kecerdasan buatan, memberikan keuntungan otomatis kepada para pelaku pasar yang sudah ada dengan kantong yang lebih dalam dibandingkan yang lainnya. Menanggapi kenyataan ini, cetak biru yang berbeda semakin mendapatkan momentum seiring dengan jaringan penyimpanan terdesentralisasi yang membagi data di ribuan node independen membuka jalan untuk masa depan yang dibangun di atas kaki yang sama.
Sama pentingnya adalah kebutuhan akan jejak audit yang transparan yang memenuhi mandat pengungkapan yang mendatang tentang bagaimana data perdagangan diperoleh, dikurasi, dan dikelola. Pada akhirnya, regulasi akan menjadi faktor penentu apakah model-model masa depan akan terlihat atau menghadapi litigasi.
Uji stres baru penyimpanan
AI waktu nyata kini meluas jauh di luar dinding pusat data, mendorong model ke lantai pabrik, rumah sakit, dan kendaraan otonom. Di tepi-tepi ini, satu milidetik yang hilang karena I/O yang lambat dapat memicu kesalahan produksi atau risiko keselamatan.
Benchmark terbaru MLPerf Storage v2.0 membuktikan tekanan: checkpointing beban kerja kelas GPT di 10.000 akselerator kini memakan waktu 37 detik, dan bahkan superkluster 100.000-GPU masih terhenti selama 4,4 detik saat menunggu pada disk daripada melakukan operasi matematis.
Kecuali pipa dapat mengirimkan petabyte dalam lonjakan dan kemudian mereplikasi data yang sama ke ribuan mikro-situs, ‘edge-AI’ akan tetap lebih sebagai keynote daripada kenyataan. Analis sudah mengulangi peringatan bahwa throughput penyimpanan, bukan memori atau jaringan, akan menjadi hambatan nomor satu yang memperlambat kluster generasi berikutnya.
Regulasi menambahkan lapisan urgensi lainnya, seperti Undang-Undang AI Uni Eropa, yang memasuki gelombang penegakan kedua pada 2 Agustus — memaksa penyedia model tujuan umum untuk mendokumentasikan setiap bagian data pelatihan…atau menghadapi denda hingga 7% dari omset global.
Silo terpusat berjuang untuk memenuhi mandat ini. Salinan yang duplikat memburamkan asal-usul, dan log keluar yang tidak transparan menjadikan jejak audit mimpi buruk bagi akuntan. Sebaliknya, jaringan terdesentralisasi menyematkan bukti kriptografi replikasi ke dalam struktur dasar mereka, mengubah kepatuhan menjadi produk sampingan daripada tambahan yang mahal.
Abaikan penyimpanan dengan risiko bahaya
Dengan latensi edge diukur dalam mikrodetik dan hukuman hukum diukur dalam miliaran, penyimpanan bukan lagi utilitas latar belakang; itu adalah satu-satunya substrat di mana AI masa depan dapat berjalan secara hukum dan fisik. Perusahaan yang masih memperlakukan kapasitas sebagai item baris komoditas sedang mengundang utang teknis dan guncangan regulasi dalam ukuran yang sama.
Inovasi komputasi akan terus mencuri perhatian, tetapi tanpa pemikiran radikal yang sama tentang di mana ( dan bagaimana ) data disimpan, silikon paling canggih akan terdiam sementara biaya dan risiko kepatuhan meningkat.
Perlombaan untuk mendominasi AI sedang berlangsung, dan akan dimenangkan oleh mereka yang mengangkat penyimpanan menjadi prioritas strategis kelas satu, menerima desentralisasi, dan membangun saluran yang siap diaudit yang dapat diskalakan dari inti hingga tepi. Semua orang yang lain akan menemukan bahwa tidak ada jumlah daya GPU yang dapat melampaui kemacetan yang dibangun ke dalam fondasi tumpukan mereka.
Kai Wawrzinek
Kai Wawrzinek adalah salah satu pendiri Impossible Cloud & Impossible Cloud Network. Dia adalah seorang pengusaha berpengalaman dengan gelar Ph.D. di bidang Hukum dan rekam jejak yang terbukti dalam membangun usaha yang sukses. Menyadari kebutuhan akan solusi tingkat perusahaan di ruang web3, Kai mendirikan Impossible Cloud Network (ICN), sebuah platform cloud terdesentralisasi yang bertujuan untuk menciptakan alternatif terdesentralisasi untuk AWS. Sebelum ICN, Kai mendirikan Goodgame Studios, sebuah perusahaan game online, dan mengembangkan perusahaan tersebut menjadi lebih dari 1.000 karyawan serta menghasilkan lebih dari €1 miliar dalam pendapatan, dan mencatatkan perusahaan tersebut di Nasdaq pada tahun 2018 melalui merger terbalik.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Penyimpanan, bukan silikon, akan memicu terobosan berikutnya AI.
Perdebatan mengenai daya pemrosesan grafis sudah basi. Mereka yang berhasil di masa depan adalah mereka yang menguasai di mana data berada. Seiring dengan terus meledaknya penciptaan data global, perusahaan-perusahaan yang tertinggal akan terkunci dari tahap inovasi berikutnya.
Ringkasan
Penciptaan data diproyeksikan akan mencapai puncaknya 200 zettabyte di seluruh dunia pada akhir 2025; itu cukup untuk men-stream setiap film yang pernah dibuat lebih dari 100 miliar kali. Perkiraan ini melibatkan lebih banyak materi digital daripada yang dihasilkan umat manusia dalam setiap tahun sebelumnya digabungkan.
Sejalan dengan lonjakan ini, tim peneliti telah mengungkap model bahasa triliun parameter pertama yang dirilis secara publik. Model raksasa ini, yang korpus latihannya saja akan mengisi seluruh arsip nasional sepuluh tahun yang lalu, adalah contoh dari Leviathan semacam itu yang mengkonsumsi petabyte per jam.
Tanpa saluran penyimpanan yang dapat menginjeksi, menampung, dan mengalirkan data pada skala baru ini, bahkan prosesornya yang tercepat sekalipun akan menderita dalam frustrasi yang tidak terpakai.
Cloud terpusat adalah bottleneck baru
Sebagian besar organisasi masih bergantung pada segelintir silo penyimpanan hyperscale yang dirancang untuk aplikasi web, bukan ilmu pengetahuan perbatasan. Beban finansialnya sangat berat.
Sebuah audit industri yang diterbitkan pada bulan April mengungkapkan bahwa biaya egress dan retrieval yang tersembunyi dapat meningkatkan biaya penyimpanan yang sebenarnya hingga 80%, menjadikan pelatihan ulang model rutin sebagai usaha yang merusak anggaran. Lebih buruk lagi, memindahkan puluhan petabyte antar wilayah dapat memakan waktu berhari-hari; sebuah keabadian ketika keunggulan kompetitif diukur dalam siklus iterasi.
Sentralisasi, oleh karena itu, lebih dari sekadar membengkakkan faktur; ia menyematkan ketidaksetaraan secara langsung ke dalam ekonomi kecerdasan buatan, memberikan keuntungan otomatis kepada para pelaku pasar yang sudah ada dengan kantong yang lebih dalam dibandingkan yang lainnya. Menanggapi kenyataan ini, cetak biru yang berbeda semakin mendapatkan momentum seiring dengan jaringan penyimpanan terdesentralisasi yang membagi data di ribuan node independen membuka jalan untuk masa depan yang dibangun di atas kaki yang sama.
Sama pentingnya adalah kebutuhan akan jejak audit yang transparan yang memenuhi mandat pengungkapan yang mendatang tentang bagaimana data perdagangan diperoleh, dikurasi, dan dikelola. Pada akhirnya, regulasi akan menjadi faktor penentu apakah model-model masa depan akan terlihat atau menghadapi litigasi.
Uji stres baru penyimpanan
AI waktu nyata kini meluas jauh di luar dinding pusat data, mendorong model ke lantai pabrik, rumah sakit, dan kendaraan otonom. Di tepi-tepi ini, satu milidetik yang hilang karena I/O yang lambat dapat memicu kesalahan produksi atau risiko keselamatan.
Benchmark terbaru MLPerf Storage v2.0 membuktikan tekanan: checkpointing beban kerja kelas GPT di 10.000 akselerator kini memakan waktu 37 detik, dan bahkan superkluster 100.000-GPU masih terhenti selama 4,4 detik saat menunggu pada disk daripada melakukan operasi matematis.
Kecuali pipa dapat mengirimkan petabyte dalam lonjakan dan kemudian mereplikasi data yang sama ke ribuan mikro-situs, ‘edge-AI’ akan tetap lebih sebagai keynote daripada kenyataan. Analis sudah mengulangi peringatan bahwa throughput penyimpanan, bukan memori atau jaringan, akan menjadi hambatan nomor satu yang memperlambat kluster generasi berikutnya.
Regulasi menambahkan lapisan urgensi lainnya, seperti Undang-Undang AI Uni Eropa, yang memasuki gelombang penegakan kedua pada 2 Agustus — memaksa penyedia model tujuan umum untuk mendokumentasikan setiap bagian data pelatihan…atau menghadapi denda hingga 7% dari omset global.
Silo terpusat berjuang untuk memenuhi mandat ini. Salinan yang duplikat memburamkan asal-usul, dan log keluar yang tidak transparan menjadikan jejak audit mimpi buruk bagi akuntan. Sebaliknya, jaringan terdesentralisasi menyematkan bukti kriptografi replikasi ke dalam struktur dasar mereka, mengubah kepatuhan menjadi produk sampingan daripada tambahan yang mahal.
Abaikan penyimpanan dengan risiko bahaya
Dengan latensi edge diukur dalam mikrodetik dan hukuman hukum diukur dalam miliaran, penyimpanan bukan lagi utilitas latar belakang; itu adalah satu-satunya substrat di mana AI masa depan dapat berjalan secara hukum dan fisik. Perusahaan yang masih memperlakukan kapasitas sebagai item baris komoditas sedang mengundang utang teknis dan guncangan regulasi dalam ukuran yang sama.
Inovasi komputasi akan terus mencuri perhatian, tetapi tanpa pemikiran radikal yang sama tentang di mana ( dan bagaimana ) data disimpan, silikon paling canggih akan terdiam sementara biaya dan risiko kepatuhan meningkat.
Perlombaan untuk mendominasi AI sedang berlangsung, dan akan dimenangkan oleh mereka yang mengangkat penyimpanan menjadi prioritas strategis kelas satu, menerima desentralisasi, dan membangun saluran yang siap diaudit yang dapat diskalakan dari inti hingga tepi. Semua orang yang lain akan menemukan bahwa tidak ada jumlah daya GPU yang dapat melampaui kemacetan yang dibangun ke dalam fondasi tumpukan mereka.
Kai Wawrzinek
Kai Wawrzinek adalah salah satu pendiri Impossible Cloud & Impossible Cloud Network. Dia adalah seorang pengusaha berpengalaman dengan gelar Ph.D. di bidang Hukum dan rekam jejak yang terbukti dalam membangun usaha yang sukses. Menyadari kebutuhan akan solusi tingkat perusahaan di ruang web3, Kai mendirikan Impossible Cloud Network (ICN), sebuah platform cloud terdesentralisasi yang bertujuan untuk menciptakan alternatif terdesentralisasi untuk AWS. Sebelum ICN, Kai mendirikan Goodgame Studios, sebuah perusahaan game online, dan mengembangkan perusahaan tersebut menjadi lebih dari 1.000 karyawan serta menghasilkan lebih dari €1 miliar dalam pendapatan, dan mencatatkan perusahaan tersebut di Nasdaq pada tahun 2018 melalui merger terbalik.