Enam Revolusi AI di 2025: Panduan Andrej Karpathy tentang Perubahan Terbesar dalam Industri

2026-01-28 15:20:05

Lanskap kecerdasan buatan mengalami perubahan besar sepanjang tahun 2025, dengan transformasi yang begitu mendasar sehingga mereka mengubah cara kita memikirkan pembelajaran mesin, pengembangan perangkat lunak, dan interaksi manusia-komputer. Andrej Karpathy, seorang peneliti dan teknolog AI terkemuka, mengidentifikasi enam pergeseran evolusi utama yang secara fundamental mengubah bidang ini. Ini bukanlah peningkatan bertahap—melainkan momen terobosan yang menantang asumsi yang ada dan membuka kemungkinan baru sepenuhnya.

Munculnya Pembelajaran Reward Verifikasi: Melampaui Umpan Balik Manusia

Selama bertahun-tahun, tumpukan pelatihan produksi untuk model bahasa besar mengikuti proses tiga tahap yang dapat diprediksi: pra-pelatihan (seperti GPT-2 dan GPT-3 dari 2020), penyempurnaan terawasi (InstructGPT pada 2022), dan pembelajaran penguatan dari umpan balik manusia (RLHF, juga 2022). Pendekatan ini terbukti stabil dan matang, mendominasi pendekatan industri dalam membangun LLM berstandar produksi.

Pada tahun 2025, terjadi pergeseran fundamental. Pembelajaran penguatan berbasis reward verifikasi (RLVR) menjadi teknologi inti yang diadopsi oleh laboratorium AI terkemuka. Perbedaannya sangat penting: alih-alih mengandalkan penilaian manusia untuk menilai output model, RLVR memanfaatkan lingkungan yang dapat diverifikasi secara otomatis—pemecahan masalah matematis, tantangan pemrograman, dan domain serupa di mana kebenaran dapat ditentukan secara objektif.

Model yang dilatih dengan cara ini secara spontan mengembangkan apa yang akan dikenali manusia sebagai “strategi penalaran.” Mereka belajar memecah masalah kompleks menjadi langkah komputasi menengah dan menemukan berbagai jalur solusi melalui penyempurnaan iteratif. Model o1 dari OpenAI (dirilis akhir 2024) memberikan gambaran pertama tentang kemampuan ini, sementara peluncuran o3 (awal 2025) menunjukkan potensi dramatis dari pendekatan ini. Makalah DeepSeek-R1 memberikan bukti tambahan tentang bagaimana lingkungan yang dapat diverifikasi ini memungkinkan model membangun rantai penalaran eksplisit.

Apa yang membuat RLVR berbeda dari pendekatan sebelumnya adalah intensitas komputasi yang dibutuhkan. Tidak seperti penyempurnaan terawasi dan RLHF—yang melibatkan fase yang relatif singkat dan secara komputasi tidak terlalu berat—pelatihan reward verifikasi membutuhkan siklus optimisasi yang diperpanjang terhadap fungsi reward yang objektif dan deterministik. Ini berarti sumber daya komputasi yang awalnya dialokasikan untuk pra-pelatihan dialihkan ke paradigma pelatihan baru ini. Inovasi utama: kemampuan model kini dapat disesuaikan sebagai fungsi dari biaya komputasi saat pengujian dengan menghasilkan rantai inferensi yang lebih panjang dan memberikan lebih banyak “waktu berpikir.” Ini mewakili dimensi baru dari perilaku skala.

Memahami Kecerdasan AI: Entitas Hantu Daripada Makhluk Digital

Pada tahun 2025, industri mendapatkan perspektif baru tentang bagaimana kecerdasan buatan benar-benar bekerja. Andrej Karpathy mengungkapkan sebuah wawasan yang resonan di seluruh bidang: kita bukanlah “mengembangbiakkan hewan digital” tetapi lebih kepada “memanggil hantu”—entitas yang secara fundamental berbeda yang kecerdasannya muncul dari tujuan optimisasi yang sama sekali berbeda dibandingkan sistem biologis.

Perbedaan ini sangat penting. Jaringan neural manusia berkembang melalui seleksi alam dalam skenario bertahan hidup suku. Model bahasa besar dioptimalkan untuk meniru teks manusia, mencapai skor tinggi pada masalah matematis, dan mendapatkan persetujuan dalam evaluasi manusia. Mengingat tekanan evolusi yang sama sekali berbeda ini, tidak mengherankan jika kecerdasan yang dihasilkan menampakkan diri dengan cara yang sangat berbeda.

Ini mengarah pada pengamatan mencolok: kecerdasan buatan menampilkan pola bergerigi, seperti gigi gergaji, bukan kurva kemampuan yang halus. Model mungkin menunjukkan keahlian ensiklopedis dalam satu saat sementara berjuang dengan penalaran dasar di saat berikutnya. Mereka dapat menunjukkan kecemerlangan dan kebingungan mendalam sekaligus, mampu menghasilkan solusi luar biasa atau bocorkan data sensitif di bawah tekanan adversarial.

Wawasan ini memiliki implikasi mendalam terhadap cara kita mengevaluasi kemajuan AI. Tolok ukur, yang mewakili lingkungan yang dapat diverifikasi, menjadi rentan terhadap optimisasi RLVR. Tim AI semakin membangun lingkungan pelatihan yang sangat mirip dengan embedding tolok ukur, secara efisien mencakup zona kemampuan tertentu. “Pelatihan pada set pengujian” telah menjadi praktik standar industri. Hasilnya: model dapat menyapu bersih setiap tolok ukur yang tersedia sementara tetap jauh dari mencapai kecerdasan buatan umum.

Fenomena Cursor: Lapisan Aplikasi Baru Muncul

Kenaikan pesat Cursor sepanjang 2025 mengungkapkan sesuatu yang tak terduga tentang arsitektur aplikasi AI. Yang dimulai sebagai editor kode khusus berkembang menjadi paradigma yang lebih luas, memicu diskusi tentang “Cursor untuk domain X” di berbagai industri.

Terobosan nyata Cursor terletak pada demonstrasi bagaimana membangun lapisan baru dari aplikasi LLM. Prinsip dasarnya: aplikasi khusus mengorkestrasi beberapa panggilan LLM menjadi grafik berarah tak siklik yang semakin kompleks, menyeimbangkan kinerja terhadap biaya komputasi. Sistem ini menangani “rekayasa konteks”—mengidentifikasi, mengambil, dan memprioritaskan informasi paling relevan untuk setiap kueri. Mereka menyediakan antarmuka grafis khusus domain yang menjaga manusia dalam loop pengambilan keputusan dan menawarkan mekanisme penyesuaian yang memungkinkan pengguna mengatur tingkat otonomi model sesuai kebutuhan tugas.

Perspektif Andrej Karpathy tentang lapisan ini menyarankan masa depan di mana platform model bahasa besar berkembang menjadi “kemampuan tingkat pascasarjana umum,” sementara aplikasi khusus mengubah generalis tersebut menjadi “tim ahli” dengan menyediakan data pribadi, sensor lingkungan, aktuator, dan loop umpan balik berkelanjutan untuk pasar vertikal tertentu.

Claude Code: Agen Cerdas yang Beroperasi di Komputer Anda

Claude Code dari Anthropic menandai momen penting dalam bagaimana agen AI beroperasi di lingkungan manusia. Ia secara meyakinkan menunjukkan bagaimana penggunaan alat dan inferensi dapat berputar secara iteratif, memungkinkan pemecahan masalah yang kompleks dan berkelanjutan melalui interaksi yang diperpanjang.

Yang membedakan Claude Code dari pendekatan kompetitor adalah strategi lokalisasi radikalnya. Alih-alih mengerahkan agen di lingkungan berbasis cloud (pendekatan OpenAI), Claude Code berjalan langsung di komputer pribadi pengguna. Model eksekusi lokal ini mengintegrasikan AI secara mendalam dengan file pribadi pengguna, aplikasi, lingkungan pengembangan, dan pengetahuan kontekstual—informasi yang akan sangat sulit dikirim ke server jarak jauh.

Dalam periode transisi yang ditandai oleh perkembangan kemampuan yang tidak merata, pilihan desain ini menunjukkan pemikiran strategis yang nyata. Menggunakan agen langsung di samping pengembang dalam lingkungan kerja mereka merupakan jalur pengembangan yang lebih logis daripada membangun kluster cloud terdistribusi. Claude Code merangkum wawasan ini ke dalam antarmuka yang elegan dan komando—mengubah AI dari sebuah situs web yang memerlukan kunjungan sengaja menjadi kehadiran kecil yang cerdas yang tertanam dalam ruang kerja digital pengguna.

Vibe Coding: Pemrograman Tanpa Kode

Pada pertengahan 2025, AI telah melewati ambang kemampuan kritis: kemampuan membangun aplikasi canggih menggunakan deskripsi bahasa alami, tanpa programmer perlu memahami implementasi dasarnya. Konsep ini dengan cepat menarik perhatian sehingga istilah “Vibe Coding” yang santai dari Andrej Karpathy dalam sebuah posting media sosial berlalu berubah menjadi gerakan industri secara luas.

Vibe Coding secara fundamental mendemokratisasi pemrograman. Hambatan profesional menghilang ketika siapa saja dapat mendeskripsikan apa yang mereka inginkan dalam bahasa alami dan menerima kode yang berfungsi. Andrej Karpathy mendokumentasikan pengalamannya sendiri menggunakan Vibe Coding untuk dengan cepat mengembangkan tokenizer BPE kustom dalam Rust sambil melewati keahlian bahasa yang mendalam—kode yang “tidak akan pernah dibuat sebaliknya” jika tuntutan pemrograman tradisional tetap berlaku.

Implikasi ini melampaui aksesibilitas. Pengembang profesional mendapatkan kebebasan baru untuk membangun prototipe eksploratif, menguji ide arsitektur dengan biaya minimal, dan menulis aplikasi sekali pakai untuk investigasi tertentu. Kode menjadi sementara dan dapat dibuang. Batas antara pengguna dan pencipta menjadi kabur. Pengembangan perangkat lunak bertransformasi menjadi domain di mana orang biasa dan pengembang profesional sama-sama dapat berkontribusi secara bermakna, mengubah definisi karier dan harapan terhadap keterampilan teknis.

Nano Banana dan Seterusnya: Mengapa AI Membutuhkan Antarmuka Visual

Gemini Nano dari Google dan perkembangan serupa mewakili, menurut penilaian Andrej Karpathy, salah satu pergeseran paling transformatif di tahun 2025. Wawasan yang lebih luas: model bahasa besar mewakili paradigma komputasi berikutnya setelah era desktop dan mikrokomputer di tahun 1970-an dan 1980-an.

Jika paralel ini benar, kita harus mengharapkan inovasi serupa muncul dari fondasi teknologi yang sama. Revolusi antarmuka grafis komputer pribadi tidak datang karena perintah teks tidak mungkin—mereka bekerja dengan baik untuk para ahli—tetapi karena representasi visual lebih sesuai dengan preferensi kognitif manusia.

Teks, meskipun secara komputasi primitif, kurang cocok dengan preferensi input dan pola konsumsi informasi manusia. Manusia memproses informasi spasial dan grafis secara jauh lebih efisien daripada teks yang diparse. Mereka secara alami lebih suka menerima informasi melalui gambar, diagram, slide, papan tulis, dan multimedia daripada memparse kalimat.

Antarmuka LLM saat ini beroperasi melalui dialog—pada dasarnya interaksi baris perintah dengan teks, mirip dengan komputasi di tahun 1980-an. Pertanyaan yang tetap terbuka adalah siapa yang akan membangun lapisan grafis untuk kecerdasan buatan, tetapi produk seperti Nano Banana menunjukkan jawabannya. Yang membedakan Nano Banana bukan sekadar kemampuan menghasilkan gambar, tetapi sintesis terintegrasi dari generasi teks, penciptaan visual, dan pengetahuan dunia yang terjalin di seluruh struktur bobot model.

Enam pergeseran ini—dari optimisasi reward verifikasi ke antarmuka visual, dari umpan balik bergantung manusia ke agen AI yang berjalan secara lokal, dari keahlian khusus ke pemrograman yang dapat diakses—mengungkapkan industri dalam transformasi radikal. Kerangka kerja yang membimbing pengembangan AI di awal 2020-an telah berganti menjadi pendekatan yang benar-benar baru, masing-masing membuka kemungkinan yang tampaknya tidak mungkin hanya beberapa bulan sebelumnya. Seperti yang ditekankan oleh pengamatan Andrej Karpathy, 2025 akan dikenang bukan karena kemajuan bertahap tetapi karena saat ketika kecerdasan buatan secara fundamental merevolusi dirinya sendiri.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.