Sáu cuộc Cách mạng AI vào năm 2025: Hướng dẫn của Andrej Karpathy về những thay đổi lớn nhất trong ngành

2026-01-28 15:20:05

Cảnh quan trí tuệ nhân tạo đã trải qua những biến đổi địa chấn trong suốt năm 2025, với những chuyển đổi mang tính nền tảng đến mức chúng đã định hình lại cách chúng ta suy nghĩ về học máy, phát triển phần mềm và tương tác người-máy tính. Andrej Karpathy, một nhà nghiên cứu và công nghệ AI nổi bật, đã xác định sáu bước tiến lớn trong quá trình tiến hóa đã thay đổi căn bản lĩnh vực này. Đây không phải là những cải tiến từng bước—chúng đại diện cho những khoảnh khắc đột phá thách thức các giả định hiện có và mở ra những khả năng hoàn toàn mới.

Sự Xuất Hiện của Học Thưởng Có Thể Xác Minh: Vượt Ra Ngoài Phản Hồi Con Người

Trong nhiều năm, hệ thống đào tạo sản xuất cho các mô hình ngôn ngữ lớn theo trình tự ba giai đoạn dự đoán: tiền huấn luyện (như GPT-2 và GPT-3 từ năm 2020), tinh chỉnh có giám sát (InstructGPT năm 2022), và học tăng cường từ phản hồi con người (RLHF, cũng năm 2022). Phương pháp này đã chứng minh được sự ổn định và trưởng thành, chiếm ưu thế trong cách ngành công nghiệp xây dựng các mô hình LLM đạt tiêu chuẩn sản xuất.

Đến năm 2025, một bước chuyển căn bản đã xảy ra. Học tăng cường dựa trên phần thưởng có thể xác minh (RLVR) trở thành công nghệ cốt lõi được các phòng thí nghiệm AI hàng đầu chấp nhận. Sự khác biệt là rất quan trọng: thay vì dựa vào đánh giá của con người để chấm điểm đầu ra của mô hình, RLVR tận dụng các môi trường tự động xác minh—giải quyết vấn đề toán học, thử thách lập trình, và các lĩnh vực tương tự nơi độ chính xác có thể được xác định một cách khách quan.

Các mô hình được huấn luyện theo cách này tự nhiên phát triển những gì con người sẽ nhận ra là “chiến lược lý luận.” Chúng học cách phân chia các vấn đề phức tạp thành các bước tính toán trung gian và khám phá nhiều hướng giải pháp thông qua tinh chỉnh lặp đi lặp lại. Mô hình o1 của OpenAI (ra mắt cuối năm 2024) đã cung cấp cái nhìn đầu tiên về khả năng này, trong khi việc ra mắt o3 (đầu năm 2025) đã thể hiện tiềm năng đáng kể của phương pháp này. Bài báo DeepSeek-R1 cung cấp thêm bằng chứng về cách các môi trường có thể xác minh này cho phép các mô hình xây dựng các chuỗi lý luận rõ ràng.

Điều làm RLVR khác biệt so với các phương pháp trước đó là yêu cầu về cường độ tính toán. Khác với tinh chỉnh có giám sát và RLHF—bao gồm các giai đoạn ngắn, có tính toán vừa phải—việc huấn luyện dựa trên phần thưởng xác minh đòi hỏi các chu kỳ tối ưu hóa kéo dài dựa trên các hàm phần thưởng khách quan, xác định. Điều này có nghĩa là các nguồn lực tính toán ban đầu dành cho tiền huấn luyện đang được chuyển hướng sang mô hình huấn luyện mới này. Đổi mới chính ở đây là khả năng điều chỉnh năng lực của mô hình theo chi phí tính toán khi thử nghiệm, bằng cách tạo ra các chuỗi suy luận dài hơn và cung cấp nhiều “thời gian suy nghĩ” hơn. Đây là một chiều hướng mới hoàn toàn về hành vi mở rộng.

Hiểu Về Trí Tuệ AI: Các Thực Thể Ma Quái Thay Vì Sinh Vật Kỹ Thuật Số

Trong năm 2025, ngành công nghiệp đã có cái nhìn mới về cách trí tuệ nhân tạo thực sự hoạt động. Andrej Karpathy đã diễn đạt một nhận thức đã vang vọng trong toàn lĩnh vực: chúng ta không “lai tạo động vật kỹ thuật số” mà thay vào đó là “triệu hồi ma quái”—các thực thể hoàn toàn khác biệt, trí tuệ của chúng xuất phát từ các mục tiêu tối ưu hóa hoàn toàn khác biệt so với các hệ thống sinh học.

Sự phân biệt này rất quan trọng. Các mạng nơ-ron của con người tiến hóa qua quá trình chọn lọc tự nhiên trong các kịch bản sinh tồn bộ lạc. Các mô hình ngôn ngữ lớn được tối ưu hóa để sao chép văn bản của con người, đạt điểm cao trong các bài toán toán học, và giành được sự chấp thuận trong các đánh giá của con người. Với những áp lực tiến hóa hoàn toàn khác biệt này, không ngạc nhiên khi trí tuệ kết quả thể hiện theo những cách hoàn toàn khác biệt.

Điều này dẫn đến một quan sát nổi bật: trí tuệ nhân tạo thể hiện theo dạng gợn sóng, hình dạng răng cưa chứ không phải đường cong khả năng mượt mà. Các mô hình có thể thể hiện kiến thức encyclopedic trong một khoảnh khắc, trong khi gặp khó khăn với lý luận sơ đẳng ở khoảnh khắc tiếp theo. Chúng có thể thể hiện cả sự xuất sắc lẫn sự nhầm lẫn sâu sắc, có khả năng tạo ra các giải pháp đáng chú ý hoặc rò rỉ dữ liệu nhạy cảm dưới áp lực đối kháng.

Nhận thức này có ảnh hưởng sâu sắc đến cách chúng ta đánh giá tiến trình AI. Các chuẩn mực, đại diện cho các môi trường có thể xác minh, đã trở nên dễ bị tối ưu hóa theo RLVR. Các nhóm AI ngày càng xây dựng các môi trường huấn luyện phản ánh sát sao các nhúng chuẩn, một cách hiệu quả bao phủ các vùng khả năng cụ thể này. “Huấn luyện trên bộ kiểm tra” đã trở thành thực hành tiêu chuẩn trong ngành. Kết quả là: các mô hình có thể vượt qua mọi chuẩn mực có sẵn trong khi vẫn còn xa mới đạt được trí tuệ nhân tạo tổng quát.

Hiện tượng Con Trỏ: Một Lớp Ứng Dụng Mới Nổi Lên

Sự tăng tốc nhanh của Cursor trong suốt năm 2025 đã tiết lộ điều gì đó bất ngờ về kiến trúc ứng dụng AI. Những gì bắt đầu như một trình chỉnh sửa mã chuyên dụng đã phát triển thành một mô hình rộng hơn, khơi nguồn các cuộc thảo luận về “Cursor cho X lĩnh vực” trong nhiều ngành công nghiệp.

Bước đột phá thực sự của Cursor nằm ở việc chứng minh cách xây dựng một lớp mới của các ứng dụng LLM. Nguyên tắc cơ bản: các ứng dụng chuyên biệt điều phối nhiều cuộc gọi LLM thành các đồ thị có hướng không chu kỳ ngày càng phức tạp hơn, cân bằng giữa hiệu suất và chi phí tính toán. Các hệ thống này xử lý “kỹ thuật ngữ ngữ cảnh”—xác định, truy xuất và ưu tiên thông tin phù hợp nhất cho từng truy vấn. Chúng cung cấp các giao diện đồ họa đặc thù theo lĩnh vực, giữ con người trong vòng quyết định và cung cấp các cơ chế điều chỉnh cho phép người dùng tăng hoặc giảm mức độ tự chủ của mô hình dựa trên yêu cầu của nhiệm vụ.

Quan điểm của Andrej Karpathy về lớp này gợi ý một tương lai nơi các nền tảng mô hình ngôn ngữ lớn tiến hóa thành “khả năng tổng quát cấp cao của người tốt nghiệp,” trong khi các ứng dụng chuyên biệt biến các người tổng quát đó thành “đội ngũ chuyên gia” bằng cách cung cấp dữ liệu riêng, cảm biến môi trường, bộ truyền động, và các vòng phản hồi liên tục cho các thị trường dọc cụ thể.

Claude Code: Các Agent Thông Minh Chạy Trên Máy Tính Của Bạn

Claude Code của Anthropic đã đánh dấu một bước ngoặt trong cách các agent AI hoạt động trong môi trường con người. Nó chứng minh thuyết phục cách sử dụng công cụ và suy luận có thể luân phiên lặp lại, cho phép giải quyết các vấn đề phức tạp, kéo dài qua các tương tác liên tục.

Điểm đặc biệt của Claude Code so với các phương pháp cạnh tranh là chiến lược định vị cực đoan của nó. Thay vì triển khai các agent trong các môi trường chứa trong đám mây (theo cách của OpenAI), Claude Code chạy trực tiếp trên máy tính cá nhân của người dùng. Mô hình thực thi cục bộ này tích hợp sâu sắc AI với các tệp riêng tư, ứng dụng, môi trường phát triển, và kiến thức ngữ cảnh—thông tin mà sẽ cực kỳ khó truyền tải đến các máy chủ từ xa.

Trong giai đoạn chuyển tiếp đặc trưng bởi sự phát triển năng lực không đồng đều, lựa chọn thiết kế này thể hiện một tư duy chiến lược chân chính. Triển khai các agent trực tiếp bên cạnh các nhà phát triển trong môi trường làm việc của họ là một con đường phát triển hợp lý hơn so với việc xây dựng các cụm đám mây phân tán. Claude Code đã đúc kết nhận thức này thành một giao diện tinh tế, mạnh mẽ—biến AI từ một trang web yêu cầu truy cập cố ý thành một sự hiện diện nhỏ, thông minh, tích hợp trong không gian kỹ thuật số của người dùng.

Lập Trình Vibe: Lập Trình Không Cần Mã

Đến giữa năm 2025, AI đã vượt qua một ngưỡng năng lực quan trọng: khả năng xây dựng các ứng dụng phức tạp bằng mô tả bằng ngôn ngữ tự nhiên, mà các lập trình viên không cần hiểu rõ về cách thực thi nền tảng. Khái niệm này nhanh chóng thu hút trí tưởng tượng đến mức thuật ngữ “Vibe Coding” do Andrej Karpathy đặt ra trong một bài đăng mạng xã hội thoáng qua đã trở thành một phong trào trong ngành.

Vibe Coding dân chủ hóa lập trình một cách căn bản. Các rào cản chuyên nghiệp tan biến khi bất kỳ ai cũng có thể mô tả những gì họ muốn bằng ngôn ngữ tự nhiên và nhận được mã hoạt động. Andrej Karpathy đã ghi lại trải nghiệm của chính mình khi sử dụng Vibe Coding để nhanh chóng phát triển một tokenizer BPE tùy chỉnh bằng Rust trong khi bỏ qua các kiến thức sâu về ngôn ngữ—mã mà “sẽ không bao giờ được viết nếu không có yêu cầu lập trình truyền thống.”

Những tác động vượt ra ngoài khả năng tiếp cận. Các nhà phát triển chuyên nghiệp có thể tự do hơn trong việc xây dựng các nguyên mẫu khám phá, thử nghiệm ý tưởng kiến trúc với chi phí tối thiểu, và viết các ứng dụng dùng một lần cho các mục đích điều tra cụ thể. Mã trở nên phù du và có thể vứt bỏ. Ranh giới giữa người dùng và nhà sáng tạo mờ đi. Phát triển phần mềm biến thành một lĩnh vực nơi người bình thường và các nhà phát triển chuyên nghiệp đều có thể đóng góp ý nghĩa, định hình lại các khái niệm nghề nghiệp và kỳ vọng về kỹ năng kỹ thuật.

Nano Banana và Hơn Thế Nữa: Tại Sao AI Cần Giao Diện Thị Giác

Google’s Gemini Nano và các phát triển tương tự, theo đánh giá của Andrej Karpathy, là một trong những bước chuyển đổi mang tính đột phá nhất của năm 2025. Nhận thức rộng hơn: các mô hình ngôn ngữ lớn đại diện cho mô hình tính toán tiếp theo sau kỷ nguyên máy tính để bàn và vi máy tính của thập niên 1970 và 1980.

Nếu giả thuyết này đúng, chúng ta có thể mong đợi các đổi mới tương tự xuất phát từ các nền tảng công nghệ tương tự. Cuộc cách mạng giao diện người dùng đồ họa của máy tính cá nhân không đến vì lệnh văn bản là không thể—chúng hoạt động tốt cho các chuyên gia—nhưng vì các biểu diễn hình ảnh phù hợp hơn với sở thích nhận thức của con người.

Văn bản, dù tính toán sơ khai, lại phù hợp kém với sở thích nhập liệu và mô hình tiêu thụ thông tin của con người. Con người xử lý không gian và thông tin đồ họa nhanh hơn nhiều so với phân tích cú pháp văn bản. Họ tự nhiên thích nhận thông tin qua hình ảnh, sơ đồ, trình chiếu, bảng trắng, và đa phương tiện hơn là phân tích câu.

Các giao diện LLM hiện tại hoạt động qua đối thoại—cơ bản là các tương tác dòng lệnh với văn bản, tương tự như cách tính toán trong thập niên 1980. Câu hỏi còn bỏ ngỏ về ai sẽ xây dựng lớp đồ họa cho trí tuệ nhân tạo, nhưng các sản phẩm như Nano Banana chỉ ra câu trả lời. Điều làm nổi bật Nano Banana không chỉ là khả năng tạo hình ảnh, mà còn là sự tổng hợp tích hợp của tạo văn bản, tạo hình ảnh, và kiến thức thế giới được tích hợp xuyên suốt cấu trúc trọng số của mô hình.

Sáu bước tiến này—từ tối ưu phần thưởng có thể xác minh đến giao diện thị giác, từ phản hồi phụ thuộc con người đến các agent AI chạy cục bộ, từ chuyên môn đặc thù đến lập trình dễ tiếp cận—tiết lộ một ngành công nghiệp đang trong quá trình biến đổi mạnh mẽ. Các khung công tác đã hướng dẫn phát triển AI trong đầu những năm 2020 đã nhường chỗ cho các phương pháp hoàn toàn mới, mỗi phương pháp mở ra những khả năng tưởng chừng như không thể chỉ vài tháng trước. Như những quan sát của Andrej Karpathy nhấn mạnh, năm 2025 sẽ được ghi nhớ không phải vì tiến bộ từng bước mà là khoảnh khắc trí tuệ nhân tạo tự cách mạng lại chính nó.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.