R1 của DeepSeek: Mô hình LLM đầu tiên được đánh giá bởi các chuyên gia

R1 của DeepSeek, một start-up AI từ Trung Quốc đại lục, đã mở ra một bước đột phá mới với danh hiệu mô hình ngôn ngữ lớn (LLM) đầu tiên nhận được đánh giá chính thức từ các chuyên gia học thuật. Bài nghiên cứu được đăng tải trên Nature, nhấn mạnh thiết kế độc đáo của R1, được phát triển độc lập mà không phụ thuộc vào các ông lớn AI.

Được phát hành vào tháng 1, R1 được chế tạo để vượt qua các thử thách đòi hỏi kỹ năng suy luận – từ các bài toán phức tạp đến nhiệm vụ lập trình – đồng thời giữ chi phí ở mức thấp. Giống như việc sở hữu các tính năng hàng đầu của một chiếc điện thoại cao cấp với giá tầm trung.

Là mô hình mở, R1 có thể được tải xuống và tinh chỉnh miễn phí. Trên Hugging Face, trung tâm yêu thích của cộng đồng AI, nó đã thu về hơn 10.9 triệu lượt tải xuống.

“Đây là một tiền lệ rất đáng hoan nghênh,” Lewis Tunstall, kỹ sư học máy tại Hugging Face, chia sẻ. “Nếu chúng ta không chia sẻ quy trình này công khai, rất khó để đánh giá các rủi ro.”

Phía sau hậu trường, DeepSeek đã sử dụng vòng học tăng cường thuần túy – thưởng cho R1 vì đưa ra câu trả lời chính xác thay vì chỉ sao chép ví dụ của con người – và một kỹ thuật gọi là tối ưu hóa chính sách tương đối nhóm, nơi mô hình tự kiểm tra kết quả mà không cần mạng an toàn bổ sung.

Ngân sách? Quá trình đào tạo R1 tiêu tốn khoảng 294.000 USD – một số tiền nhỏ so với hàng chục triệu mà các phòng thí nghiệm khác tiêu tốn – cộng thêm khoảng 6 triệu USD để xây dựng mô hình nền tảng của nó.

Ngày nay, các nhà nghiên cứu trên toàn thế giới đang áp dụng chiến lược của DeepSeek để nâng cao khả năng suy luận của các LLM hiện có và khám phá các lĩnh vực mới ngoài toán học và lập trình. Theo lời Tunstall, R1 thực sự đã “khởi động một cuộc cách mạng.”

Đối với các chuyên gia trẻ, sinh viên, và bất kỳ ai tò mò về AI, câu chuyện của R1 cho thấy bạn không cần phải là một ông lớn công nghệ để tạo sự ảnh hưởng. Với các chiến lược thông minh và tinh thần mã nguồn mở, bạn cũng có thể giúp định hình tương lai của AI.