Con số 50 USD khá ấn tượng, v́ việc huấn luyện các mô h́nh AI tiên tiến thường tốn hàng ngh́n đến hàng trăm ngh́n USD chi phí điện toán do yêu cầu về tài nguyên máy tính cực lớn...
Mô h́nh s1 cũng đặt ra những câu hỏi nghiêm túc về việc AI đang dần trở thành hàng hóa phổ thông (commoditization). Ảnh minh họa
Theo Techcrunch, các nhà nghiên cứu AI tại Đại học Stanford và Đại học Washington vừa công bố một nghiên cứu, tiết lộ rằng họ đă huấn luyện thành công một mô h́nh AI "lư luận" chỉ với chưa đầy 50 USD tiền điện toán đám mây.
Tuy nhiên, cần hiểu rơ số tiền
USD, đây chính là tiền điện toán đám mây, nghĩa là chi phí mà nhóm nghiên cứu đă chi trả cho dịch vụ điện toán đám mây để huấn luyện mô h́nh AI.
HUẤN LUYỆN MÔ H̀NH AI THƯỜNG TỐN HÀNG NGH̀N ĐẾN HÀNG TRĂM NGH̀N USD CHI PHÍ ĐIỆN TOÁN
Điện toán đám mây (cloud computing) là dịch vụ cho phép thuê tài nguyên máy tính (như CPU, GPU, bộ nhớ và lưu trữ) từ các nhà cung cấp như Amazon Web Services (AWS), Google Cloud, Microsoft Azure, hoặc Oracle Cloud. Trong trường hợp này, nhóm nghiên cứu chỉ tốn chưa đến 50 USD để sử dụng các tài nguyên này cho việc huấn luyện mô h́nh AI s1.
Con số 50 USD khá ấn tượng, v́ việc huấn luyện các mô h́nh AI tiên tiến thường tốn hàng ngh́n đến hàng trăm ngh́n USD chi phí điện toán do yêu cầu về tài nguyên máy tính cực lớn.
“Mô h́nh lư luận 50 USD” này có tên là s1, cho thấy hiệu suất tương đương với các mô h́nh lư luận tiên tiến như o1 của OpenAI và R1 của DeepSeek khi kiểm tra khả năng toán học và lập tŕnh. Mô h́nh s1 cùng với dữ liệu và mă nguồn để huấn luyện đă được công khai trên GitHub.
Nhóm nghiên cứu cho biết họ bắt đầu từ một mô h́nh AI có sẵn, sau đó tinh chỉnh bằng phương pháp distillation (chưng cất) — một quy tŕnh giúp trích xuất khả năng "lư luận" từ một mô h́nh AI khác thông qua việc huấn luyện dựa trên các câu trả lời của mô h́nh đó.
Cụ thể, s1 được "chưng cất" (distilled) từ một trong các mô h́nh lư luận của Google có tên Gemini 2.0 Flash Thinking Experimental. Phương pháp "chưng cất" này cũng từng được các nhà nghiên cứu tại Đại học Berkeley sử dụng để tạo ra một mô h́nh lư luận AI với chi phí khoảng 450 USD vào tháng trước.
AI ĐANG DẦN TRỞ THÀNH HÀNG HÓA PHỔ THÔNG?
Việc các nhà nghiên cứu có thể tạo ra mô h́nh AI tiên tiến mà không cần hàng triệu đô la đầu tư khiến nhiều người cảm thấy phấn khích v́ cơ hội đổi mới trong lĩnh vực AI đang được mở rộng. Tuy nhiên, mô h́nh s1 cũng đặt ra những câu hỏi nghiêm túc về việc AI đang dần trở thành hàng hóa phổ thông (commoditization).
Liệu c̣n “hàng rào bảo vệ” nào cho các công ty lớn khi chỉ với số tiền nhỏ, người ta đă có thể tạo ra mô h́nh có chất lượng tương đương mô h́nh trị giá hàng triệu đô la?
Không có ǵ ngạc nhiên khi các pḥng thí nghiệm AI lớn tỏ ra không hài ḷng. OpenAI thậm chí đă cáo buộc DeepSeek thu thập dữ liệu trái phép từ API của ḿnh để phục vụ cho việc chưng cất mô h́nh.
DeepSeek từng gây sốc v́ chi phí phát triển quá thấp so với OpenAI dù sau đó đă có những nghi vấn về mức chi phí này
Nói về s1, nhóm nghiên cứu đứng sau mô h́nh s1 đă t́m cách đơn giản nhất để đạt được hiệu suất lư luận mạnh mẽ và khả năng “test-time scaling” — tức cho phép mô h́nh AI suy nghĩ nhiều hơn trước khi đưa ra câu trả lời. Đây là một trong những đột phá của mô h́nh o1 của OpenAI, mà DeepSeek cùng nhiều pḥng thí nghiệm AI khác đă cố gắng tái tạo bằng nhiều phương pháp khác nhau.
Bài nghiên cứu về s1 cho thấy các mô h́nh lư luận có thể được "chưng cất" (distilled) chỉ với một tập dữ liệu tương đối nhỏ bằng quy tŕnh có tên supervised fine-tuning (SFT). Đây là phương pháp huấn luyện mà mô h́nh AI được hướng dẫn rơ ràng để bắt chước các hành vi nhất định dựa trên dữ liệu huấn luyện.
So với phương pháp học tăng cường quy mô lớn (reinforcement learning) mà DeepSeek sử dụng để phát triển mô h́nh R1 cạnh tranh với o1 của OpenAI, SFT thường tiết kiệm chi phí hơn.
Google hiện cho phép truy cập miễn phí vào mô h́nh Gemini 2.0 Flash Thinking Experimental thông qua nền tảng Google AI Studio, nhưng có giới hạn sử dụng mỗi ngày.
Tuy nhiên, điều khoản của Google cấm việc đảo ngược kỹ thuật (reverse-engineering) mô h́nh của họ để phát triển các dịch vụ cạnh tranh với AI của công ty. Hiện Google chưa có b́nh luận chính thức về vấn đề này.
Mô h́nh s1 được phát triển dựa trên một mô h́nh AI nhỏ gọn có sẵn từ pḥng thí nghiệm AI Qwen thuộc Alibaba. Mô h́nh này được cung cấp miễn phí để tải về.
Nhóm nghiên cứu đă tạo ra một tập dữ liệu chỉ gồm 1.000 câu hỏi được lựa chọn kỹ lưỡng, đi kèm với câu trả lời và quy tŕnh "suy nghĩ" phía sau mỗi câu trả lời từ mô h́nh Gemini 2.0 Flash Thinking Experimental của Google.
Quá tŕnh huấn luyện s1 chỉ mất chưa đầy 30 phút với 16 GPU Nvidia H100. Theo Niklas Muennighoff, một nhà nghiên cứu tại Stanford tham gia dự án, chi phí thuê máy tính cần thiết hiện chỉ khoảng 20 USD.
Một "mẹo" thú vị được nhóm nghiên cứu sử dụng để giúp s1 kiểm tra lại kết quả và kéo dài thời gian suy nghĩ là thêm từ “wait” (chờ) vào quá tŕnh lư luận. Theo bài nghiên cứu, điều này giúp mô h́nh đưa ra câu trả lời chính xác hơn.
Vào năm 2025, Meta, Google và Microsoft dự kiến sẽ đầu tư hàng trăm tỷ USD vào cơ sở hạ tầng AI, trong đó một phần được dùng để huấn luyện các mô h́nh AI thế hệ mới.
Mức đầu tư khổng lồ này vẫn được xem là cần thiết để thúc đẩy sự đổi mới trong lĩnh vực AI. Phương pháp distillation (chưng cất) đă chứng minh là cách hiệu quả và tiết kiệm để tái tạo khả năng của các mô h́nh AI hiện có. Tuy nhiên, phương pháp này không giúp tạo ra các mô h́nh AI hoàn toàn mới với hiệu suất vượt trội so với những ǵ đang có trên thị trường.