HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other News|Tin Khác > Computer News|Tin Vi Tính


Reply
 
Thread Tools
  #1  
Old  Default Các nhà nghiên cứu công bố huấn luyện thành công mô hình AI chỉ với chưa đến 50 USD
Con số 50 USD khá ấn tượng, vì việc huấn luyện các mô hình AI tiên tiến thường tốn hàng nghìn đến hàng trăm nghìn USD chi phí điện toán do yêu cầu về tài nguyên máy tính cực lớn...


Mô hình s1 cũng đặt ra những câu hỏi nghiêm túc về việc AI đang dần trở thành hàng hóa phổ thông (commoditization). Ảnh minh họa

Theo Techcrunch, các nhà nghiên cứu AI tại Đại học Stanford và Đại học Washington vừa công bố một nghiên cứu, tiết lộ rằng họ đã huấn luyện thành công một mô hình AI "lý luận" chỉ với chưa đầy 50 USD tiền điện toán đám mây.

Tuy nhiên, cần hiểu rõ số tiền
USD, đây chính là tiền điện toán đám mây, nghĩa là chi phí mà nhóm nghiên cứu đã chi trả cho dịch vụ điện toán đám mây để huấn luyện mô hình AI.

HUẤN LUYỆN MÔ HÌNH AI THƯỜNG TỐN HÀNG NGHÌN ĐẾN HÀNG TRĂM NGHÌN USD CHI PHÍ ĐIỆN TOÁN

Điện toán đám mây (cloud computing) là dịch vụ cho phép thuê tài nguyên máy tính (như CPU, GPU, bộ nhớ và lưu trữ) từ các nhà cung cấp như Amazon Web Services (AWS), Google Cloud, Microsoft Azure, hoặc Oracle Cloud. Trong trường hợp này, nhóm nghiên cứu chỉ tốn chưa đến 50 USD để sử dụng các tài nguyên này cho việc huấn luyện mô hình AI s1.

Con số 50 USD khá ấn tượng, vì việc huấn luyện các mô hình AI tiên tiến thường tốn hàng nghìn đến hàng trăm nghìn USD chi phí điện toán do yêu cầu về tài nguyên máy tính cực lớn.

“Mô hình lý luận 50 USD” này có tên là s1, cho thấy hiệu suất tương đương với các mô hình lý luận tiên tiến như o1 của OpenAI và R1 của DeepSeek khi kiểm tra khả năng toán học và lập trình. Mô hình s1 cùng với dữ liệu và mã nguồn để huấn luyện đã được công khai trên GitHub.

Nhóm nghiên cứu cho biết họ bắt đầu từ một mô hình AI có sẵn, sau đó tinh chỉnh bằng phương pháp distillation (chưng cất) — một quy trình giúp trích xuất khả năng "lý luận" từ một mô hình AI khác thông qua việc huấn luyện dựa trên các câu trả lời của mô hình đó.

Cụ thể, s1 được "chưng cất" (distilled) từ một trong các mô hình lý luận của Google có tên Gemini 2.0 Flash Thinking Experimental. Phương pháp "chưng cất" này cũng từng được các nhà nghiên cứu tại Đại học Berkeley sử dụng để tạo ra một mô hình lý luận AI với chi phí khoảng 450 USD vào tháng trước.

AI ĐANG DẦN TRỞ THÀNH HÀNG HÓA PHỔ THÔNG?

Việc các nhà nghiên cứu có thể tạo ra mô hình AI tiên tiến mà không cần hàng triệu đô la đầu tư khiến nhiều người cảm thấy phấn khích vì cơ hội đổi mới trong lĩnh vực AI đang được mở rộng. Tuy nhiên, mô hình s1 cũng đặt ra những câu hỏi nghiêm túc về việc AI đang dần trở thành hàng hóa phổ thông (commoditization).

Liệu còn “hàng rào bảo vệ” nào cho các công ty lớn khi chỉ với số tiền nhỏ, người ta đã có thể tạo ra mô hình có chất lượng tương đương mô hình trị giá hàng triệu đô la?

Không có gì ngạc nhiên khi các phòng thí nghiệm AI lớn tỏ ra không hài lòng. OpenAI thậm chí đã cáo buộc DeepSeek thu thập dữ liệu trái phép từ API của mình để phục vụ cho việc chưng cất mô hình.


DeepSeek từng gây sốc vì chi phí phát triển quá thấp so với OpenAI dù sau đó đã có những nghi vấn về mức chi phí này

Nói về s1, nhóm nghiên cứu đứng sau mô hình s1 đã tìm cách đơn giản nhất để đạt được hiệu suất lý luận mạnh mẽ và khả năng “test-time scaling” — tức cho phép mô hình AI suy nghĩ nhiều hơn trước khi đưa ra câu trả lời. Đây là một trong những đột phá của mô hình o1 của OpenAI, mà DeepSeek cùng nhiều phòng thí nghiệm AI khác đã cố gắng tái tạo bằng nhiều phương pháp khác nhau.

Bài nghiên cứu về s1 cho thấy các mô hình lý luận có thể được "chưng cất" (distilled) chỉ với một tập dữ liệu tương đối nhỏ bằng quy trình có tên supervised fine-tuning (SFT). Đây là phương pháp huấn luyện mà mô hình AI được hướng dẫn rõ ràng để bắt chước các hành vi nhất định dựa trên dữ liệu huấn luyện.

So với phương pháp học tăng cường quy mô lớn (reinforcement learning) mà DeepSeek sử dụng để phát triển mô hình R1 cạnh tranh với o1 của OpenAI, SFT thường tiết kiệm chi phí hơn.

Google hiện cho phép truy cập miễn phí vào mô hình Gemini 2.0 Flash Thinking Experimental thông qua nền tảng Google AI Studio, nhưng có giới hạn sử dụng mỗi ngày.

Tuy nhiên, điều khoản của Google cấm việc đảo ngược kỹ thuật (reverse-engineering) mô hình của họ để phát triển các dịch vụ cạnh tranh với AI của công ty. Hiện Google chưa có bình luận chính thức về vấn đề này.

Mô hình s1 được phát triển dựa trên một mô hình AI nhỏ gọn có sẵn từ phòng thí nghiệm AI Qwen thuộc Alibaba. Mô hình này được cung cấp miễn phí để tải về.

Nhóm nghiên cứu đã tạo ra một tập dữ liệu chỉ gồm 1.000 câu hỏi được lựa chọn kỹ lưỡng, đi kèm với câu trả lời và quy trình "suy nghĩ" phía sau mỗi câu trả lời từ mô hình Gemini 2.0 Flash Thinking Experimental của Google.

Quá trình huấn luyện s1 chỉ mất chưa đầy 30 phút với 16 GPU Nvidia H100. Theo Niklas Muennighoff, một nhà nghiên cứu tại Stanford tham gia dự án, chi phí thuê máy tính cần thiết hiện chỉ khoảng 20 USD.

Một "mẹo" thú vị được nhóm nghiên cứu sử dụng để giúp s1 kiểm tra lại kết quả và kéo dài thời gian suy nghĩ là thêm từ “wait” (chờ) vào quá trình lý luận. Theo bài nghiên cứu, điều này giúp mô hình đưa ra câu trả lời chính xác hơn.

Vào năm 2025, Meta, Google và Microsoft dự kiến sẽ đầu tư hàng trăm tỷ USD vào cơ sở hạ tầng AI, trong đó một phần được dùng để huấn luyện các mô hình AI thế hệ mới.

Mức đầu tư khổng lồ này vẫn được xem là cần thiết để thúc đẩy sự đổi mới trong lĩnh vực AI. Phương pháp distillation (chưng cất) đã chứng minh là cách hiệu quả và tiết kiệm để tái tạo khả năng của các mô hình AI hiện có. Tuy nhiên, phương pháp này không giúp tạo ra các mô hình AI hoàn toàn mới với hiệu suất vượt trội so với những gì đang có trên thị trường.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page



miro1510
R9 Tuyệt Đỉnh Tôn Sư
Release: 02-07-2025
Reputation: 13829


Profile:
Join Date: Oct 2014
Posts: 47,056
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	c7e29e4ca7024e5c1713.jpg
Views:	0
Size:	59.4 KB
ID:	2487298  
miro1510_is_offline
Thanks: 9
Thanked 2,092 Times in 1,931 Posts
Mentioned: 3 Post(s)
Tagged: 0 Thread(s)
Quoted: 8 Post(s)
Rep Power: 59
miro1510 Reputation Uy Tín Level 6
miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6miro1510 Reputation Uy Tín Level 6
Reply

User Tag List


Tổng thống ‘Hòa Bình’ và những biên giới đỏ lửa: Thái–Miên, Pakistan–Afghanistan và vở kịch giải thưởng cho Trump Chernobyl lại báo động đỏ: Lá chắn thép 2,1 tỷ euro bị drone đánh thủng, IAEA cảnh báo mất chức năng an toàn Paris lại đăng quang, Bangkok đông nghẹt, Viêng Chăn vẫn lặng lẽ: Bản đồ du lịch 2025 giữa kỷ lục mới và những góc bình yên
Trump Thắng Lớn Trong Cuộc Chiến ‘Bãi Nhiệm Không Cần Lý Do Vì Sao Tôi Chống Trump: Từ Nước Mắt Trong ICU Đến Chiếc Ô Đỏ MAGA Và Trò Hề ‘Giải Hòa Bình’ Từ Okinawa đến màn hình điện thoại: Trung Quốc leo thang quân sự, siết kiểm soát số và cuộc chiến bóng ma quanh Đài Loan
Cú quay đầu của lá phiếu Latino: từ ‘kỳ tích’ Trump 2024 đến khối cử tri dao động nhất nước Mỹ Cộng đồng Somali ở Minnesota đứng dậy giữa bão trục xuất Trung Quốc ăn cắp máy quang khắc bất thành – vì sao ‘đốt cháy giai đoạn’ trong ngành chip là chuyện bất khả?
Cú “cắn ghế” thần tốc ở Hà Nội: Mailisa, Doctor Magic và ván cờ phe phái Ngân sách tăng thuế của Labour và nước Anh nơi 1/3 trẻ em sống trong nghèo đói Đĩa mì Ý ở Mỹ trước bão thuế 107%: từ “xa xỉ phẩm 4 đô” đến nỗi lo mất luôn món ăn bình dân
Mùa mua sắm Mỹ thời bão giá: Macy’s, Old Navy, Walmart xoay xở, Sears hấp hối – trong khi Đài Loan bứt tốc nhờ cơn sốt AI Tịch thu 100 sổ đỏ, 300 cây vàng SJC, 400k USD, 3 tỷ đồng của Mailisa và còn nhiều nữa, siêu xe hàng tá, tiền hàng ...tấn Giáo hoàng Leo XIV kêu gọi chấm dứt lợi dụng tôn giáo cho chiến tranh trong chuyến công du Thổ Nhĩ Kỳ – Li Băng
Louvre tăng giá vé 45% với khách ngoài châu Âu: bức tranh đắt đỏ mới của “ngôi đền nghệ thuật” Paris Bão Mặt Trời đe dọa buồng lái: hơn 6.000 máy bay Airbus A320 phải sửa gấp vì nguy cơ mất kiểm soát 10 ngày ở ghế Chủ tịch Hà Nội: Nguyễn Đức Trung và bài toán nhân sự trước Đại hội 14
Nếu VinFast thua sạch ở Mỹ: Hoá đơn có thể lên tới 1,5 tỷ USD Từ Việt Minh đến Chuyên Chính Đỏ: Chiến lược che giấu và thanh trừng có chủ đích Từ Nội Chiến Mỹ đến Việt Nam: Hai cách đối xử với người lính bại trận
“Hãy công bố kết quả MRI đi!” – Tim Walz dội gáo nước lạnh vào cơn thịnh nộ Lễ Tạ Ơn của Donald Trump Từ Vệ Binh Quốc Gia đến Quân Lực Việt Nam Cộng Hòa – hành trình một đạo quân quốc gia “Người Cày Có Ruộng” – ngày vui nhất đời Tổng thống Thiệu và ký ức tem thư của một thằng bé Sài Gòn
Tiền tuyến rực lửa, bàn đàm phán nóng lên: Ukraine vạch lằn ranh đỏ trước kế hoạch hòa bình của Trump Starbucks – Target và ly socola bạc hà cứu vãn mùa Giáng sinh ảm đạm Phố thời trang tắt đèn trước Tết: Tiểu thương Hà Nội kẹt giữa gánh thuê nhà và thuế khóa

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 21:05.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.10023 seconds with 15 queries