Chỉ mất 2 tháng, Trung Quốc đă tạo ra được đối thủ đáng sợ nhất cho ChatGPT
|
Trong một bước tiến đột phá, các nhà nghiên cứu Trung Quốc đă tạo ra một đối thủ nguồn mở của ChatGPT chỉ trong ṿng 2 tháng, khiến cả thung lũng Silicon phải dè chừng. DeepSeek, pḥng thí nghiệm trí tuệ nhân tạo (AI) đứng sau sáng kiến này, đă công bố mô h́nh ngôn ngữ lớn (LLM) DeepSeek-V3 vào cuối tháng 12/2024. Mô h́nh này được xây dựng với chi phí chỉ 5,58 triệu USD, một con số cực kỳ khiêm tốn so với các đối thủ từ thung lũng Silicon, và được đào tạo trên lượng dữ liệu khổng lồ với hiệu suất ấn tượng.
DeepSeek-V3 là một mô h́nh ngôn ngữ lớn với 175 tỷ tham số, được huấn luyện trên khoảng 570GB dữ liệu văn bản từ các nguồn như sách, bài báo trực tuyến, Wikipedia và các trang web khác. Điều đáng chú ư là mô h́nh này chỉ cần 2.000 GPU của Nvidia để xử lư dữ liệu đào tạo, so với 10.000 GPU mà ChatGPT cần. Điều này cho thấy sự tối ưu hóa đáng kể trong thuật toán và hiệu quả sử dụng tài nguyên.
Không dừng lại ở đó, DeepSeek tiếp tục ra mắt mô h́nh mới hơn là DeepSeek-R1 vào ngày 20/1. Mô h́nh này được thiết kế với phương pháp "chain of thought" (chuỗi suy nghĩ), cho phép nó quay lại và đánh giá lại logic của ḿnh, giúp giải quyết các nhiệm vụ phức tạp hơn với độ chính xác cao hơn. Trong các bài kiểm tra benchmark của bên thứ ba, DeepSeek-V3 đă thể hiện khả năng tương đương với GPT-4o của OpenAI và Claude Sonnet 3.5 của Anthropic, thậm chí vượt trội hơn các mô h́nh khác như Llama 3.1 của Meta và Qwen2.5 của Alibaba trong các nhiệm vụ như giải quyết vấn đề, lập tŕnh và toán học. Đáng chú ư, DeepSeek-R1 c̣n vượt qua cả mô h́nh o1 mới nhất của ChatGPT trong nhiều bài kiểm tra tương tự.
Thành công này không chỉ nằm ở hiệu suất mà c̣n ở tính hiệu quả chi phí. DeepSeek-V3 và R1 được đào tạo với ngân sách cực thấp so với hàng chục đến hàng trăm triệu USD mà các công ty đối thủ chi ra. Hơn nữa, các nhà phát triển Trung Quốc đă phải tối ưu hóa thuật toán để bù đắp cho việc thiếu hụt sức mạnh tính toán do các hạn chế xuất khẩu chip AI từ Mỹ. Trong khi ChatGPT cần đến 10.000 GPU của Nvidia để xử lư dữ liệu đào tạo, DeepSeek chỉ cần 2.000 GPU để đạt kết quả tương đương.
Satya Nadella, CEO của Microsoft - đối tác chiến lược của OpenAI, đă nhấn mạnh tại Diễn đàn Kinh tế Thế giới ở Davos rằng: "Chúng ta cần rất, rất nghiêm túc xem xét những phát triển từ Trung Quốc."
Sức mạnh của mô h́nh nguồn mở
DeepSeek không chỉ gây ấn tượng bởi hiệu suất mà c̣n bởi tính nguồn mở của nó. Khác với ChatGPT, DeepSeek là mô h́nh "open-weight", cho phép người dùng xem và chỉnh sửa thuật toán của nó. Điều này mang lại lợi thế lớn về chi phí, với giá thành chỉ bằng 1/27 so với mô h́nh o1 của ChatGPT.
Yann LeCun, nhà khoa học AI hàng đầu của Meta, cho rằng thành công của DeepSeek không chỉ là minh chứng cho sự cạnh tranh từ Trung Quốc mà c̣n khẳng định giá trị của các mô h́nh nguồn mở. Trên Threads, ông viết: "Không phải AI của Trung Quốc đang vượt Mỹ, mà là các mô h́nh nguồn mở đang vượt lên các mô h́nh độc quyền."
LeCun nhấn mạnh rằng DeepSeek đă "hưởng lợi từ nghiên cứu mở và nguồn mở." Ông cho biết: "Họ đă đưa ra những ư tưởng mới và xây dựng dựa trên công tŕnh của người khác. V́ công việc của họ được công bố và nguồn mở, mọi người đều có thể hưởng lợi. Đó chính là sức mạnh của nghiên cứu mở và nguồn mở."
Tương lai của AI nguồn mở
Việc DeepSeek ra mắt R1 đă gây chấn động thung lũng Silicon và trở thành chủ đề nóng trong tuần lễ Diễn đàn Kinh tế Thế giới. Mark Zuckerberg, CEO của Meta, cũng tuyên bố sẽ chi hơn 60 tỷ USD vào năm 2025 để tập trung phát triển AI, đồng thời ủng hộ mạnh mẽ các mô h́nh nguồn mở. Ông chia sẻ: "Một phần mục tiêu của tôi trong 10-15 năm tới là xây dựng nền tảng mở và để các nền tảng mở chiến thắng. Tôi tin điều đó sẽ dẫn đến một ngành công nghệ sôi động hơn."
Tuy nhiên, vẫn có những ư kiến ủng hộ mô h́nh độc quyền, cho rằng chúng an toàn hơn v́ mă nguồn được giữ kín. Sam Altman, CEO của OpenAI, từng chia sẻ trên Reddit rằng cách tiếp cận độc quyền giúp công ty ông "dễ dàng đạt ngưỡng an toàn hơn," nhưng ông cũng hy vọng sẽ mở nhiều mă nguồn hơn trong tương lai.
Thành công của DeepSeek không chỉ là câu chuyện về sự cạnh tranh giữa các quốc gia mà c̣n là minh chứng cho sức mạnh của cộng đồng nguồn mở. Trong tương lai, sự phát triển của AI sẽ phụ thuộc nhiều vào việc cân bằng giữa tính mở và tính bảo mật, cũng như khả năng ứng dụng thực tế của các mô h́nh này.
|
|
R10 Vô Địch Thiên Hạ
|
Release: 01-27-2025
Reputation: 17545
|
|
|
Last Update: None
|
Rating: None
|