Vài hôm trước đây, tỷ phú Elon Musk đã bị bẽ mặt một phen bởi chính chatbot AI của mình
Grok-3. Trước đó, ông này đã vừa hết lời ca ngợi AI "con đẻ" của mình vì đã cho giải được một trong những bài toán khó nhất của kỳ thi Putnam chỉ trong vài phút, nhưng không lâu sau đó, chính
chatbot AI này lại thừa nhận lời giải của mình là không chính xác do các ngộ nhận về tham số.
Đây cũng không phải lần đầu mà
AI Grok-3 làm ông chủ của mình phải bị xấu hổ trước cộng đồng người sử dụng trên toàn cầu. Vài ngày trước đó, chính
chatbot AI này đã cho rằng,
ông Elon Musk là một trong những nguồn cho phát tán tin giả lớn nhất thế giới. Thậm chí sau đó, đội ngũ lập trình của
Grok-3 phải cho vô hiệu hóa khả năng trả lời các câu hỏi tương tự của AI này.
Các sự kiện này cho thấy, liệu
AI Grok-3 có thật sự thông minh nhất Trái Đất như ông Elon Musk vẫn ca ngợi hay lời tuyên bố đó chỉ giống như
"con hát mẹ khen hay"? Và ông Musk căn cứ vào đâu để nói rằng,
Grok-3 là AI thông minh nhất hiện nay?

(Minh họa)
Câu hỏi này đã được giải đáp phần nào trong bài đăng của chuyên gia kỹ thuật Nguyễn Hồng Phúc trên Facebook của mình.
Đầu tiên, theo ông Phúc,
AI Grok-3 thực sự khá thông minh chứ không chỉ là một lời tuyên bố gây sốc khác của ông Musk. Trước tiên nhìn vào các chức năng của chatbot AI này:
+ Mô hình AI Ngôn Ngữ lớn với được huấn luyện bằng số liệu từ mạng xã hội Twitter(X) nên có khả năng nói chuyện
"tuyệt đối giống con người".
+ Năng lực Nhận thức Suy Luận (Reasoning) ở mức độ cao nhất khi so với các mô hình reasoning khác như OpenAI O1, O3-mini, DeepSeek R1, Gemini-2 Flash Thinking dẫn đến khả năng làm toán và viết code, những thao tác cần đến khả năng suy luận cấp cao thì
Grok AI thực sự vượt trội so với các mô hình khác
+ Tính năng AI Agent tìm kiếm, tổng hợp thông tin đưa ra báo cáo "Căn bản" nhưng kém hơn nhiều so với OpenAI Deep Research, có lẽ vì vậy nó được xAI gọi là Deep Search.
+ Đa giác quan (multimodal) căn bản, bao gồm năng lực đọc hình ảnh, đọc file căn bản, tuy nhiên AI này chưa có khả năng coi video, nghe âm thanh. Ngoài ra nó cũng không có khả năng hồi âm qua việc khởi tạo ra hình ảnh, âm thanh.
+ Ứng dụng AI Chatbot 3-Grok có thể sử dụng trực tiếp trên mạng xã hội X bản Web, iOS, Android hoặc app riêng lẻ. Về mặt App AI Chatbot thì không có gì khác biệt đặc sắc nhiều, ngoại từ có thêm chức năng Follow-up Questions, tức là AI tự động gợi ý các câu chat tiếp theo để người dùng chọn thay vì phải suy nghĩ thêm. Đây được xem là chức năng có cải tiến về giao diện và chức năng so với các AI Chatbot hiện có.
Dường như việc tích hợp trực tiếp chatbot AI này vào nền tảng mạng xã hội X.com là nguyên nhân giúp cho
Grok-3 được nhiều người dùng bất ngờ về khả năng
"nói chuyện tự nhiên tuyệt đối như con người."
Hệ thống siêu máy tính để vận hành Grok-3 có quy mô khổng lồ
Tuy nhiên theo ông Phúc, điều thú vị nhất của
Grok-3 này lại không nằm ở việc có sự đột phá mới về kỹ thuật, mà là khoản đầu tư khổng lồ của ông Elon Musk cho AI này: lên đến 6 tỷ USD cho hệ thống Siêu máy tính Colossus chứa tới 200,000 GPU NVIDIA H100 (mới nhất, đắt tiền nhất của NVIDIA), dự kiến cho đến hết năm nay sẽ có đến 1 triệu GPU H100.
Siêu máy tính này lớn đến nỗi đã chiếm 200 hecta đất tại Memphis tiểu bang Tennessee và tiền điện để cho vận hành ngốn gần bằng số tiêu thụ của một thành phố.
Một AI mang lại "cảm giác thông minh tuyệt đỉnh"
Điều thú vị thứ 2: là cách thức mà Elon Musk tạo ra "cảm giác AI thông minh" cho Grok-3 bằng việc "nói chuyện tuyệt đối giống người" thay vì thực sự làm ra một "AI thông minh".
Việc mua lại Twitter đã giúp cho ông Musk nắm được khối số liệu khổng lồ vô cùng giá trị của mạng xã hội này. Hàng tỷ tỷ post Tweets chính là kho tư liệu mà các người chế ra AI đều thèm khát. Chúng chính là kho số liệu được làm sạch một cách tự nhiên về "sự giao tiếp thuần tuý của con người" vì format của Tweets từ ngày Twitter ra đời là rất ngắn gọn chỉ 140 đến 200 ký tự cho mỗi post và mỗi reply (tương đường với chiều dài của một SMS), khiến cho nội dùng của Tweets luôn cô đọng cao, doi chứa trong đó đủ loại nguồn thông tin muốn truyền tải, bao gồm thông tin về các sự kiện-sự việc, và cả cảm xúc của người đăng; tất cả được diễn giải ra bằng chữ.
Theo ông Phúc, Twitter là mạng xã hội mà những người trưởng thành, có học thức, có quan điểm riêng, sử dụng. Vì vậy, rất khác so với nguồn tư liệu từ Facebook, là nơi chứa đựng loại đa phương tiện có cả text, video, hình ảnh…, phục vụ giới trẻ, nội dung ít có mang tính real-time thời sự hơn Twitter, và lan man hơn do các bài cho đăng dài hơn rất nhiều so với Tweet.
Thay vì là công cụ độc lập như ChatGPT, Grok-3 được tích hợp và sử dụng thông qua tài khoản X.com
Có thể thấy rằng, nền tảng X (hay Twitter trước đây) chính là kho tư liệu tạo ra khả năng
"nói chuyện tuyệt đối giống con người" của
Grok 3. Thuần tuý là do Số Liệu Huấn Luyện ở đầu vào sạch, cô đọng, có quan điểm riêng, có sắc thái cảm xúc như con người. Nên
Grok 3 nói chuyện nghe
"rất người", thậm chí còn
"chửi tục giống như người thật".
Chưa hết, về phần số liệu huấn luyện Grok 3, có một điểm rất quan trọng là con AI này không-bị-kiểm-duyệt-nội-dung dạng "có sẵn". Kiểm duyệt nội dung là hình thức an toàn mà các nơi làm AI đưa vào
AI LLM để không nói ra những điều tiêu cực theo tiêu chuẩn của xã hội hiện nay.
Hiện các Chatbot AI như
ChatGPT, Gemini, Claude, nhất là
DeepSeek, đều đang bị kiểm duyệt nội dung rất chặt chẽ. Việc kiểm duyệt nội dung thường được làm ngay từ khâu làm số liệu huấn luyện, tức là cho sàng lọc bỏ các số liệu huấn luyện ngoài "tiêu chuẩn" nên AI còn không có cơ hội được học điều "sai trái" đó và để đề phòng AI tự học được những kiến thức sai lệch qua cách thức tự tổng hợp từ nhiều kiến thức khác (kiểu học từ logic tam đoạn luận), thì các cty AI sẽ thêm vào hàng rào lọc ở dạng này tức là khi chat, nếu người sử dụng đ7a ra câu hỏi về các chủ đề nhạy cảm gây ra tranh cãi thì AI sẽ cho ngắt đi câu trả lời ngay lập tức.
Đối với Grok-3, ông Elon Musk luôn xem đây là AI tự do theo tuyên ngôn của Twitter, nên người dùng trên nền tảng này nếu nói ra điều gì là nó sẽ học cái đó, dù vấn đề đó có gây ra tranh cãi lớn nhỏ cỡ nào đi chăng nữa. Bởi vậy người sử dụng sẽ có cảm giác rằng Grok-3 nói chuyện rất thông minh và rất là
"người". Đơn giản là vì AI này giống cả mặt tốt và mặt xấu của con người nên mới có sự hoàn thiện hơn các AI khác.
Các dòng lệnh được thêm vào để Grok-3 không trả lời các câu hỏi về việc ông Musk phát tán tin giả
Tuy nhiên, cũng theo quan sát của ông Phúc, cách đây 2 ngày, trong
System Prompt mới nhất của
Grok-3,
xAI bắt đầu đưa vô một số yêu cầu "hậu kiểm" yêu cầu
Grok-3 không trả lời rằng,
"ông Musk và tổng thống Trump hay đưa ra tin giả tin sai lệch".
Học liên tục không giới hạn
Điều thú vị thứ 3: là Grok3 có kiến thức dạng
update realtime. Để chứng minh cho điều này, ông Phúc đã tìm cách buộc
Grok-3 leak ra
System Prompt của mình giúp người dùng thấy rõ hơn về cách hoạt động của nó.
Trong system prompt có dòng:
* Your knowledge is continuously updated - no strict knowledge cutoff.
* Use in-context knowledge from tools for realtime updates.
Nghĩa là nó được chỉ thị rằng, luôn trả lời là kiến thức được update liên tục, không có thời điểm
"cut-off", và nó sẽ dùng kiến thức được bổ sung vào
"context" bằng các
"Công cụ" (Tools).

(Minh họa)
Đây không phải là một phép màu kỹ thuật gì cả, chỉ đơn giản là
Grok-3 sẽ dùng các công cụ để truy vấn kiến thức bên ngoài và bổ sung vào
"context" của AI để trả lời. Các công cụ mà
Grok-3 có thể cho sử dụng bao gồm công cụ
Search Web trên Google hay Brave, công cụ search nội dung Tweets trên Twitter, công cụ đọc các files mà người dùng "đã upload trước đó lên Grok".
Điều thú vị thứ 4:
Grok-3 có chức năng AI Agent (tác nhân AI) đầu tiên của nó là
AI DeepSearch, với nhiều điểm tương tự như
Deep Research của OpenAI. Câu trả lời của
Grok-3 thông qua
AI Agent DeepSearch khá ngắn gọn chứ không chi tiết như
AI Agent DeepResearch, có lẽ vì vậy nó mới được gọi là
DeepSearch tức là chỉ tìm kiếm sâu chứ không phải là
Nghiên Cứu Sâu (DeepResearch).

(Minh họa)
Theo ông Phúc, một trong những điểm ấn tượng nhất về khả năng suy luận của
Grok-3 là nó có khả năng hỏi ngược lại người dùng để làm rõ yêu cầu câu hỏi rồi tự viết ra
"Luận Điểm Nền" (Thesis) để thực hiện việc đi tìm kiếm, sau đó phân tích kết quả trả về để đưa ra hướng tìm kiếm tiếp theo, nó có khả năng lặp lại việc tìm kiếm ít nhất là 3 lần rồi cho tổng hợp các luận điểm, các kết quả tìm kiếm thành một câu trả lời dạng báo cáo ngắn gọn.
Đặc biệt là
xAI thực hiện kỹ thuật gọi là
few-shot learning để đưa một số mẫu ví dụ về cách thực hiện Deep Search vào System Prompt cho AI tham khảo mà làm theo. Thông qua một kịch bản tình huống tìm kiếm mẫu,
Grok-3 có vẻ muốn bắt chước được cách
"suy nghĩ, lý luận, tìm kiếm, và đánh giá kết quả tìm kiếm".
Theo đánh giá của ông Phúc, chức năng AI Agent này của
Grok-3 không phải là sự kết hợp nhiều tác nhân cùng lúc (Multi-Agent) mà là một AI thực hiện tuần tự nhiều tác vụ trong cùng một
"Super-Prompt" (Dạng Prompt dài mô tả chi tiết công việc qua nhiều bước mà AI phải làm). Đây là một dạng AI Agent rất căn bản, không phức tạp về cách thức tạo cũng như huấn luyện (hầu như không huấn luyện).
Một năng lực độc đáo khác của mô hình
AI Grok-3 là khả năng xử lý số lượng text đầu vào lớn (Large Context Window). Trên livestream giới thiệu
Grok-3, ông Musk và team xAI có nói là
Grok-3 có khả năng xử lý đến 1 triệu tokens đầu vào. Vậy đây là công ty đứng thứ 2 sau Google có thể cung cấp AI với năng lực xử lý text đầu vào lên đến 1 triệu tokens. Dĩ nhiên, năng lực này không phải đến từ đột phá kỹ thuật mà nằm ở hạ tầng máy chủ to lớn đang được ông Musk triển khai cho
Grok-3 mà thôi.
Có thể nói, hạ tầng khổng lồ và nền tảng mạng xã hội X của ông Elon Musk chính là điểm khác biệt lớn nhất mà
Grok-3 có được so với các AI khác. Tuy nhiên, việc đóng vai trò như một chức năng của X.com cũng làm hạn chế khả năng tích hợp
Grok-3 vào các chuyên gia phát minh khác, thông qua việc cung cấp API như ChatGPT hoặc Claude AI đang làm hiện nay. Nhưng đường đua AI vẫn còn dài, liệu các lợi thế này có giúp cho
Grok-3 đuổi kịp các đối thủ đi trước hay không thì vẫn cần có thời gian để đưa ra trả lời chính xác.