Rời Mỹ về nước, Nguyễn Hoàng Quân cùng các cộng sự tại VILM, phát triển hệ thống trí tuệ nhân tạo (AI) miễn phí cho người Việt sử dụng trong các lĩnh vực chăm sóc khách hàng với hơn trăm ngh́n lượt tải mỗi tháng.
Tháng 6/2023, Nguyễn Hoàng Quân, 25 tuổi, cùng các cộng sự Phạm Nhựt Huy, 23 tuổi, kỹ sư trí tuệ nhân tạo tại ZaloAI và Đào Minh Dũng, 24 tuổi, nghiên cứu sinh tại University of Cork, Ireland, đồng sáng lập tổ chức phi lợi nhuận VILM, với mong muốn giúp người Việt được trải nghiệm công nghệ AI tiên tiến nhất một cách tối ưu.
Sau gần 6 tháng nghiên cứu và ứng dụng, nhóm phát triển thành công ba mô h́nh AI miễn phí gồm OpenHermes, VinaLlama và Vistral. Đây là các nghiên cứu nền để phát triển hệ thống AI có thể hiểu và hành động theo ư người dùng (Large Action Model - Mô h́nh hành động lớn). Các mô h́nh này để ứng dụng trong các lĩnh vực công nghệ như sử dụng trong điều khiển máy móc, robot giúp hỗ trợ người khuyết tật tốt hơn mà không cần người chăm sóc, hoặc giúp lập tŕnh viên chỉnh sửa lỗi, trợ lư ảo chăm sóc khách hàng hoặc hỏi đáp miễn phí.

OpenHermes đạt 85.000 lượt tải mỗi tháng, đạt top 10 các mô h́nh ngôn ngữ được tải nhiều nhất trên HuggingFace (trang chia sẻ mô h́nh AI lớn nhất thế giới). Ảnh chụp màn h́nh
Mô h́nh OpenHermes là mô h́nh ngôn ngữ lớn hỗ trợ tiếng Anh giống ChatGPT, song có điểm số vượt trội. Chúng cho phép người dùng tải mô h́nh về máy tính cá nhân sử dụng mà không cần internet. Đặc biệt, lượng dữ liệu huấn luyện của OpenHermes chỉ bằng 1/100 dung lượng dữ liệu huấn luyện của ChatGPT từ OpenAI. Hiện ứng dụng này nhận được hơn 50.000 lượt tải mỗi tháng. OpenHermes-2.5 và OpenHermes-2.5-Vision đang được hơn 40 nhà khởi nghiệp tại Silicon Valley (Mỹ) sử dụng,
C̣n VinaLlama và Vistral là hai mô h́nh ngôn ngữ tập trung vào phục vụ thị trường Việt, hướng tới giúp người dùng trong nước được trải nghiệm công nghệ AI tiên tiến nhất một cách dễ dàng hơn.
Hoàng Quân từng có 7 năm học tập tại Mỹ và làm việc tại công ty OpenAI với vai tṛ kỹ sư nghiên cứu cho mô h́nh trí tuệ nhân tạo ChatGPT dù chưa tốt nghiệp đại học. Năm 2022, cậu làm kỹ sư dữ liệu cho sản phẩm Bing Chat của Microsoft và OpenAI với mức thu nhập ngh́n USD. Đến năm 2023, đứng trước làn sóng sa thải công nghệ tại Mỹ, Quân nhận thấy thị trường lao động sau khi tốt nghiệp rất ảm đạm, song nh́n được cơ hội ở Việt Nam nên cậu quyết định về nước.
Tại VILM, Quân là kỹ sư trưởng chịu trách nhiệm chính trong nghiên cứu các kỹ thuật cải tiến dữ liệu cũng như huấn luyện AI. Trong khi Nhựt Huy đảm nhiệm vai tṛ nghiên cứu kỹ thuật khi huấn luyện AI và Minh Dũng đề xuất các phương pháp mới trong nghiên cứu lư thuyết.
Quân giải thích, các mô h́nh ngôn ngữ lớn hiện nay như ChatGPT (Large Language Model) chỉ có thể cung cấp dữ liệu đầu ra là chữ, trong khi con người có rất nhiều cách để giao tiếp và thu nhận kiến thức. Đó là lư do nhóm đặt mục tiêu tạo hệ thống có thể vận hành linh hoạt giữa các loại input và output (có thể nhận và xuất các loại dữ liệu như ngôn ngữ, h́nh ảnh, video, âm thanh) khác nhau, không chỉ dừng ở mức ngôn ngữ.
Để đạt được mục tiêu tạo ra mô h́nh hành động lớn (Large Action Models), nhóm phải vượt qua hai bài toán: bảo mật và tốc độ. Các ứng dụng AI hiện tại đa số dùng dữ liệu của người dùng và gửi đến máy chủ của các công ty như OpenAI để xử lư, điều này gây ra quan ngại về bảo mật. Nhóm tập trung tạo ra các mô h́nh AI đủ nhỏ và nhanh để có thể xử lư trực tiếp trên các thiết bị di động, đồng thời phải cân đối giữa hiệu năng và tốc độ để tránh ảnh hưởng đến trải nghiệm của người dùng.
Nhóm thử nghiệm sử dụng dữ liệu được sinh ra từ AI để cho chính AI học lại, thay v́ đi theo con đường sử dụng dữ liệu từ nguồn thật. Ban đầu họ gặp khó khăn trong việc t́m nguồn lực về tính toán (máy tính để huấn luyện AI), nhưng sau đó đă thuyết phục được các công ty, pḥng lab lớn trên thế giới tài trợ.
Quân cho hay việc làm các sản phẩm này chủ yếu hỗ trợ mọi người tiếp cận các ứng dụng AI nhanh chóng và chất lượng không thua kém ChatGPT hay Bing Chat và giúp việc nghiên cứu, sáng tạo các mô h́nh AI sau này có thể đơn giản hơn. Thay v́ sử dụng ChatGPT c̣n hạn chế trong ngôn ngữ và văn hóa Việt, các doanh nghiệp Việt Nam có thể tải VinaLlama bằng tiếng Việt.

Mô h́nh ngôn ngữ VinaLlama xử lư dễ dàng một bài toán trong tiếng Việt, trong ảnh là demo của sản phẩm VinaLlama trong việc giải toán. Ảnh chụp màn h́nh.
Ông Đặng Hải Lộc, Founder nền tảng xây dựng Chatbot AI Mindmaid, cho hay dưới góc độ người làm AI ứng dụng, ông nhận thấy chi phí và an toàn dữ liệu (data privacy) là hai vấn đề mà doanh nghiệp thường bận tâm nhất khi triển khai ứng dụng AI. Giải pháp thỏa đáng nhất cho bài toán này là các mô h́nh LLM nguồn mở, có khả năng chạy trên hạ tầng của doanh nghiệp và có thể học (fine-tune) thêm dữ liệu riêng của doanh nghiệp. Do đó các mô h́nh LLM nguồn mở tiếng Việt như VinaLlama, Vistral... rất có giá trị trong việc thúc đẩy ứng dụng AI tại Việt Nam.
"Các mô h́nh nguồn mở này cũng tạo điều kiện cho nhiều lập tŕnh viên, người đam mê công nghệ có thể tiếp cận với lĩnh vực AI Engineer hơn chỉ với một chiếc macbook thay v́ phải đầu tư hạ tầng GPU (Card màn h́nh) tốn kém. Điều này cũng sẽ thúc đẩy lực lượng AI Engineer tại Việt Nam, một vai tṛ đang có nhu cầu rất cao trong thời gian tới", ông Lộc nói.
Theo Quân, người Việt có nền tảng rất tốt về lư thuyết khoa học, giỏi AI và cả ChatGPT cũng có nhân lực tham gia nghiên cứu, nhưng lại gặp khó khăn hơn trong bắt kịp nhanh chóng làn sóng công nghệ luôn thay đổi. "Điều người Việt cần là trải nghiệm trong làm sản phẩm cho người dùng cuối để thực sự hiểu được các vấn đề họ gặp phải nhằm định hướng đúng nghiên cứu của ḿnh", Quân nói về lư do nghiên cứu các mô h́nh AI miễn phí nhằm hỗ trợ người Việt làm công nghệ. Cậu cho biết đă hợp tác với nhiều nhóm quốc tế và luôn sẵn sàng hợp tác với các nhóm nghiên cứu tại Việt Nam.