Claude Opus 4.6 đã cho quét gần 6,000 tập tin mã nguồn và tìm ra hàng loạt lỗi về bảo mật, cho thấy AI đang trở thành phương tiện mới trong các nghiên cứu về an ninh phần mềm.
Anthropicvừa công bố ra cho biết, họ đã phát hiện ra 22 lỗ hổng bảo mật mới trong trình duyệt Firefox thông qua một dự án hợp tác nghiên cứu với Mozilla. Đáng chú ý hơn, toàn bộ các lỗ hổng này được tìm thấy nhờ qua mô hình
AI Claude Opus 4.6 chỉ trong khoảng hai tuần cho thử nghiệm.
Theo thông tin từ
Anthropic, trong tổng số 22 lỗ hổng được phát hiện ra, có đến 14 lỗi được đánh giá ở mức nghiêm trọng cao, 7 lỗi ở mức trung bình và 1 lỗi có mức độ thấp. Các vấn đề này đã được cho khắc phục trong phiên bản Firefox 148, được phát hành ra vào cuối tháng trước.

Quá trình phát hiện ra các lỗi này đã được thực hiện trong tháng 1/2026.
Anthropic cho biết số lượng lỗi nghiêm trọng mà
Claude Opus 4.6 đã khám phá chiếm gần một phần năm tổng số lỗ hổng nghiêm trọng được vá trong Firefox trong suốt năm 2025.
Một ví dụ đáng chú ý là lỗi
"use-after-free" trong thành phần JavaScript của trình duyệt. Theo
Anthropic, mô hình AI chỉ bỏ ra khoảng 20 phút để phát hiện dấu hiệu của lỗi này trong quá trình cho phân tích mã nguồn. Sau đó, các chuyên gia nghiên cứu bảo mật của hãng đã xác nhận lỗi trong môi trường ảo nhằm loại bỏ ra khả năng báo động sai lệch.
Trong suốt quá trình nghiên cứu, hệ thống AI đã cho quét gần 6.000 file C++ trong mã nguồn Firefox và gửi đi tổng cộng 112 báo cáo về lỗi khác nhau đến Mozilla. Trong số đó có những lỗ hổng nghiêm trọng và trung bình đã được cho công bố. Phần lớn các lỗi đã được vá trong Firefox 148, trong khi số còn lại dự kiến sẽ được cho sửa trong các bản cập nhật tiếp theo.
Anthropic cũng tiến hành một cuộc thử nghiệm khác khi cung cấp cho mô hình Claude toàn bộ danh sách các lỗ hổng đã được báo cáo cho Mozilla, đồng thời yêu cầu AI thử chế ra mã khai thác thực tế cho các lỗi này.
Kết quả cho thấy quá trình này gặp khó khăn hơn đáng kể so với việc tìm ra lỗ hổng. Sau hàng trăm lần thử nghiệm và tiêu tốn khoảng 4,000 USD tiền credit API,
Claude Opus 4.6 chỉ có thể biến lỗi bảo mật thành mã khai thác chỉ trong 2 trường hợp.
Theo
Anthropic, kết quả này phản ảnh cho thấy có hai yếu tố quan trọng. Thứ nhất, việc tìm kiếm lỗ hổng sẽ có chi phí thấp hơn đáng kể so với việc chế ra mã khai thác. Thứ hai, mô hình AI hiện tại có khả năng phát hiện vấn đề tốt hơn nhiều so với khả năng khai thác chúng.
Tuy vậy, công ty cũng cho rằng việc AI có thể tự động tạo ra một số mã khai thác, dù còn ở mức đơn giản, vẫn là một tín hiệu đáng chú ý đối với hệ thống bảo mật.
Anthropic cho biết các mã khai thác này chỉ hoạt động trong môi trường thử nghiệm trong nội bộ, nơi mà một số cơ chế bảo vệ như sandbox đã được loại bỏ ra để phục vụ cho cuộc nghiên cứu.
Một thành phần quan trọng trong quá trình thử nghiệm là hệ thống
"task verifier". Ứng dụng này có nhiệm vụ xác nhận xem mã khai thác có thực sự hoạt động hay không, từ đó cung cấp hồi âm theo thời gian thực để cho AI tiếp tục điều chỉnh và cải thiện kết quả.
Trong số các lỗi được AI khai thác thành công có CVE-2026-2796 với điểm CVSS lên đến 9.8. Lỗ hổng này được mô tả là lỗi biên dịch sai trong cơ chế
"just-in-time" của thành phần JavaScript WebAssembly.
Thông tin trên được công bố chỉ vài tuần sau khi Anthropic giới thiệu
Claude Code Security trong bản thử nghiệm nghiên cứu có giới hạn. Ứng dụng này được thiết kế như một tác nhân AI có khả năng hỗ trợ sửa lỗi bảo mật trong mã nguồn.
Anthropic cũng cho biết, các bản vá do AI tạo ra vẫn cần được kiểm tra cẩn thận trước khi cho hợp nhất vào mã nguồn chính. Tuy nhiên, hệ thống kiểm chứng nhiệm vụ giúp tăng mức độ tin cậy cho rằng bản vá có thể khắc phục lỗ hổng mà vẫn duy trì hoạt động bình thường của chương trình.
Trong thông báo phối hợp với
Anthropic, Mozilla cho biết phương pháp phân tích có sự hỗ trợ của AI cũng đã phát hiện thêm 90 lỗi khác trong mã nguồn Firefox, phần lớn trong số đó đã được cho chỉnh sửa lại.
Các lỗi này bao gồm những lỗi
"kiểm tra assertion" tương tự các vấn đề thường được phát hiện bằng kỹ thuật
"fuzzing", cùng một số loại lỗi logic mà các ứng dụng
fuzzing chính thức không thể phát hiện ra.
Theo Mozilla, quy mô của các phát hiện này cho thấy sức mạnh của việc kết hợp giữa kỹ thuật phần mềm nghiêm ngặt và các ứng dụng phân tích mới. Hãng đánh giá việc phân tích mã nguồn quy mô lớn với sự hỗ trợ của AI sẽ trở thành một phương tiện quan trọng trong bộ ứng dụng của các kỹ sư bảo mật.