Anthropic thả "quái vật" AI: Cả Google, Apple và Microsoft đồng loạt vào cuộc

Mai Trang | 09/04/2026 21:58 PM | Công nghệ

Ngành an ninh mạng đang chứng kiến cuộc cách mạng mới từ AI.

Anthropic, ông chủ của OpenClaw, đang triển khai các bước nhằm trang bị cho một số tập đoàn công nghệ lớn nhất thế giới những công cụ tiên tiến để phát hiện và khắc phục lỗ hổng trong cả phần cứng lẫn phần mềm.

Theo đó, công ty này đã cung cấp bản dùng thử của mô hình AI mới mang tên Mythos cho khoảng 50 tập đoàn và các tổ chức vận hành hạ tầng hàng đầu thế giới. Danh sách bao gồm các “ông lớn” như Amazon, Microsoft, Apple, Google (thuộc Alphabet) và Linux Foundation.

Động thái này diễn ra trong bối cảnh giới nghiên cứu an ninh mạng và các nhà phát triển phần mềm ngày càng lo ngại về khả năng của AI trong việc khai thác lỗ hổng bảo mật. Nhiều chuyên gia cảnh báo, các mô hình trí tuệ nhân tạo đang tiến bộ nhanh chóng đến mức có thể gây gián đoạn quy mô lớn đối với hoạt động trực tuyến nếu bị lạm dụng.

Nhưng đồng thời, các chuyên gia an ninh cũng cho rằng, các mô hình AI sẽ phát hiện ra vô số lỗi phần mềm, và nỗ lực này được kỳ vọng sẽ giúp các công ty luôn "đi trước một bước" so với tội phạm mạng và các mối đe dọa khác.

Theo các chuyên gia, AI có thể phát hiện số lượng lớn lỗi phần mềm trong thời gian ngắn, qua đó tăng tốc quá trình vá lỗi và củng cố hệ thống.

Ông Logan Graham, trưởng nhóm Frontier Red Team của Anthropic, bộ phận chuyên đánh giá rủi ro của các mô hình như Claude, cho biết, Mythos đã thể hiện năng lực thực hiện những tác vụ tiềm ẩn nguy hiểm, bao gồm tìm kiếm và khai thác lỗ hổng phần mềm. Tuy nhiên, công ty hiện chưa có kế hoạch phát hành công khai mô hình này.

“Chúng tôi cần xác định liệu có thể triển khai một cách an toàn hay không, và hiện vẫn chưa có câu trả lời chắc chắn,” ông Graham nhấn mạnh.

Trong khoảng 6 tháng trở lại đây, cùng với sự phát triển như vũ bão của các ứng dụng AI, mối lo ngại đồng thời cũng gia tăng khi AI không chỉ giỏi hơn trong việc phát hiện lỗi mà còn rút ngắn đáng kể khoảng thời gian từ lúc phát hiện đến khi lỗ hổng có thể bị khai thác.

Trước đó, nghiên cứu từ Stanford University chỉ ra rằng, AI đã gần đạt trình độ con người trong việc phát hiện và khai thác lỗi trên hệ thống thực tế. Đáng chú ý, đầu năm nay, mô hình Claude Opus 4.6 của Anthropic đã tìm ra số lượng lỗi nghiêm trọng trên trình duyệt Firefox trong vòng hai tuần, vượt tổng số lỗi mà cộng đồng toàn cầu thường báo cáo trong hai tháng.

Theo ông Graham, xét về chi phí quy đổi, Mythos hiệu quả gấp khoảng 10 lần so với các mô hình AI trước đây trong việc tìm kiếm lỗ hổng.

Dù chưa có kế hoạch thương mại hóa, Anthropic cho rằng, những mô hình khác có thể đạt năng lực tương tự trong vài năm tới. Điều này đặt ra yêu cầu cấp thiết cho ngành công nghệ: chuẩn bị cho một tương lai mà khoảng cách giữa phát hiện và khai thác lỗ hổng gần như bằng 0.

“Chúng ta cần bắt đầu ngay từ bây giờ để thích nghi với thế giới đó,” ông Graham cảnh báo.

Theo WSJ

Mai Trang

Từ khóa:  Anthropic
Cùng chuyên mục
XEM