Kiếm 650 triệu USD/ ngày vẫn chưa đủ: Nvidia đang âm thầm chuẩn bị cho một cuộc “đổi ngôi” lịch sử

| Công nghệ

Giữa lúc cả thế giới ngỡ ngàng trước những con số lợi nhuận “khủng”, Nvidia lại bất ngờ tung ra quân bài chiến lược mới.

Nvidia kiếm 650 triệu USD mỗi ngày: Cuộc cách mạng từ GPU sang CPU năm 2026 - Ảnh 1.


Theo nền tảng TMTPost, với mức lợi nhuận ròng 650 triệu USD mỗi ngày, Nvidia đang ở đỉnh cao phong độ.

Tuy nhiên, khi thị trường đã quá quen với những kỷ lục “vượt kỳ vọng”, gã khổng lồ xanh Nvidia đang ráo riết định nghĩa lại mình bằng một hệ giá trị mới: Từ độc tôn GPU sang chiếm lĩnh CPU, từ huấn luyện mô hình sang bùng nổ suy luận và Agent.

Mới đây, Nvidia đã công bố báo cáo tài chính quý I năm tài chính 2026 với những con số khiến giới tài chính choáng váng.

Doanh thu đạt 81,6 tỷ USD (tăng 85% so với cùng kỳ), lợi nhuận ròng GAAP chạm mốc 58,3 tỷ USD (tăng 211% so với cùng kì). Với biên lợi nhuận gộp ổn định ở mức 74,9%, trung bình mỗi giờ Nvidia kiếm được khoảng 27 triệu USD.

CEO Jensen Huang khẳng định: “Việc xây dựng các nhà máy AI đang tăng tốc với tốc độ đáng kinh ngạc, đây là đợt mở rộng cơ sở hạ tầng lớn nhất trong lịch sử nhân loại”.

Tuy nhiên, phản ứng của thị trường cho thấy, đối với gã khổng lồ AI toàn cầu này, sự tăng trưởng mạnh mẽ không còn tự động đồng nghĩa với việc giá cổ phiếu sẽ tăng.

Song song với đó, thị trường cũng bắt đầu đặt ra câu hỏi lớn, đó là: Trần tăng trưởng của Nvidia rốt cuộc nằm ở đâu? Gã khổng lồ vốn đã chiếm hơn 90% thị phần năng lực tính toán AI này liệu còn có thể tìm thấy không gian tăng trưởng mới hay không?

Cuộc dịch chuyển lịch sử của Phố Wall: Từ GPU đến CPU và Agent

Trong hai năm qua, câu chuyện của AI luôn xoay quanh GPU và cuộc đua vũ trang về năng lực huấn luyện. Nhưng bước sang năm 2026, dòng vốn đầu tư đang chuyển dịch mạnh mẽ.

Lợi tức từ huấn luyện thuần túy đã chạm trần, ngành công nghiệp chính thức bước vào “hiệp hai” với ba trụ cột mới: Định giá lại giá trị CPU, bùng nổ suy luận (Inference) và triển khai AI Agent quy mô lớn.

Theo ông Frank Lee từ HSBC, chi tiêu vốn AI của các hãng đám mây (cloud) đang chảy về các lĩnh vực rộng hơn như bộ nhớ, mạng và CPU máy chủ.

Nvidia không đứng ngoài cuộc chạy đua này, Giám đốc tài chính Colette Kress tiết lộ rằng, dòng CPU Vera đã mở ra thị trường tiềm năng trị giá 200 tỷ USD, với doanh thu dự kiến đạt 20 tỷ USD ngay trong năm nay.

Nvidia kiếm 650 triệu USD mỗi ngày: Cuộc cách mạng từ GPU sang CPU năm 2026 - Ảnh 2.


Xét về mặt kỹ thuật, CPU sở hữu ba lợi thế mà GPU không thể thay thế trong giai đoạn này:

Thứ nhất, xử lý logic phức tạp: Các AI Agent cần thực hiện các phán đoán có điều kiện và điều phối vòng lặp, vốn là thế mạnh truyền thống của CPU thay vì kiến trúc tính toán song song của GPU.

Thứ hai, điều phối hệ thống: CPU đóng vai trò hạt nhân trung tâm để kết nối đa mô hình, gọi công cụ bên ngoài và đọc ghi dữ liệu khổng lồ.

Thứ ba, phản hồi độ trễ thấp: Trong giao dịch tài chính hay tự động lái, kiến trúc bộ nhớ đệm (cache) của CPU đảm bảo phản hồi tính bằng mili giây.

Ngân hàng đầu tư đa quốc gia Morgan Stanley đã dự báo đến năm 2030, thị trường CPU máy chủ toàn cầu sẽ vượt ngưỡng 100 tỷ USD, trở thành phân khúc tăng trưởng nhanh nhất trong đường đua năng lực tính toán AI.

Nếu việc huấn luyện (training) là giai đoạn “đốt tiền” để tạo ra trí tuệ, thì suy luận (inference) là lúc AI thực sự làm việc để tạo ra tiền. Khi công nghệ mô hình lớn dần chín muồi, nhu cầu suy luận đã tăng trưởng theo cấp số nhân.

Công ty nghiên cứu thị trường IDC dự báo đến năm 2030, thế giới sẽ có hơn 2,2 tỷ AI Agent hoạt động, kéo theo lượng tiêu thụ Token tăng vọt 300 triệu lần so với năm 2025.

Hiện nay, chi phí cho khâu suy luận đã chiếm hơn 70% tổng chi tiêu AI của doanh nghiệp. Đồng thời, logic cạnh tranh cũng đã thay đổi, đó là không phải ai có mô hình lớn nhất, mà là ai hoàn thành suy luận với chi phí thấp nhất và hiệu quả cao nhất sẽ thắng.

Mô hình kinh doanh cũng đang lột xác, từ việc cho thuê năng lực tính toán đơn thuần, thị trường đã chuyển sang tính phí theo lượng tiêu thụ Token và các gói đăng ký (subscription) cho “nhân viên số”.

Năm 2026 chính thức được coi là “Năm đầu tiên của thương mại hóa AI Agent”, nơi AI thoát ly khỏi phòng thí nghiệm để trở thành các Agent tự chủ trong doanh nghiệp.

Trong khi đó, Tập đoàn tài chính Goldman Sachs dự báo trong 2 năm tới, hơn một nửa số doanh nghiệp Mỹ sẽ sử dụng AI Agent như một tiêu chuẩn vận hành.

Cơ sở hạ tầng của Kỷ nguyên triệu tỷ Token

Để duy trì vị thế, Nvidia đang đặt cược vào kiến trúc thế hệ tiếp theo mang tên “Vera Rubin”, dự kiến sản xuất hàng loạt vào nửa cuối năm 2026.

Đây không chỉ là một con chip, mà là một nền tảng siêu cấp nhắm tới thị trường “triệu tỷ Token”.

Nền tảng Vera Rubin bao gồm 7 loại chip thành phần, nổi bật là Rubin GPU với năng lực suy luận mạnh gấp 5 lần kiến trúc Blackwell hiện tại.

Nvidia kiếm 650 triệu USD mỗi ngày: Cuộc cách mạng từ GPU sang CPU năm 2026 - Ảnh 3.


Đặc biệt, nó giúp giảm chi phí suy luận trên mỗi Token xuống chỉ còn 1/10, biến AI trở thành một loại tiện ích phổ quát như điện và nước.

Về thông số kỹ thuật, Vera Rubin sử dụng công nghệ đóng gói tiên tiến của TSMC, tích hợp 8 lõi tính toán và bộ nhớ HBM3e với băng thông vượt ngưỡng 2TB/s (tăng 25% so với H100). Chip này cũng tối ưu hóa riêng cho cơ chế Attention của mô hình Transformer, đạt đỉnh 512 TFLOPS (FP8) nhưng vẫn duy trì công suất dưới 380W, đáp ứng tiêu chuẩn khắt khe về năng lượng của các trung tâm dữ liệu xanh.

Tầm nhìn xa nhất của Nvidia không dừng lại ở thế giới số mà là AI vật lý (Physical AI), nơi hàng tỷ robot và hệ thống tự hành vận hành trong đời thực.

Trong báo cáo tài chính mới nhất, lần đầu tiên Nvidia công bố độc lập phân khúc “Tính toán biên”(Edge Computing), minh chứng cho việc AI đang rời bỏ đám mây để đi vào thiết bị thực tế.

Trong lĩnh vực tự động lái, Nvidia đã tung ra mô hình mở Alpamayo 1.5 và công nghệ Omniverse NuRec, biến dữ liệu thử nghiệm tĩnh thành các “kịch bản sống” có thể tương tác.

Đồng thời, Nvidia cũng đang bắt tay với các ông lớn như BYD, Geely, Nissan và Uber để triển khai đội xe tự hành dựa trên nền tảng DRIVE Hyperion và hệ điều hành an toàn Halos OS.

Đối với trí tuệ hiện thân (Embodied AI), Nvidia giới thiệu mô hình Isaac GR00T N với kiến trúc “Tư duy nhanh + Tư duy chậm”.

Hệ thống này cho phép robot vừa có thể suy luận cấp cao (tư duy chậm - hiểu lệnh lắp ráp linh kiện), vừa có thể điều khiển chuyển động chính xác (tư duy nhanh - gắp và ghép nối).

Nền tảng IGX Thor cũng chính thức ra mắt, giúp các nhà phát triển đưa AI vật lý trực tiếp xuống các thiết bị đầu cuối với độ tin cậy và an toàn tuyệt đối.

Như vậy, việc Nvidia kiếm được 650 triệu USD mỗi ngày là một con số ấn tượng, nhưng nếu soi chiếu dưới lăng kính của cuộc cách mạng AI, đó có lẽ chỉ là “khúc dạo đầu”.

Sự dịch chuyển từ GPU sang kiến trúc tổng thể CPU kết hợp GPU, từ huấn luyện sang suy luận quy mô lớn, và từ thế giới ảo sang thế giới vật lý đang mở ra một thị trường nghìn tỷ USD chắc chắn hơn bao giờ hết.

Nền tảng TMTPost khẳng định, thay vì hoài nghi về mức định giá cao ngất ngưởng của Nvidia, giới đầu tư nên nhìn vào cách hãng đang âm thầm xây dựng “nhà máy sản xuất Token” cho toàn nhân loại.

Có lẽ, cánh cửa vào hiệp hai của cuộc đua AI đã mở, và Nvidia, một lần nữa, lại là người cầm chìa khóa.

*Theo TMTPost

Băng Băng

Từ khóa:  AI
Cùng chuyên mục
XEM