▤ Dữ liệu & Hạ tầng

Hạ tầng tính toán AI: GPU, trung tâm dữ liệu và cuộc đua compute

Tổng quan về hạ tầng tính toán cho AI: chip tăng tốc GPU, trung tâm dữ liệu, điện toán đám mây, chi phí compute toàn cầu và làn sóng đầu tư AI Factory tại Việt Nam của Viettel, FPT, CMC, VNPT.

Hạ tầng tính toán AI: GPU, trung tâm dữ liệu và cuộc đua compute

Trí tuệ nhân tạo hiện đại không chỉ là thuật toán. Đằng sau mỗi mô hình ngôn ngữ lớn hay hệ thống thị giác máy tính là một lớp hạ tầng vật lý khổng lồ: hàng nghìn chip tăng tốc, các tòa nhà trung tâm dữ liệu tiêu thụ điện tương đương một thị trấn nhỏ, cùng hệ thống làm mát và mạng tốc độ cao. Hạ tầng tính toán (compute) đã trở thành “tài nguyên chiến lược” của thời đại AI — ai kiểm soát compute, người đó kiểm soát tốc độ đổi mới.

Chip tăng tốc: trái tim của AI

Trung tâm của hạ tầng AI là các bộ tăng tốc chuyên dụng (accelerator), chủ yếu là GPU của NVIDIA. Khác với CPU truyền thống xử lý tuần tự, GPU thực hiện hàng nghìn phép tính song song — đúng với bản chất của huấn luyện mạng nơ-ron.

Thế hệ kiến trúc Blackwell (ra mắt và triển khai rộng từ 2025) là chuẩn mực hiện tại:

  • GPU B200: bộ nhớ 192 GB HBM3e, băng thông 8 TB/s, đạt tới 9.000 TFLOPS hiệu năng FP4 — gấp khoảng 4 lần thông lượng suy luận so với thế hệ H100. Mỗi GPU B200 tiêu thụ khoảng 1.000W.
  • Siêu chip GB200 (1 CPU Grace + 2 GPU B200): giá khoảng 60.000–70.000 USD/đơn vị.
  • Hệ thống DGX B200 (8 GPU): giá khoảng 515.000 USD, yêu cầu khoảng 14 kW công suất điện.

Theo CEO NVIDIA Jensen Huang, mỗi GPU B200 có giá xuất xưởng 30.000–40.000 USD; giá hiệu dụng theo hệ thống dao động 30.000–55.000 USD/GPU. Trên đám mây, giá thuê B200 tính đến giữa năm 2026 dao động rộng từ khoảng 2,99 đến hơn 27 USD/GPU-giờ tùy nhà cung cấp, hợp đồng và khu vực.

Điểm mấu chốt: chip không bao giờ đứng một mình. Một “AI Factory” hiện đại ghép hàng trăm tới hàng nghìn GPU bằng mạng nội bộ siêu tốc (NVLink, InfiniBand) để chúng hoạt động như một siêu máy tính duy nhất.

Trung tâm dữ liệu và bài toán điện – làm mát

GPU mật độ cao tạo ra thách thức vật lý chưa từng có. Một rack GB200 NVL72 có thể tiêu thụ hàng chục đến hơn một trăm kW — vượt xa mức 5–10 kW/rack của trung tâm dữ liệu truyền thống. Điều này kéo theo:

  • Làm mát bằng chất lỏng (liquid cooling) thay cho làm mát không khí, vì không khí không còn đủ khả năng tản nhiệt.
  • Nguồn điện ổn định, công suất lớn, khiến vị trí đặt trung tâm dữ liệu phụ thuộc mạnh vào nguồn điện sẵn có.
  • Chuẩn vận hành Uptime Tier III/IV để đảm bảo độ sẵn sàng cao và dự phòng.

Chính những ràng buộc này biến trung tâm dữ liệu AI thành dự án hạ tầng quốc gia, không đơn thuần là dự án công nghệ thông tin.

Điện toán đám mây và cuộc đua chi tiêu compute

Phần lớn doanh nghiệp không tự mua GPU mà thuê qua đám mây. Các “hyperscaler” (Amazon, Microsoft, Google, Meta, Oracle) đang đổ tiền vào hạ tầng với tốc độ chưa từng thấy:

  • Chi tiêu vốn (capex) của bốn ông lớn Google, Amazon, Microsoft, Meta được dự báo đạt khoảng 725 tỷ USD trong năm 2026, tăng 77% so với mức kỷ lục khoảng 410 tỷ USD của năm trước.
  • Riêng nhóm năm hyperscaler hàng đầu dự kiến chi hơn 600 tỷ USD cho hạ tầng năm 2026 (tăng 36% so với 2025), trong đó khoảng 75% (~450 tỷ USD) dành cho hạ tầng AI.
  • Để tài trợ, các hyperscaler đã huy động khoảng 108 tỷ USD nợ chỉ trong năm 2025.

Quy mô này cho thấy compute đã trở thành “vũ khí cạnh tranh” — và cũng đặt ra câu hỏi về rủi ro tài chính nếu nhu cầu AI không tăng đủ nhanh để hoàn vốn.

Hạ tầng AI tại Việt Nam: làn sóng AI Factory

Việt Nam đang chứng kiến đợt đầu tư trung tâm dữ liệu mạnh mẽ, được thúc đẩy bởi mục tiêu tự chủ công nghệ:

  • FPT AI Factory: hợp tác chiến lược với NVIDIA (công bố tháng 4/2024, vốn khoảng 200 triệu USD). Hệ thống trang bị hàng nghìn GPU H100 và H200, mỗi siêu máy chủ gồm 8 GPU H100 (bộ nhớ 80 GB, tốc độ 3,35 TB/s), bắt đầu cung cấp dịch vụ từ tháng 1/2025.
  • Viettel: Trung tâm Dữ liệu Hòa Lạc 2 đạt chuẩn Uptime Tier III, tích hợp siêu máy chủ NVIDIA H200 — được giới thiệu là trung tâm dữ liệu AI đầu tiên của một doanh nghiệp viễn thông tại khu vực châu Á – Thái Bình Dương đạt chuẩn này. Viettel hợp tác NVIDIA hướng tới tích hợp gần 800 siêu máy chủ và khoảng 6.000 card GPU.
  • CMC: đầu tư hơn 250 triệu USD xây trung tâm dữ liệu lớn “AI Heart” tại TP.HCM, vận hành hệ thống C-OpenAI trên hạ tầng CMC Cloud; đồng thời lên kế hoạch đầu tư khoảng 500 triệu USD cho trung tâm dữ liệu tại Việt Nam, Nhật Bản và nơi khác tới năm 2028.
  • VNPT: thành lập VNPT AI vào cuối năm 2025, khẳng định vai trò trong hệ sinh thái AI và mục tiêu bảo đảm chủ quyền số.
  • NVIDIA – Chính phủ Việt Nam: tháng 12/2024 ký thỏa thuận lập Trung tâm Nghiên cứu & Phát triển và Trung tâm Dữ liệu AI tại Việt Nam; NVIDIA cũng mua lại VinBrain (công ty AI y tế thuộc Vingroup).

Các động thái này gắn chặt với Nghị quyết 57-NQ/TW (22/12/2024), đặt mục tiêu đến 2030 Việt Nam nằm trong top 3 Đông Nam Á về nghiên cứu và phát triển AI, đồng thời nhấn mạnh nhu cầu tự chủ công nghệ để tránh phụ thuộc số.

Xu hướng

  1. Suy luận (inference) vượt huấn luyện: khi mô hình được triển khai đại trà, chi phí compute cho việc chạy mô hình hằng ngày dần lớn hơn chi phí huấn luyện ban đầu — kéo theo nhu cầu chip suy luận hiệu quả về năng lượng.
  2. Điện và bền vững: nguồn điện trở thành nút thắt. Trung tâm dữ liệu AI buộc phải tính tới điện tái tạo và làm mát chất lỏng để kiểm soát chi phí và phát thải.
  3. Chủ quyền compute: các quốc gia, trong đó có Việt Nam, muốn sở hữu hạ tầng tính toán trong nước thay vì lệ thuộc đám mây nước ngoài.
  4. Đa dạng hóa chip: bên cạnh NVIDIA, các chip tự thiết kế (TPU của Google, Trainium của Amazon) và đối thủ AMD giúp giảm rủi ro phụ thuộc một nhà cung cấp.

Kết luận

Hạ tầng tính toán là nền móng vật lý quyết định ai có thể chơi trong sân chơi AI. Với chi phí GPU cao, nhu cầu điện lớn và cuộc đua chi tiêu hàng trăm tỷ USD toàn cầu, compute vừa là cơ hội vừa là rào cản. Việt Nam, qua làn sóng AI Factory của Viettel, FPT, CMC, VNPT và Nghị quyết 57, đang chủ động xây nền móng đó để không đứng ngoài cuộc chơi.

Nguồn tham khảo