Trong bối cảnh AI đang tái định hình cách doanh nghiệp vận hành và đổi mới, NVIDIA một lần nữa khẳng định vai trò tiên phong của mình khi công bố hiệu suất suy luận vượt trội trên kiến trúc GPU Blackwell mới nhất. Cụ thể, hai mô hình OpenAI gpt-oss-20b và gpt-oss-120b đã được tối ưu hóa để chạy trên hệ thống NVIDIA GB200 NVL72, đạt hiệu suất ấn tượng lên đến 1,5 triệu token/giây, tương đương khả năng phục vụ khoảng 50.000 người dùng đồng thời.
Sự kết hợp giữa công nghệ tiên tiến và nền tảng phần cứng vượt trội
Hai mô hình mới thuộc dòng gpt-oss không chỉ là các mô hình ngôn ngữ lớn mở (open-weight) mà còn tích hợp các công nghệ mới nhất như kiến trúc Mixture of Experts (MoE), hàm kích hoạt SwigGLU, cũng như RoPE attention với độ dài ngữ cảnh đầu vào mở rộng lên tới 128.000 token.
Việc sử dụng định dạng FP4 giúp các mô hình dễ dàng chạy trên một GPU trung tâm dữ liệu 80GB. Với sự hỗ trợ tối ưu từ kiến trúc Blackwell, khả năng suy luận không những được tăng tốc mà còn đảm bảo tính hiệu quả về chi phí cho các trung tâm dữ liệu quy mô lớn.
Phản hồi tích cực cho dòng GPU NVIDIA
NVIDIA chính thức gửi lời chúc mừng đến OpenAI trên nền tảng X nhân dịp ra mắt hai mô hình suy luận mã nguồn mở mới, gpt-oss, được thiết kế để vận hành hiệu quả trên hệ sinh thái hạ tầng AI quy mô lớn nhất thế giới.
Theo chia sẻ, hai mô hình này đánh dấu bước tiến quan trọng trong việc mở rộng khả năng tiếp cận công nghệ AI tiên tiến cho cộng đồng phát triển toàn cầu. Cả hai mô hình gpt-oss đều được huấn luyện trên GPU NVIDIA, được tinh chỉnh toàn diện để tối ưu hóa hiệu năng trên toàn bộ nền tảng phần cứng của NVIDIA, bao gồm cả các dòng GPU cao cấp như NVIDIA Blackwell và RTX.
Đặc biệt, các mô hình này tương thích rộng rãi với hệ sinh thái phần cứng AI phổ biến nhất thế giới hiện nay – NVIDIA GPU CUDA – trải dài từ máy tính cá nhân, trung tâm dữ liệu đến các nền tảng điện toán đám mây. CUDA, nền tảng điện toán song song và mô hình lập trình do NVIDIA phát triển, cho phép các kỹ sư và nhà phát triển tận dụng sức mạnh xử lý song song của GPU cho đa dạng tác vụ, từ đồ họa đến trí tuệ nhân tạo, mô phỏng vật lý và xử lý dữ liệu quy mô lớn.
Jensen Huang, Giám đốc điều hành NVIDIA, cho hay: “OpenAI là minh chứng cho thấy những khả năng đột phá có thể đạt được khi xây dựng trên nền tảng AI của NVIDIA. Việc phát hành hai mô hình gpt-oss không chỉ mở ra tiềm năng đổi mới cho cộng đồng phát triển toàn cầu, mà còn tiếp tục củng cố vai trò tiên phong của Hoa Kỳ trong lĩnh vực công nghệ AI thế hệ mới”.
Liên hệ ADG Technology để nhận tư vấn và báo giá về dòng sản phẩm của NVIDIA
ADG Technology là nhà phân phối chính thức của NVIDIA tại Việt Nam, đảm bảo cung cấp các sản phẩm và dịch vụ chất lượng cao cho khách hàng. Với vị thế uy tín và kinh nghiệm trong lĩnh vực phân phối CNTT, ADG cam kết mang đến sự hài lòng và tin tưởng cho các doanh nghiệp và tổ chức tại Việt Nam trong việc triển khai các giải pháp công nghệ mới nhất từ NVIDIA.