NVIDIA giúp cơ sở hạ tầng AI dễ dàng triển khai hơn, dễ dàng mở rộng quy mô với Hệ thống NVIDIA DGX

Date: 26/01/2022

Cho đến thời điểm này, NVIDIA DGX đã nhanh chóng trở thành nền tảng AI hỗ trợ đắc lực cho các tổ chức viễn thông, truyền thông và giải trí, hành chính công, chăm sóc sức khỏe, các viện nghiên cứu……trong hành trình phát triển về AI của họ. Các công ty như BMW, Lockheed Martin, Naver CLOVA, NTT PC Communications, Sony và Subaru là các thương hiệu toàn đã xây dựng cơ sở hạ tầng AI với hệ thống DGX A100 để giải bắt kịp nhanh hơn các cơ hội kinh doanh của họ.

Vào năm 2020, NVIDIA đưa ra thông báo về việc mở rộng hệ sinh thái NVIDIA DGX nhằm đơn giản hóa việc triển khai, tích hợp và mở rộng cho các khách hàng của NVIDIA.

Sự ra đời của giải pháp NVIDIA DGX SuperPOD cho Doanh nghiệp đã biến kiến ​​trúc tham chiếu NVIDIA DGX SuperPOD thành sản phẩm chìa khóa trao tay mà khách hàng trên khắp thế giới có thể sử dụng để triển khai AI trên quy mô lớn.

AI Starter Kit – Cách nhanh nhất để bắt đầu với AI

Đối với tổ chức, doanh nghiệp khởi động hành AI của họ thì xuất phát từ ý tưởng đến ra đời một ứng dụng có thể sử dụng được quả thật là một hành trình cam go. Từ việc lựa chọn phần mềm, công cụ cho tới lựa chọn nền tảng phù hợp là những điều rất phức tạp đối với các đội ngũ chưa có kinh nghiệp phát triển các AI. Đôi khi lựa chọn chỉ là đẩy nhanh các quá trình đã nêu trên này bằng cách kết hợp các thành phần lại với nhau dựa trên các kiến ​​thức chuyên môn sâu đến từ các chuyên gia có kinh nghiệm về lĩnh vực đang tham gia trong dự án.

 

NVIDIA AI Starter Kit bao gồm mọi thứ cần thiết để các tổ chức, doanh nghiệp bắt đầu với AI. NVIDIA AI Stater Kit bao gồm hệ thống NVIDIA DGX A100, các mô hình AI sẵn có và các phần mềm xử lý dữ liệu (data science workflow). NVIDIA AI Starter Kit cũng bao gồm các dịch vụ tư vấn từ các đối tác cung cấp giải pháp của NVIDIA, những đối tác biết cách biến các ý tưởng AI thành các ứng dụng kinh doanh. NVIDIA AI Starter Kit có thể giúp các tổ chức sớm mang lại lợi thế kinh doanh dựa trên AI với chi phí chỉ bằng một phần so với chi phí tự thực hiện của tổ chức, doanh nghiệp.

 

Kiến trúc hạ tầng AI tham chiếu

Dù không phải tất cả các tổ chức, doanh nghiệp đều đi tìm sự đơn giản hoá với kiến trúc tất cả trong một (all-in one) thông qua AI Starter Kit hoặc hạ tầng khả mở ấn tượng như NVIDIA DGX SuperPOD. Tuy nhiên họ cần có phương pháp tiếp cận theo một định cỡ phù hợp với tổ chức, doanh nghiệp của họ. Lúc này NVIDIA DGX POD là kiến trúc lý tưởng đối với phương pháp tiếp cận theo quy ước đã nêu.

DGX POD cho phép các doanh nghiệp ghép nối hệ thống DGX của họ với các đối tác lưu trữ hiệu năng cao mà họ ưa thích, đồng thời được cung cấp các thông tin chi tiết về thiết kế và thử nghiệm hiệu năng trên hệ thống tham chiếu đã lựa chọn.

Hiện nay kiến trúc tham chiếu DGX POD bao gồm NVIDIA DGX A100 với các tham chiếu tích hợp từ các đối tác như DDN, NetApp và Pure Storage, Dell EMC và IBM.

Vận hành cơ sở hạ tầng AI với DGX-Ready Software

DevOps được coi là mô hình triển khai hiện đại để viết, triển khai và chạy các ứng dụng cho doanh nghiệp một cách hiệu quả như một quy trình hợp tác giữa các nhà phát triển phần mềm (Devs) và các nhóm vận hành CNTT (Ops) để mang lại lợi ích cho việc phát triển ứng dụng của doanh nghiệp. Dựa trên DevOps, MLOps (Machine Learning Layered on DevOps) bổ sung thêm vào mô hình các nhà khoa học dữ liệu và các kĩ sư Machine Learning để đảm bảo tối ưu cho việc quản lý các tập dữ liệu, xây dựng mô hình AI phân tích chúng, chạy các bộ dữ liệu thông qua các mô hình một cách tự động.

Thông qua sự hợp tác chặt chẽ của NVIDIA với các đối tác phần mềm cũng như quy trình chứng nhận giải pháp (comprehensive certification process) , DGX-Ready Software là chương trình chứng nhận tính tương thích của các phần mềm từ đối tác với hệ thống NVIDIA DGX. Việc chứng nhận giải pháp như DGX-Ready Software giúp đơn giản hóa việc triển khai, quản lý và mở rộng cơ sở hạ tầng AI đồng thời cho phép các doanh nghiệp áp dụng quy trình phát triển AI và Machine Learning dựa trên MLOps.

Các chứng nhận về giải pháp với DGX-Ready Software hiện gồm các lĩnh vực chủ yếu như sau: giải pháp quản lý cụm cluster  và hạ tầng điều phối container. Một số phần mềm tiêu biểu có thể kể đến như Bright Cluster Manager của Bright Computing và Red Hat OpenShift, đây là các giải pháp được chứng nhận tương thích rất tốt với tính năng thế mạnh trên NVIDIA A100 Tensor Core GPUs đó là Multi-instances GPU (MIG). MIG được coi là mang lại sự linh hoạt cho các phương án triển khai, sử dụng của hạ tầng AI trên nền tảng DGX A100.

Hệ điều hành DGX

Một thành phần không thể không nhắc đến trong hạ tầng AI của NVIDIA AI đó là hệ điều hành. NVIDIA hợp tác chặt chẽ với Canonical và Red Hat để tối ưu hóa hệ điều hành cho một hạ tầng AI hoàn thiện (NVIDIA AI stack), từ phần cứng DGX cho tới lớp phần mềm như CUDA-X, NVIDIA Cloud GPU Container, các giải pháp Phần mềm DGX-Ready. Điều này tạo ra một hạ tầng tích hợp hoàn chỉnh theo chiều dọc và các tổ chức, doanh nghiệp có thể dựa vào đó để điều chỉnh, thử nghiệm và tối ưu hóa hướng tới đạt hiệu suất AI tốt nhất cho mình.

DGX OS là hệ điều hành cho hệ thống DGX được phát triển dựa trên các phiên bản Ubuntu LTS của Canonical tuy nhiên các tổ chức, doanh nghiệp hoàn toàn có thể lựa chọn hệ điều hành DGX là Red Hat Enterprise Linux với đầy đủ các tính năng trên DGX OS với cam kết về tính tương thích từ NVIDIA với Red Hat Enterprise Linux.

Về ADG Distribution

ADG hiện là nhà phân phối chính thức của NVIDIA cho hệ thống máy tính hiệu suất cao, các thiết bị AI, và máy tính tăng tốc NVIDIA dựa trên GPU và hệ thống cụm siêu máy tính với khả năng lưu trữ song song DDN và mạng tốc độ cao từ Mellanox. Xem thêm thông tin tại http://adg.vn/

  • Liên hệ để được tư vấn: Mr Nguyễn Tiến Dũng
  • E-mail: tiendung.nguyen@adg.vn
  • Điện thoại: 0904169664

Nguồn bài viết: https://blogs.nvidia.com/blog/2020/10/06/dgx-systems-ai-infrastructure/

Bài viết liên quan

SIÊU MÁY CHỦ TRÍ TUỆ NHÂN TẠO NVIDIA DGX A100

SIÊU MÁY CHỦ TRÍ TUỆ NHÂN TẠO NVIDIA DGX A100

  NVIDIA DGX A100 là hệ thống phổ quát cho tất cả các AI workload Siêu máy chủ này có…

ADG No Image

ADG Distribution Đạt Giải “FY23 Trailblazing Distributor ” Tại Kingston Channel Conference 2024 Vietnam

Ngày 23 tháng 3 năm 2023 – ADG vinh dự nhận giải thưởng Trailblazing Distributor FY23 tại sự kiện The…

AI Việt Nam bước vào kỷ nguyên mới: Đại học Công nghệ Thông Tin sở hữu siêu máy chủ AI NVIDIA DGX A100 đầu tiên tại Việt Nam

AI Việt Nam bước vào kỷ nguyên mới: Đại học Công nghệ Thông Tin sở hữu siêu máy chủ AI NVIDIA DGX A100 đầu tiên tại Việt Nam

Trường đại học Công nghệ thông tin (Đại học Quốc gia TP.HCM) vừa tiếp nhận siêu máy chủ AI NVIDIA…

ADG No Image

TRI ÂN ĐẠI LÝ – DU LỊCH TƯNG BÙNG CÙNG ADG.

ADG TUNG CHƯƠNG TRÌNH TRI ÂN “TÍCH ĐIỂM CÀNG NHIỀU – DU LỊCH THẢ GA” Chúng tôi xin gửi lời…

ADG Distribution Đạt Giải “FY23 Best Performance Distributor Award” Tại HPE Partner Growth Summit 2024 Vietnam

ADG Distribution Đạt Giải “FY23 Best Performance Distributor Award” Tại HPE Partner Growth Summit 2024 Vietnam

Phan Thiết, ngày 12 tháng 1 năm 2024 – Tại sự kiện HPE Partner Growth Summit 2024 Vietnam, ADG Distribution,…

THÔNG BÁO VỀ VIỆC ỦY QUYỀN BẢO HÀNH SẢN PHẨM EATON CHO CÔNG TY TSC.

THÔNG BÁO VỀ VIỆC ỦY QUYỀN BẢO HÀNH SẢN PHẨM EATON CHO CÔNG TY TSC.

CÔNG TY ADG Distribution- NHÀ PHÂN PHỐI UPS EATON XIN THÔNG BÁO: KỂ TỪ NGÀY 01/01/2024, VIỆC BẢO HÀNH EATON…

Building Intelligent Models – Sự kiện chuyên sâu của NVIDIA về Generative AI & LLMS dành cho các Nhà phát triển AI tại Việt Nam

Building Intelligent Models – Sự kiện chuyên sâu của NVIDIA về Generative AI & LLMS dành cho các Nhà phát triển AI tại Việt Nam

Vừa qua, NVIDIA, đơn vị hàng đầu về công nghệ đồ họa và trí tuệ nhân tạo, đã phối hợp…

HPE Workshop: Smart data management & Unlimited connection

HPE Workshop: Smart data management & Unlimited connection

HCM – Vừa qua, CMC TS, ADG phối hợp cùng đối tác công nghệ HPE, Aruba tổ chức workshop “Smart…

GENERATIVE AI AND RECOMMEND SYSTEM WITH NVIDIA SOLUTION

GENERATIVE AI AND RECOMMEND SYSTEM WITH NVIDIA SOLUTION

Vừa qua, ADG đã phối hợp cùng NVIDIA và FPT software tổ chức Hội thảo “Generative AI And Recommend System…

KHI BỘ LƯU ĐIỆN VÀ THANH QUẢN LÝ NGUỒN PDU KẾT NỐI “KHÔNG DÂY”

KHI BỘ LƯU ĐIỆN VÀ THANH QUẢN LÝ NGUỒN PDU KẾT NỐI “KHÔNG DÂY”

Trên bộ lưu điện (UPS) truyền thống cổng kết nối truyền thông là cổng kết nối RS232 hoặc USB phục…