Cho đến thời điểm này, NVIDIA DGX đã nhanh chóng trở thành nền tảng AI hỗ trợ đắc lực cho các tổ chức viễn thông, truyền thông và giải trí, hành chính công, chăm sóc sức khỏe, các viện nghiên cứu……trong hành trình phát triển về AI của họ. Các công ty như BMW, Lockheed Martin, Naver CLOVA, NTT PC Communications, Sony và Subaru là các thương hiệu toàn đã xây dựng cơ sở hạ tầng AI với hệ thống DGX A100 để giải bắt kịp nhanh hơn các cơ hội kinh doanh của họ.
Vào năm 2020, NVIDIA đưa ra thông báo về việc mở rộng hệ sinh thái NVIDIA DGX nhằm đơn giản hóa việc triển khai, tích hợp và mở rộng cho các khách hàng của NVIDIA.
Sự ra đời của giải pháp NVIDIA DGX SuperPOD cho Doanh nghiệp đã biến kiến trúc tham chiếu NVIDIA DGX SuperPOD thành sản phẩm chìa khóa trao tay mà khách hàng trên khắp thế giới có thể sử dụng để triển khai AI trên quy mô lớn.
AI Starter Kit – Cách nhanh nhất để bắt đầu với AI
Đối với tổ chức, doanh nghiệp khởi động hành AI của họ thì xuất phát từ ý tưởng đến ra đời một ứng dụng có thể sử dụng được quả thật là một hành trình cam go. Từ việc lựa chọn phần mềm, công cụ cho tới lựa chọn nền tảng phù hợp là những điều rất phức tạp đối với các đội ngũ chưa có kinh nghiệp phát triển các AI. Đôi khi lựa chọn chỉ là đẩy nhanh các quá trình đã nêu trên này bằng cách kết hợp các thành phần lại với nhau dựa trên các kiến thức chuyên môn sâu đến từ các chuyên gia có kinh nghiệm về lĩnh vực đang tham gia trong dự án.
NVIDIA AI Starter Kit bao gồm mọi thứ cần thiết để các tổ chức, doanh nghiệp bắt đầu với AI. NVIDIA AI Stater Kit bao gồm hệ thống NVIDIA DGX A100, các mô hình AI sẵn có và các phần mềm xử lý dữ liệu (data science workflow). NVIDIA AI Starter Kit cũng bao gồm các dịch vụ tư vấn từ các đối tác cung cấp giải pháp của NVIDIA, những đối tác biết cách biến các ý tưởng AI thành các ứng dụng kinh doanh. NVIDIA AI Starter Kit có thể giúp các tổ chức sớm mang lại lợi thế kinh doanh dựa trên AI với chi phí chỉ bằng một phần so với chi phí tự thực hiện của tổ chức, doanh nghiệp.
Kiến trúc hạ tầng AI tham chiếu
Dù không phải tất cả các tổ chức, doanh nghiệp đều đi tìm sự đơn giản hoá với kiến trúc tất cả trong một (all-in one) thông qua AI Starter Kit hoặc hạ tầng khả mở ấn tượng như NVIDIA DGX SuperPOD. Tuy nhiên họ cần có phương pháp tiếp cận theo một định cỡ phù hợp với tổ chức, doanh nghiệp của họ. Lúc này NVIDIA DGX POD là kiến trúc lý tưởng đối với phương pháp tiếp cận theo quy ước đã nêu.
DGX POD cho phép các doanh nghiệp ghép nối hệ thống DGX của họ với các đối tác lưu trữ hiệu năng cao mà họ ưa thích, đồng thời được cung cấp các thông tin chi tiết về thiết kế và thử nghiệm hiệu năng trên hệ thống tham chiếu đã lựa chọn.
Hiện nay kiến trúc tham chiếu DGX POD bao gồm NVIDIA DGX A100 với các tham chiếu tích hợp từ các đối tác như DDN, NetApp và Pure Storage, Dell EMC và IBM.
Vận hành cơ sở hạ tầng AI với DGX-Ready Software
DevOps được coi là mô hình triển khai hiện đại để viết, triển khai và chạy các ứng dụng cho doanh nghiệp một cách hiệu quả như một quy trình hợp tác giữa các nhà phát triển phần mềm (Devs) và các nhóm vận hành CNTT (Ops) để mang lại lợi ích cho việc phát triển ứng dụng của doanh nghiệp. Dựa trên DevOps, MLOps (Machine Learning Layered on DevOps) bổ sung thêm vào mô hình các nhà khoa học dữ liệu và các kĩ sư Machine Learning để đảm bảo tối ưu cho việc quản lý các tập dữ liệu, xây dựng mô hình AI phân tích chúng, chạy các bộ dữ liệu thông qua các mô hình một cách tự động.
Thông qua sự hợp tác chặt chẽ của NVIDIA với các đối tác phần mềm cũng như quy trình chứng nhận giải pháp (comprehensive certification process) , DGX-Ready Software là chương trình chứng nhận tính tương thích của các phần mềm từ đối tác với hệ thống NVIDIA DGX. Việc chứng nhận giải pháp như DGX-Ready Software giúp đơn giản hóa việc triển khai, quản lý và mở rộng cơ sở hạ tầng AI đồng thời cho phép các doanh nghiệp áp dụng quy trình phát triển AI và Machine Learning dựa trên MLOps.
Các chứng nhận về giải pháp với DGX-Ready Software hiện gồm các lĩnh vực chủ yếu như sau: giải pháp quản lý cụm cluster và hạ tầng điều phối container. Một số phần mềm tiêu biểu có thể kể đến như Bright Cluster Manager của Bright Computing và Red Hat OpenShift, đây là các giải pháp được chứng nhận tương thích rất tốt với tính năng thế mạnh trên NVIDIA A100 Tensor Core GPUs đó là Multi-instances GPU (MIG). MIG được coi là mang lại sự linh hoạt cho các phương án triển khai, sử dụng của hạ tầng AI trên nền tảng DGX A100.
Hệ điều hành DGX
Một thành phần không thể không nhắc đến trong hạ tầng AI của NVIDIA AI đó là hệ điều hành. NVIDIA hợp tác chặt chẽ với Canonical và Red Hat để tối ưu hóa hệ điều hành cho một hạ tầng AI hoàn thiện (NVIDIA AI stack), từ phần cứng DGX cho tới lớp phần mềm như CUDA-X, NVIDIA Cloud GPU Container, các giải pháp Phần mềm DGX-Ready. Điều này tạo ra một hạ tầng tích hợp hoàn chỉnh theo chiều dọc và các tổ chức, doanh nghiệp có thể dựa vào đó để điều chỉnh, thử nghiệm và tối ưu hóa hướng tới đạt hiệu suất AI tốt nhất cho mình.
DGX OS là hệ điều hành cho hệ thống DGX được phát triển dựa trên các phiên bản Ubuntu LTS của Canonical tuy nhiên các tổ chức, doanh nghiệp hoàn toàn có thể lựa chọn hệ điều hành DGX là Red Hat Enterprise Linux với đầy đủ các tính năng trên DGX OS với cam kết về tính tương thích từ NVIDIA với Red Hat Enterprise Linux.
Về ADG Distribution
ADG hiện là nhà phân phối chính thức của NVIDIA cho hệ thống máy tính hiệu suất cao, các thiết bị AI, và máy tính tăng tốc NVIDIA dựa trên GPU và hệ thống cụm siêu máy tính với khả năng lưu trữ song song DDN và mạng tốc độ cao từ Mellanox. Xem thêm thông tin tại http://adg.vn/
- Liên hệ để được tư vấn: Mr Nguyễn Tiến Dũng
- E-mail: tiendung.nguyen@adg.vn
Nguồn bài viết: https://blogs.nvidia.com/blog/2020/10/06/dgx-systems-ai-infrastructure/