에이전틱 AI

AI 팩토리에는 실제로 작동하는 인프라가 필요합니다

대부분의 AI 플랫폼은 대규모 AI를 약속하지만 복잡성을 제공합니다. Nutanix 에이전틱 AI는 기업이 AI 팩토리를 구축, 운영 및 관리할 수 있도록 클라우드 운영 모델을 제공하는 풀스택 소프트웨어 솔루션입니다. 이 솔루션은 NVIDIA의 가속 컴퓨팅 에코시스템과의 통합을 통해 운영을 간소화하고, 성능과 보안을 극대화하며, GPU 사용률과 토큰 비용을 최적화합니다.

AI 팩토리를 위한 클라우드 운영 모델

Nutanix는 AI 팩토리에서 실행되는 AI 동료 시대에 맞춰 특별히 설계된 클라우드 운영 모델을 제공합니다. 복잡성을 추상화하고 IT 의사 결정권자가 성능, 보안 및 비용의 균형을 맞출 수 있도록 지원하는 Nutanix 에이전틱 AI 솔루션은 운영을 단순화하는 것 이상의 기능을 수행하며, 근본적으로 AI의 경제성을 최적화합니다.

토큰당 비용 최소화 그래픽

토큰당 비용 최소화

풀스택 솔루션은 스마트 라우팅, 추론 확장, 토폴로지 인식 리소스 배치, 최적화된 GPU 소비를 제공하여 토큰당 비용을 절감합니다.

엔터프라이즈 보안 그래픽

엔터프라이즈급 보안 및 제어 보장

Nutanix 엔터프라이즈 AI는 LLM 엔드포인트에 대한 안전한 배포 및 엔터프라이즈 제어를 제공하며, Nutanix AHV(가상화) 및 Nutanix Flow(네트워킹 및 보안)의 향상된 기능은 탁월한 격리 및 보안을 제공합니다.

개발자 속도 그래픽

개발자 속도 가속화

인프라 문제로 인한 지연 없이 기획 단계에서 프로덕션 단계로 원활하게 넘어가세요. Nutanix 엔터프라이즈 AI는 스마트 모델 라우팅 및 원클릭 보안 추론 엔드포인트와 모델 컨텍스트 프로토콜 서버에 대한 안전한 턴키 액세스를 제공함으로써 AI 툴링을 원활하게 지원합니다. Nutanix 쿠버네티스 플랫폼은 에이전틱 AI 애플리케이션 개발자를 위해 풍부한 AI 서비스 카탈로그와 프라이빗 데이터에 대한 기본 제공 액세스를 갖춘 빠른 시작 환경을 제공합니다.

에이전틱 AI 그래픽 운영

에이전틱 AI의 완전한 운영화

Nutanix 에이전틱 AI 솔루션은 NVIDIA 인증 AI 팩토리와 원활하게 통합되고 이를 보완하도록 특별히 설계되었으며, 긴밀한 파트너 관계를 활용하여 Cisco, Dell, 슈퍼마이크로를 비롯한 주요 OEM 하드웨어 제조업체의 완벽한 솔루션을 제공합니다.

NVIDIA 솔루션 다이어그램

주요 통합 구성 요소

AI 서비스 및 쿠버네티스 플랫폼

개발자 중심의 클라우드 네이티브 환경을 통해 팀은 인프라 설정을 생략하고 예측 가능한 토큰 경제성을 갖춘 프로덕션급 에이전틱 AI 애플리케이션을 즉시 확장할 수 있습니다.

인프라 최적화 및 보안

VM 폼 팩터를 통해 가속화된 컴퓨팅의 성능을 조율하여 최대 성능과 보안을 제공함으로써 토큰당 비용을 낮춥니다.

AI를 위한 기초 데이터 서비스

스토리지 클러스터 내에서 직접 지속적인 GPU 가속 변환을 통해 학습과 추론을 연결하는 데 필요한 고성능 데이터 패브릭을 제공합니다.

AI 서비스 및 쿠버네티스 플랫폼

콘솔 사용자

고급 AI 게이트웨이 및 추론 서비스

통합된 보안 추론 엔드포인트를 통해 기업은 일관된 인증, 관찰 가능성, 토큰 기반 요금 제한을 통해 프라이빗 LLM과 함께 클라우드 호스팅 모델(및 토큰 크레딧)을 사용할 수 있습니다.

모델 컨텍스트 프로토콜 지원 및 미세 조정

Nutanix 엔터프라이즈 AI는 기존의 강력한 서비스형 모델(MaaS) 기능을 확장하여 에이전트가 엔터프라이즈 툴 및 데이터 소스에 안전하게 연결할 수 있도록 지원합니다.

풍부한 AI 카탈로그를 갖춘 개방형 쿠버네티스 플랫폼

노트북, 벡터 데이터베이스, MLOps 엔진 등 사전 검증된 오픈 소스 AI 서비스 카탈로그를 사용하여 인프라 지연 없이 에이전틱 애플리케이션을 개념에서 프로덕션으로 이동하세요. 이 솔루션은 기본적으로 NVIDIA AI 엔터프라이즈와 통합되어 개발자가 Nemotron을 포함한 NVIDIA NIM을 즉시 배포하여 프로덕션 환경에서 고성능 AI 애플리케이션 개발을 가속화할 수 있도록 지원합니다.

인프라 최적화 및 보안

밤의 도시 조명

토폴로지 인식 최적화

Nutanix AHV 하이퍼바이저는 GPU 밀집 서버에서 워크로드 배치를 자동으로 최적화하여 성능, 보안 및 리소스 활용도를 극대화하기 위해 복잡한 수동 인프라 조정 없이 엄격한 하드웨어 조정을 보장합니다.

DPU 가속 제로 트러스트 네트워킹

새로운 DPU 오프로드 기능을 갖춘 Nutanix Flow를 활용하면 고성능 제로 트러스트 네트워크 기반을 갖춘 가상화된 환경의 정교한 격리 기능을 통해 베어 메탈의 원시 속도를 구현하여 처리량을 극대화하는 동시에 AI 팩토리 전체에서 안전하고 안정적인 데이터 흐름을 보장할 수 있습니다.

에어 갭 라이프사이클 관리

이 솔루션은 전체 NKP 플랫폼과 NVIDIA GPU 및 네트워크 운영자의 완전히 분리된 설치를 지원하므로 규제가 엄격한 환경이나 국방 부문 환경에서도 클러스터를 인터넷에 노출하지 않고 드라이버 업데이트 및 네트워크 최적화를 자동화할 수 있습니다.

AI를 위한 기초 데이터 서비스

일반 조명 그래픽

선형 확장성

NVIDIA-엔터프라이즈 인증 AI 데이터 플랫폼인 Nutanix 통합 스토리지는 수천 개의 GPU 클라이언트에서 고속 읽기/쓰기 성능을 제공하여 컴퓨팅만큼 빠르게 데이터 가용성을 확장할 수 있도록 지원합니다.

고급 처리량

지연 시간이 짧은 데이터 경로를 제공하기 위해 NFS over RDMA와 곧 S3 over RDMA를 활용하여 GPU가 데이터에 '고갈'되지 않도록 보장합니다.

비용 최적화

KV 캐시 오프로딩을 위한 고용량 계층을 제공하여 토큰당 총 비용을 절감하고 중요한 GPU 메모리를 확보하여 성능 저하 없이 훨씬 더 큰 컨텍스트 창과 더 많은 동시 사용자를 처리할 수 있습니다.

고객이 신뢰하는 Nutanix


테스트 드라이브 체험하기

Nutanix 엔터프라이즈 AI를 사용하여 대규모로 AI 추론 실행

데모를 확인해 보시겠습니까?

전문가와 상담하여 Nutanix가
하이브리드 멀티클라우드 환경에서 AI를 확장하는 방법을 알아보십시오.

자주 묻는 질문(FAQ)

Nutanix 에이전틱 AI 솔루션은 복잡성을 추상화하고 에이전틱 AI 빌더와 AI 팩토리 운영자를 원활하게 연결하는 가교 역할을 합니다. 이 풀스택 솔루션은 운영을 간소화하고, 성능과 보안을 극대화하며, 토큰 비용을 최적화하여 AI 팩토리 운영자를 위한 클라우드 운영 모델을 제공합니다. 동시에 에이전틱 AI 빌더는 혁신, 모델 관리, 빠른 추론 확장에 집중할 수 있습니다.

에이전틱 AI 빌더는 인텔리전스 구축에 집중하는 대신 모델, 도구, 데이터 사일로의 파편화된 환경을 탐색하면서 높은 수준의 "혁신 마찰"에 직면합니다. 개발자는 다양한 LLM과 오픈 소스 도구를 활용하여 단순한 채팅 인터페이스에서 실제 비즈니스 성과를 창출할 수 있는 정교한 에이전틱 AI로 빠르게 진화하는 애플리케이션을 개발할 수 있는 통합되고 안전한 경로가 부족합니다.

AI 팩토리 운영자에게 가장 큰 과제는 다음과 같은 AI 팩토리의 운영 복잡성으로 인해 토큰 생성까지 소요되는 시간 및 토큰당 비용으로 측정되는 비즈니스 가치를 제공하는 것입니다: 

  • 다양하고 빠르게 진화하는 AI 하드웨어(GPU, 네트워킹, 스토리지) 관리의 복잡성, 
  • 모델 및 데이터에 대한 안전한 액세스를 보장하고 주권 요구 사항을 준수하면서 중요한 AI 인프라에 대한 공유 액세스를 제공하는 데 따르는 복잡성
  • 전체 AI 팩토리에서 리소스 활용도를 최적화하면서 최고의 성능을 일관되게 제공하는 복잡성.
  • AI 팩토리 운영을 지원하는 파편화된 맞춤형 포인트 솔루션의 수명 주기 관리의 복잡성

클라우드 운영 모델은 AI 개발자와 인프라 팀 간의 격차를 해소하기 위한 Nutanix의 접근 방식입니다. 이 모델은 파편화된 포인트 솔루션이나 복잡한 베어메탈 클러스터를 관리하는 대신 통합된 풀스택 환경을 제공합니다. 이를 통해 운영자는 클라우드 서비스처럼 쉽게 AI 인프라(GPU, DPU, 스토리지)를 관리할 수 있으며, 개발자는 수천 개의 지능형 에이전트를 확장하는 데 필요한 도구와 모델에 즉각적이고 안전하게 액세스할 수 있습니다.

Nutanix는 여러 가지 통합 효율성을 통해 토큰 경제성을 최적화합니다:

  • 토폴로지 인식 최적화: AHV 하이퍼바이저는 GPU 밀집 서버에 워크로드를 자동으로 배치하여 하드웨어 정렬을 극대화합니다.
  • 리소스 오프로딩: DPU(데이터 처리 장치)를 사용하여 네트워킹 및 보안 작업을 처리하면 추론을 위한 GPU 주기를 확보할 수 있습니다.
  • 스마트 스토리지: Nutanix 통합 스토리지는 KV 캐시 오프로딩을 위한 고용량 계층을 제공하여 값비싼 GPU 메모리를 절약하고 성능 저하 없이 더 큰 컨텍스트 창을 사용할 수 있습니다.

베어메탈은 초기 모델 트레이닝의 표준이었지만, 기업에서 에이전트를 확장하는 데 필요한 보안과 격리 기능이 부족한 경우가 많습니다. Nutanix는 VM 기반 쿠버네티스 인프라를 사용합니다:

  • 뛰어난 격리: 서로 다른 AI 워크로드 간의 멀티테넌시 및 보안 경계를 강화합니다.
  • 규모에 맞는 관리: 더 쉬운 수명 주기 관리 및 리소스 할당.
  • 베어메탈 성능: Nutanix는 DPU 가속 및 토폴로지 인식 기능을 활용하여 가상화된 환경의 거버넌스와 함께 베어메탈의 속도를 제공합니다.

NAI 게이트웨이는 모든 AI 모델에 대해 안전한 "정문" 역할을 합니다. 기업이 클라우드 호스팅 모델과 프라이빗 LLM을 한 곳에서 관리할 수 있는 통합 추론 엔드포인트를 제공합니다. 주요 기능은 다음과 같습니다:

  • 거버넌스: 토큰 기반 요금 제한으로 "요금 폭탄"을 방지합니다.
  • 관찰 가능성: 누가 어떻게 리소스를 소비하고 있는지 완벽하게 파악할 수 있습니다.
  • 연결성: 상담원이 비공개 엔터프라이즈 데이터 및 도구에 안전하게 연결할 수 있는 MCP(모델 컨텍스트 프로토콜)를 지원합니다.

이 솔루션은 인프라 설정을 우회할 수 있는 개발자 중심 환경을 제공함으로써 "혁신 마찰"을 줄입니다. 빌더는 Nutanix 쿠버네티스 플랫폼(NKP)을 통해 다음과 같은 풍부한 AI 카탈로그에 액세스할 수 있습니다:

  • 사전 구축된 오픈 소스 도구(노트북, 벡터 데이터베이스, MLOps 엔진).
  • NVIDIA NIMNVIDIA 네모트론 모델 제품군을 즉시 배포할 수 있습니다.
  • 원클릭 보안 추론 엔드포인트와 미세 조정 서비스에 대한 턴키 액세스를 제공합니다.

Nutanix 통합 스토리지는 AI 및 차세대 애플리케이션과 같은 최신 워크로드를 위해 특별히 설계된 확장 가능한 고성능 데이터 플랫폼을 제공합니다. 주요 기능은 다음과 같습니다:

  • 추론 및 검색 증강 생성(RAG)을 포함한 AI 파이프라인의 대규모 데이터 세트를 처리하기 위한 초고속 읽기 처리량과 고밀도 올-NVMe 용량을 제공합니다.
  • 컨테이너화된 AI/ML 파이프라인 및 클라우드 네이티브 애플리케이션을 원활하게 배포할 수 있도록 Nutanix 쿠버네티스 플랫폼과 통합됩니다.
  • 멀티 프로토콜 데이터 액세스로 다양한 워크로드를 위한 스토리지를 간소화하고 혁신을 가속화합니다.