What is the Nutanix Agentic AI solution?

The Nutanix Agentic AI solution abstracts complexity and creates a seamless bridge from the agentic AI builders to the AI factory operators. This full-stack solution offers a cloud operating model for AI factory operators by simplifying operations, maximizing performance and security, and optimizing token costs. At the same time, it enables the agentic AI builders to focus on innovation, model management, and rapid inference scaling.

What is the core challenge the Nutanix Agentic AI solution solves?

Agentic AI builders face a high degree of "innovation friction" as they navigate a fragmented landscape of models, tools, and data silos instead of focusing on building intelligence. Developers lack a unified, secure path to leverage diverse LLMs and open-source tools to rapidly evolving applications from simple chat interfaces into sophisticated agentic AI capable of driving real business outcomes. For AI factory operators, the biggest challenge is delivering business value measured in terms of time to tokens and cost per token due to operations complexity in AI factories such as: Complexity in managing diverse and rapidly evolving AI hardware (GPUs, networking, storage), Complexity of providing shared access to critical AI infrastructure while ensuring secure access to model and data, and complying with sovereignty requirements Complexity of consistently delivering maximum performance, while optimizing resource utilization across the full AI factory. Complexity of managing the lifecycle of fragmented, bespoke point solutions supporting AI factory operations

What is the "Cloud Operating Model" for Agentic AI?

The Cloud Operating Model is Nutanix’s approach to bridging the gap between AI developers and infrastructure teams. Instead of managing fragmented point solutions or complex bare-metal clusters, this model provides a unified, full-stack environment. It allows operators to govern AI infrastructure (GPUs, DPUs, and storage) with the same ease as a cloud service, while giving developers instant, secure access to the tools and models they need to scale thousands of intelligent agents.

How does Nutanix help reduce the "cost per token"?

Nutanix optimizes token economics through several integrated efficiencies: Topology-Aware Optimization: The AHV hypervisor automatically places workloads across GPU-dense servers to maximize hardware alignment. Resource Offloading: Using DPUs (Data Processing Units) to handle networking and security tasks frees up GPU cycles specifically for inference. Smart Storage: Nutanix Unified Storage provides a high-capacity tier for KV Cache offloading, which saves expensive GPU memory and allows for larger context windows without a performance penalty.

Why does Nutanix recommend virtual machines (VMs) over bare-metal Kubernetes for AI?

While bare-metal was the standard for initial model training, it often lacks the security and isolation required for scaling agents in an enterprise. Nutanix uses VM-based Kubernetes infrastructure to provide: Superior Isolation: Stronger multi-tenancy and security boundaries between different AI workloads. Management at Scale: Easier lifecycle management and resource allocation. Bare-Metal Performance: By leveraging DPU acceleration and topology awareness, Nutanix delivers the speed of bare metal with the governance of a virtualized environment.

What is the Nutanix Enterprise AI (NAI) Gateway?

The NAI Gateway acts as a secure "front door" for all AI models. It provides a unified inference endpoint that allows enterprises to manage cloud-hosted models and private LLMs in one place. Key features include: Governance: Token-based rate limiting to prevent "bill shock." Observability: Full visibility into who is consuming resources and how. Connectivity: Support for the Model Context Protocol (MCP), which allows agents to securely connect to private enterprise data and tools.

How does this solution accelerate the work of Agentic AI builders?

The solution reduces "innovation friction" by providing a developer-centric environment where they can bypass infrastructure setup. Through the Nutanix Kubernetes Platform (NKP), builders gain access to a rich AI catalog including: Pre-built open-source tools (Notebooks, Vector Databases, MLOps engines). Instant deployment of NVIDIA NIMs and the NVIDIA Nemotron family of models. 1-click secure inference endpoints and turnkey access to fine-tuning services.

How does Nutanix Unified Storage (NUS) support AI and next-generation applications?

Nutanix Unified Storage provides a scalable, high-performance data platform purpose-built for modern workloads like AI and next-gen apps. Key capabilities include: Ultra-fast read throughput and dense all-NVMe capacity to handle massive datasets for AI pipelines, including Inferencing and Retrieval-Augmented Generation (RAG) . Integration with Nutanix Kubernetes Platform , enabling seamless deployment of containerized AI/ML pipelines and cloud-native applications. Multi-protocol data access, simplifying storage for diverse workloads and accelerating innovation.

에이전틱 AI

AI 팩토리에는 실제로 작동하는 인프라가 필요합니다

대부분의 AI 플랫폼은 대규모 AI를 약속하지만 복잡성을 제공합니다. Nutanix 에이전틱 AI는 기업이 AI 팩토리를 구축, 운영 및 관리할 수 있도록 클라우드 운영 모델을 제공하는 풀스택 소프트웨어 솔루션입니다. 이 솔루션은 NVIDIA의 가속 컴퓨팅 에코시스템과의 통합을 통해 운영을 간소화하고, 성능과 보안을 극대화하며, GPU 사용률과 토큰 비용을 최적화합니다.

블로그 읽어보기

AI 팩토리를 위한 클라우드 운영 모델

Nutanix는 AI 팩토리에서 실행되는 AI 동료 시대에 맞춰 특별히 설계된 클라우드 운영 모델을 제공합니다. 복잡성을 추상화하고 IT 의사 결정권자가 성능, 보안 및 비용의 균형을 맞출 수 있도록 지원하는 Nutanix 에이전틱 AI 솔루션은 운영을 단순화하는 것 이상의 기능을 수행하며, 근본적으로 AI의 경제성을 최적화합니다.

토큰당 비용 최소화

풀스택 솔루션은 스마트 라우팅, 추론 확장, 토폴로지 인식 리소스 배치, 최적화된 GPU 소비를 제공하여 토큰당 비용을 절감합니다.

엔터프라이즈급 보안 및 제어 보장

Nutanix 엔터프라이즈 AI는 LLM 엔드포인트에 대한 안전한 배포 및 엔터프라이즈 제어를 제공하며, Nutanix AHV(가상화) 및 Nutanix Flow(네트워킹 및 보안)의 향상된 기능은 탁월한 격리 및 보안을 제공합니다.

개발자 속도 가속화

인프라 문제로 인한 지연 없이 기획 단계에서 프로덕션 단계로 원활하게 넘어가세요. Nutanix 엔터프라이즈 AI는 스마트 모델 라우팅 및 원클릭 보안 추론 엔드포인트와 모델 컨텍스트 프로토콜 서버에 대한 안전한 턴키 액세스를 제공함으로써 AI 툴링을 원활하게 지원합니다. Nutanix 쿠버네티스 플랫폼은 에이전틱 AI 애플리케이션 개발자를 위해 풍부한 AI 서비스 카탈로그와 프라이빗 데이터에 대한 기본 제공 액세스를 갖춘 빠른 시작 환경을 제공합니다.

에이전틱 AI의 완전한 운영화

Nutanix 에이전틱 AI 솔루션은 NVIDIA 인증 AI 팩토리와 원활하게 통합되고 이를 보완하도록 특별히 설계되었으며, 긴밀한 파트너 관계를 활용하여 Cisco, Dell, 슈퍼마이크로를 비롯한 주요 OEM 하드웨어 제조업체의 완벽한 솔루션을 제공합니다.

주요 통합 구성 요소

AI 서비스 및 쿠버네티스 플랫폼

개발자 중심의 클라우드 네이티브 환경을 통해 팀은 인프라 설정을 생략하고 예측 가능한 토큰 경제성을 갖춘 프로덕션급 에이전틱 AI 애플리케이션을 즉시 확장할 수 있습니다.

인프라 최적화 및 보안

VM 폼 팩터를 통해 가속화된 컴퓨팅의 성능을 조율하여 최대 성능과 보안을 제공함으로써 토큰당 비용을 낮춥니다.

AI를 위한 기초 데이터 서비스

스토리지 클러스터 내에서 직접 지속적인 GPU 가속 변환을 통해 학습과 추론을 연결하는 데 필요한 고성능 데이터 패브릭을 제공합니다.

AI 서비스 및 쿠버네티스 플랫폼

고급 AI 게이트웨이 및 추론 서비스

통합된 보안 추론 엔드포인트를 통해 기업은 일관된 인증, 관찰 가능성, 토큰 기반 요금 제한을 통해 프라이빗 LLM과 함께 클라우드 호스팅 모델(및 토큰 크레딧)을 사용할 수 있습니다.

모델 컨텍스트 프로토콜 지원 및 미세 조정

Nutanix 엔터프라이즈 AI는 기존의 강력한 서비스형 모델(MaaS) 기능을 확장하여 에이전트가 엔터프라이즈 툴 및 데이터 소스에 안전하게 연결할 수 있도록 지원합니다.

풍부한 AI 카탈로그를 갖춘 개방형 쿠버네티스 플랫폼

노트북, 벡터 데이터베이스, MLOps 엔진 등 사전 검증된 오픈 소스 AI 서비스 카탈로그를 사용하여 인프라 지연 없이 에이전틱 애플리케이션을 개념에서 프로덕션으로 이동하세요. 이 솔루션은 기본적으로 NVIDIA AI 엔터프라이즈와 통합되어 개발자가 Nemotron을 포함한 NVIDIA NIM을 즉시 배포하여 프로덕션 환경에서 고성능 AI 애플리케이션 개발을 가속화할 수 있도록 지원합니다.

인프라 최적화 및 보안

토폴로지 인식 최적화

Nutanix AHV 하이퍼바이저는 GPU 밀집 서버에서 워크로드 배치를 자동으로 최적화하여 성능, 보안 및 리소스 활용도를 극대화하기 위해 복잡한 수동 인프라 조정 없이 엄격한 하드웨어 조정을 보장합니다.

DPU 가속 제로 트러스트 네트워킹

새로운 DPU 오프로드 기능을 갖춘 Nutanix Flow를 활용하면 고성능 제로 트러스트 네트워크 기반을 갖춘 가상화된 환경의 정교한 격리 기능을 통해 베어 메탈의 원시 속도를 구현하여 처리량을 극대화하는 동시에 AI 팩토리 전체에서 안전하고 안정적인 데이터 흐름을 보장할 수 있습니다.

에어 갭 라이프사이클 관리

이 솔루션은 전체 NKP 플랫폼과 NVIDIA GPU 및 네트워크 운영자의 완전히 분리된 설치를 지원하므로 규제가 엄격한 환경이나 국방 부문 환경에서도 클러스터를 인터넷에 노출하지 않고 드라이버 업데이트 및 네트워크 최적화를 자동화할 수 있습니다.

AI를 위한 기초 데이터 서비스

선형 확장성

NVIDIA-엔터프라이즈 인증 AI 데이터 플랫폼인 Nutanix 통합 스토리지는 수천 개의 GPU 클라이언트에서 고속 읽기/쓰기 성능을 제공하여 컴퓨팅만큼 빠르게 데이터 가용성을 확장할 수 있도록 지원합니다.

고급 처리량

지연 시간이 짧은 데이터 경로를 제공하기 위해 NFS over RDMA와 곧 S3 over RDMA를 활용하여 GPU가 데이터에 '고갈'되지 않도록 보장합니다.

비용 최적화

KV 캐시 오프로딩을 위한 고용량 계층을 제공하여 토큰당 총 비용을 절감하고 중요한 GPU 메모리를 확보하여 성능 저하 없이 훨씬 더 큰 컨텍스트 창과 더 많은 동시 사용자를 처리할 수 있습니다.

고객이 신뢰하는 Nutanix

사례 연구

캔버라 대학교

우리는 연구 센터를 포함하여 대학 전체에서 AI 및 ML을 지원하기 위해 Nutanix를 사용하여 IT를 조정하고 있습니다.또한 학생과 교사에게 필요한 애플리케이션을 원격으로 제공하는 데도 도움이 됩니다.

- Matt Carmichael, CIO, University of Canberra

Nutanix Cloud Infrastructure (NCI):AHV Virtualization, AOS 스토리지
Nutanix Cloud Manager (NCM):Xi Beam
Use Cases:AI ML, Database-as-a-Service, End User Computing (EUC), 빅데이터, 프라이빗 및 하이브리드 클라우드
ì§ ì :APAC
리소스:사례 연구
산업:교육 산업
제품:Nutanix Cloud Infrastructure (NCI), Nutanix Cloud Manager (NCM)

2024년 2월 7일

사례 연구

IndianOil

"R&D는 Nutanix의 AI 워크로드 지원 덕분에 최소 20%% 더 효율적으로 일하고 있습니다."

- N.K. Malik, 정보 시스템 총괄 매니저, IndianOil R&D

Key Play:VMware Alternative Broadcom Compete
Nutanix Central:Prism
Nutanix Cloud Infrastructure (NCI):AHV Virtualization, Flow Network Security
Use Cases:AI ML, Business Continuity & Disaster Recovery, Private Cloud, Sustainability & IT
ì§ ì :APAC
리소스:사례 연구
산업:Oil & Gas, 정부
제품:Nutanix Central, Nutanix Cloud Infrastructure (NCI)

2026년 1월 12일

Case Study

인도네시아 중앙선거관리위원회(KPU)

"AI를 통해 법률 조사 시간을 3분 이내로 단축하여 팀 만족도를 높이고 정확한 선거 기록에 즉시 액세스할 수 있게 되었습니다."

- Andre Putra Hermawan,, PUSDATIN(Kepala Divisi Pusat Data dan Teknologi Informasi)

Industries:Government
Products:Nutanix Cloud Infrastructure (NCI), Nutanix Database Service (NDB), Nutanix Kubernetes Platform (NKP), Nutanix Unified Storage (NUS)
Resource Type:Case Study
Use Cases:AI ML, Private Cloud

2025년 12월 1일

더 많은 고객 사례

주요 리소스 살펴보기

Nutanix, 엔터프라이즈 AI 팩토리의 잠재력을 실현하는 풀스택 소프트웨어 솔루션인 Nutanix 에이전틱 AI 공개

고객이 비즈니스 혁신을 위해 에이전틱 AI를 빠르게 도입할 수 있도록 지원하기 위해 구축된 풀스택 소프트웨어 솔루션인 Nutanix 에이전틱 AI.

Nutanix:Press Releases
Use Cases:AI ML
Years:2026

2026년 3월 16일

다른 모든 워크로드와 마찬가지로 AI 실행

조직은 기존 IT 기반과 기술을 활용하여 핵심 성공 요소에 집중함으로써 인프라 복잡성을 최소화하고 쉽고 자신 있게 AI 워크로드를 배포, 확장 및 관리할 수 있습니다.

Blog Post

AI 워크로드를 위한 네트워크 성능 최적화: Nutanix와 NVIDIA의 협력적 접근 방식

AI 워크로드를 효율적으로 운영하려면 안전하고 안정적인 고성능 네트워크 인프라가 필요합니다. Nutanix는 이러한 요구 사항을 충족하도록 설계된 고도로 최적화된 네트워크 기능을 제공하여 AI 애플리케이션을 위한 강력한 기반을 제공합니다.

Products:Nutanix Cloud Platform (NCP)
Resource Type:Blog Post
Use Cases:AI ML

2025년 10월 28일

테스트 드라이브 체험하기

Nutanix 엔터프라이즈 AI를 사용하여 대규모로 AI 추론 실행

AI 테스트 드라이브 체험하기

데모를 확인해 보시겠습니까?

전문가와 상담하여 Nutanix가
하이브리드 멀티클라우드 환경에서 AI를 확장하는 방법을 알아보십시오.

자주 묻는 질문(FAQ)

Nutanix 에이전틱 AI 솔루션은 복잡성을 추상화하고 에이전틱 AI 빌더와 AI 팩토리 운영자를 원활하게 연결하는 가교 역할을 합니다. 이 풀스택 솔루션은 운영을 간소화하고, 성능과 보안을 극대화하며, 토큰 비용을 최적화하여 AI 팩토리 운영자를 위한 클라우드 운영 모델을 제공합니다. 동시에 에이전틱 AI 빌더는 혁신, 모델 관리, 빠른 추론 확장에 집중할 수 있습니다.

에이전틱 AI 빌더는 인텔리전스 구축에 집중하는 대신 모델, 도구, 데이터 사일로의 파편화된 환경을 탐색하면서 높은 수준의 "혁신 마찰"에 직면합니다. 개발자는 다양한 LLM과 오픈 소스 도구를 활용하여 단순한 채팅 인터페이스에서 실제 비즈니스 성과를 창출할 수 있는 정교한 에이전틱 AI로 빠르게 진화하는 애플리케이션을 개발할 수 있는 통합되고 안전한 경로가 부족합니다.

AI 팩토리 운영자에게 가장 큰 과제는 다음과 같은 AI 팩토리의 운영 복잡성으로 인해 토큰 생성까지 소요되는 시간 및 토큰당 비용으로 측정되는 비즈니스 가치를 제공하는 것입니다:

다양하고 빠르게 진화하는 AI 하드웨어(GPU, 네트워킹, 스토리지) 관리의 복잡성,
모델 및 데이터에 대한 안전한 액세스를 보장하고 주권 요구 사항을 준수하면서 중요한 AI 인프라에 대한 공유 액세스를 제공하는 데 따르는 복잡성
전체 AI 팩토리에서 리소스 활용도를 최적화하면서 최고의 성능을 일관되게 제공하는 복잡성.
AI 팩토리 운영을 지원하는 파편화된 맞춤형 포인트 솔루션의 수명 주기 관리의 복잡성

클라우드 운영 모델은 AI 개발자와 인프라 팀 간의 격차를 해소하기 위한 Nutanix의 접근 방식입니다. 이 모델은 파편화된 포인트 솔루션이나 복잡한 베어메탈 클러스터를 관리하는 대신 통합된 풀스택 환경을 제공합니다. 이를 통해 운영자는 클라우드 서비스처럼 쉽게 AI 인프라(GPU, DPU, 스토리지)를 관리할 수 있으며, 개발자는 수천 개의 지능형 에이전트를 확장하는 데 필요한 도구와 모델에 즉각적이고 안전하게 액세스할 수 있습니다.

Nutanix는 여러 가지 통합 효율성을 통해 토큰 경제성을 최적화합니다:

토폴로지 인식 최적화: AHV 하이퍼바이저는 GPU 밀집 서버에 워크로드를 자동으로 배치하여 하드웨어 정렬을 극대화합니다.
리소스 오프로딩: DPU(데이터 처리 장치)를 사용하여 네트워킹 및 보안 작업을 처리하면 추론을 위한 GPU 주기를 확보할 수 있습니다.
스마트 스토리지: Nutanix 통합 스토리지는 KV 캐시 오프로딩을 위한 고용량 계층을 제공하여 값비싼 GPU 메모리를 절약하고 성능 저하 없이 더 큰 컨텍스트 창을 사용할 수 있습니다.

베어메탈은 초기 모델 트레이닝의 표준이었지만, 기업에서 에이전트를 확장하는 데 필요한 보안과 격리 기능이 부족한 경우가 많습니다. Nutanix는 VM 기반 쿠버네티스 인프라를 사용합니다:

뛰어난 격리: 서로 다른 AI 워크로드 간의 멀티테넌시 및 보안 경계를 강화합니다.
규모에 맞는 관리: 더 쉬운 수명 주기 관리 및 리소스 할당.
베어메탈 성능: Nutanix는 DPU 가속 및 토폴로지 인식 기능을 활용하여 가상화된 환경의 거버넌스와 함께 베어메탈의 속도를 제공합니다.

NAI 게이트웨이는 모든 AI 모델에 대해 안전한 "정문" 역할을 합니다. 기업이 클라우드 호스팅 모델과 프라이빗 LLM을 한 곳에서 관리할 수 있는 통합 추론 엔드포인트를 제공합니다. 주요 기능은 다음과 같습니다:

거버넌스: 토큰 기반 요금 제한으로 "요금 폭탄"을 방지합니다.
관찰 가능성: 누가 어떻게 리소스를 소비하고 있는지 완벽하게 파악할 수 있습니다.
연결성: 상담원이 비공개 엔터프라이즈 데이터 및 도구에 안전하게 연결할 수 있는 MCP(모델 컨텍스트 프로토콜)를 지원합니다.

이 솔루션은 인프라 설정을 우회할 수 있는 개발자 중심 환경을 제공함으로써 "혁신 마찰"을 줄입니다. 빌더는 Nutanix 쿠버네티스 플랫폼(NKP)을 통해 다음과 같은 풍부한 AI 카탈로그에 액세스할 수 있습니다:

사전 구축된 오픈 소스 도구(노트북, 벡터 데이터베이스, MLOps 엔진).
NVIDIA NIM 및 NVIDIA 네모트론 모델 제품군을 즉시 배포할 수 있습니다.
원클릭 보안 추론 엔드포인트와 미세 조정 서비스에 대한 턴키 액세스를 제공합니다.

Nutanix 통합 스토리지는 AI 및 차세대 애플리케이션과 같은 최신 워크로드를 위해 특별히 설계된 확장 가능한 고성능 데이터 플랫폼을 제공합니다. 주요 기능은 다음과 같습니다:

추론 및 검색 증강 생성(RAG)을 포함한 AI 파이프라인의 대규모 데이터 세트를 처리하기 위한 초고속 읽기 처리량과 고밀도 올-NVMe 용량을 제공합니다.
컨테이너화된 AI/ML 파이프라인 및 클라우드 네이티브 애플리케이션을 원활하게 배포할 수 있도록 Nutanix 쿠버네티스 플랫폼과 통합됩니다.
멀티 프로토콜 데이터 액세스로 다양한 워크로드를 위한 스토리지를 간소화하고 혁신을 가속화합니다.

AI 팩토리에는 실제로 작동하는 인프라가 필요합니다

AI 팩토리를 위한 클라우드 운영 모델

토큰당 비용 최소화

엔터프라이즈급 보안 및 제어 보장

개발자 속도 가속화

에이전틱 AI의 완전한 운영화

주요 통합 구성 요소

AI 서비스 및 쿠버네티스 플랫폼

고급 AI 게이트웨이 및 추론 서비스

모델 컨텍스트 프로토콜 지원 및 미세 조정

풍부한 AI 카탈로그를 갖춘 개방형 쿠버네티스 플랫폼

인프라 최적화 및 보안

토폴로지 인식 최적화

DPU 가속 제로 트러스트 네트워킹

에어 갭 라이프사이클 관리

AI를 위한 기초 데이터 서비스

선형 확장성

고급 처리량

비용 최적화

고객이 신뢰하는 Nutanix

캔버라 대학교

IndianOil

인도네시아 중앙선거관리위원회(KPU)

관련 제품

주요 리소스 살펴보기

테스트 드라이브 체험하기

데모를 확인해 보시겠습니까?

자주 묻는 질문(FAQ)

Nutanix 에이전틱 AI 솔루션이란 무엇입니까?

Nutanix 에이전틱 AI 솔루션이 해결하는 핵심 과제는 무엇입니까?

에이전틱 AI를 위한 "클라우드 운영 모델" 이란 무엇인가요?

Nutanix는 토큰당 "비용"을 줄이는 데 어떻게 도움이 되나요?

Nutanix가 AI를 위해 베어메탈 쿠버네티스보다 가상 머신(VM)을 권장하는 이유는 무엇입니까?

Nutanix 엔터프라이즈 AI(NAI) 게이트웨이란?

이 솔루션은 에이전틱 AI 빌더의 작업을 어떻게 가속화할 수 있을까요?

Nutanix 통합 스토리지(NUS)는 AI 및 차세대 애플리케이션을 어떻게 지원합니까?