크롬 브라우저 및 크롬 앱을 사용하면 자동 한국어 번역 기능을 통해 손쉽게 읽을 수 있어요
AMD 주가 전망
요약
엔비디아가 AI 가속기의 데이터 센터 부문을 장악함에 따라 AMD는 수익을 늘릴 수 없었습니다.
AMD와 엔비디아 하드웨어에는 몇 가지 주요 차이점이 있으며 전반적으로 엔비디아는 더 나은 제품을 제공합니다.
AMD의 FPGA 진출은 독특한 경쟁 포지셔닝으로 이어질 수 있으며 낙관적인 이유를 제시합니다.
ChatGPT의 출시는 최근 반도체 주식의 급등을 촉발한 촉매제로 널리 알려져 있습니다. 이는 AI 애플리케이션의 잠재력을 전 세계에 보여주었습니다. 기업들은 가능한 한 AI를 구현하는 방법을 결정하기 위해 경쟁했고 이로 인해 AI를 대규모로 실행하는 데 필요한 하드웨어에 대한 수요가 급증했습니다. 그 결과, 선도적인 AI 하드웨어 제공업체인 엔비디아(NVDA)의 수익이 급증했습니다.
기업에는 AI에 대해 크게 두 가지 옵션이 있습니다. 온프레미스 데이터 센터에서 실행하거나 클라우드에서 용량을 임대할 수 있습니다. 클라우드는 전통적인 CPU에서 가속화된 GPU 워크로드로 광범위하게 전환되고 있는 전체 데이터 센터 컴퓨팅의 점점 더 많은 부분을 차지하므로 3대 CSP(클라우드 서비스 제공업체)의 CapEx가 엔비디아의 손익계산서에 유입됩니다. Meta(META) 또는 Tesla(TSLA)와 같은 대기업도 온프레미스 데이터 센터를 구축하기 위해 GPU의 주요 구매자였습니다. 엔비디아 하드웨어에 대한 수요는 모든 각도에서 발생했으며 2023년 내내 회사는 공급이 제한되었습니다.TSMC의 4N 프로세스 노드 내의 CoWoS 고급 패키징은 수요 급증으로 인해 빠르게 병목 현상이 발생했습니다. 이에 따라 TSMC는 공격적으로 생산능력을 확장해 왔지만 엔비디아의 블랙웰 플랫폼은 여전히 공급 제약이 있을 것으로 예상됩니다.
기업들이 이러한 제약과 씨름하면서 자연스러운 선택은 대안을 찾는 것이었습니다. Advanced Micro Devices(NASDAQ: AMD)는 엔비디아의 Hopper 플랫폼에 대한 최상의 대안으로 널리 받아들여지는 가속기 제품군을 제공합니다. AMD의 주력 가속기인 MI300X도 TSMC의 CoWoS 패키징을 사용하여 로직과 메모리를 결합합니다. TSMC는 2023년 중반에 CoWoS 공급량의 절반이 AMD로 갈 것으로 예상한다고 밝혔습니다. 그럼에도 불구하고 AMD는 엔비디아를 크게 저조했으며 2022년 11월 이후 반도체 지수를 거의 앞지르지 못했습니다. 이러한 저조한 성과의 이유는 AMD가 수익을 늘릴 수 없기 때문입니다. 최근 역사상 가장 극심한 반도체 수요 급증 속에서 AMD는 가장 가까운 경쟁자인 엔비디아에게 완전히 뒤처지고 있습니다.
제품 차이점
엔비디아가 승리하고 AMD가 승리하지 못한 이유를 평가하기 위해 데이터 센터에서 엔비디아와 AMD 하드웨어 간의 몇 가지 주요 차이점을 살펴보겠습니다. 여기에는 1) 칩렛 접근 방식, 2) CPU 명령어 세트 아키텍처, 3) 소프트웨어가 포함됩니다.
칩렛과 모놀리식
AMD의 MI350X는 칩렛 접근 방식으로 제작되었습니다. 이 접근 방식에는 칩의 독립적인 구성 요소를 분할하고 별도로 구축하는 작업이 포함됩니다. CPU 코어, GPU, I/O 다이 및 HBM 메모리는 별도로 제작되어 공통 기판에 통합됩니다. 그런 다음 AMD는 "Infinity Fabric" 네트워킹을 사용하여 이러한 칩렛을 서로 연결합니다. 이는 PCIe 버스와 유사하지만 더 많은 메모리 대역폭을 갖습니다.
칩렛 접근 방식은 트랜지스터 수에 따라 확장되는 제조 비용을 전체 칩에 대해 극적으로 낮춥니다. 또한 회사가 다양한 칩 세대에 걸쳐 IP를 재사용하거나 "수집"할 수 있으므로 더 많은 유연성을 제공합니다. AMD가 차세대 GPU를 탑재한 제품을 출시하려는 경우 다른 모든 칩렛을 업데이트할 필요 없이 이를 새 칩에 패키징할 수 있습니다.
이는 동일한 장치 내에서 가속기, I/O 및 로컬 메모리를 함께 설계하는 엔비디아의 접근 방식과 대조됩니다. 그런 다음 GPU는 고대역폭 메모리(HBM)와 함께 패키지되어 통합 컴퓨팅 장치로 번들됩니다. 엔비디아 B100에는 수십억 개의 트랜지스터가 있으므로 제조 비용이 매우 많이 들고 칩렛 설계보다 결함 위험이 더 높습니다. 엔비디아의 Hopper 및 Blackwell 칩은 실제로 단일체가 아닙니다. HBM은 여전히 분리되어 있지만 MI300X보다 더 모놀리식합니다.
엔비디아의 접근 방식은 전체 데이터 센터 랙을 대상으로 합니다. NVLink 네트워킹을 통해 고객은 전체 GPU 랙을 하나의 컴퓨팅 장치로 처리할 수 있습니다. CUDA 기능과 결합하여 데이터 센터 주변의 데이터를 리디렉션하여 GPU를 초과 구독하고 사용되지 않는 용량을 활용합니다. 이 접근 방식을 사용하면 전체 데이터 센터는 Jensen이 부르는 것처럼 기본적으로 하나의 전체 AI 공장이 됩니다. 워크로드는 전체 데이터 센터에 분산되고 다양한 GPU에 걸쳐 병렬화될 수 있습니다. 또한 엔비디아는 공동 패키지 Grace CPU를 포함하는 H200/B200에 칩렛과 같은 접근 방식을 채택했습니다.
제가 아는 바로는 AMD에는 아직 이 기능이 없습니다. 지금까지 전체 데이터 센터를 훈련 및 추론을 실행하는 공장으로 취급하는 엔비디아의 접근 방식은 보다 비용 효율적인 개별 칩에 대한 AMD의 접근 방식을 압도하고 있습니다.
ARM 대 x86, CPU 차이점
H200 및 MI350X 플랫폼 모두 GPU와 CPU를 갖추고 있습니다. 칩렛 접근 방식에 비해 모놀리식의 이점 중 하나는 온칩 데이터 전송이 더 효율적이기 때문에 전력 소비가 줄어든다는 것입니다. 엔비디아의 경우 이는 ARM Holdings(ARM) 축소 명령어 세트 아키텍처를 기반으로 구축된 Grace CPU 아키텍처로 인해 더욱 복잡해졌습니다. 반면 Zen 코어는 x86 복잡한 명령어 세트 아키텍처를 기반으로 구축되었습니다. ARM의 주요 이점 중 하나는 에너지 효율성입니다.
따라서 엔비디아의 ARM CPU 및 모놀리식 설계는 칩에서 얻은 가치에 비해 더 나은 TCO(총 소유 비용)에 기여합니다. 엔비디아에 따르면 현재 H100에 지출된 1달러는 고객에게 4년 동안 5달러의 수익에 기여할 것입니다.
데이터 센터 운영자의 전력 소비에 대한 관심이 높아지면서 여기서는 엔비디아의 가치가 AMD보다 계속해서 빛날 것이라고 생각합니다.
소프트웨어: CUDA 대 ROCm
엔비디아는 일반적으로 Apple(AAPL)의 "벽으로 둘러싸인 정원"과 유사한 하드웨어, 소프트웨어, 네트워킹 스택을 유지해 왔습니다. 엔비디아는 고객을 위한 원스톱 상점으로 모든 것을 제공할 것입니다. 그러나 당신은 그것에 대한 대가를 지불할 것입니다. 경험은 역사적으로 고객이 벽으로 둘러싸인 정원에 머물고 싶어하는 모든 대안보다 우수했지만 업계에서는 이러한 종속에 대해 경계하는 조짐을 보이고 있습니다. AMD와 Intel(INTC)은 모두 범용 GPU를 제공하지만 엔비디아의 약 80% 시장 점유율 중 미미한 부분을 공유합니다. 반면, 주요 CSP와 Meta 및 Tesla와 같은 대기업은 모두 맞춤형 애플리케이션별 가속기를 설계하기 시작했습니다. 증가하는 경쟁 위협에도 불구하고 엔비디아는 여전히 지배적입니다. 왜?
뛰어난 성능. 많은 분석가들이 지적했듯이 엔비디아의 하드웨어는 AMD나 Intel의 하드웨어보다 나을 것이 없습니다. 서류상으로는 사양이 매우 유사합니다. 그러나 엔비디아는 하드웨어 활용에 있어 무리에서 벗어납니다. CUDA를 사용하면 개발자가 하드웨어를 보다 효과적으로 활용할 수 있습니다. 대부분의 경우 GPU 코어는 메모리에서 검색할 수 있는 것보다 더 빠르게 데이터를 처리할 수 있으므로 '초과 구독'이 필요합니다. 이는 특정 코어의 로컬 캐시 메모리에 한 번에 처리할 수 있는 것보다 더 많은 데이터를 로드한다는 의미입니다. 한 작업을 완료하면 더 많은 데이터가 메모리에서 검색되는 동안 다른 작업이 시작되기를 기다리고 있습니다. CUDA는 엔비디아 하드웨어용으로 제작되었습니다. AMD GPU를 프로그래밍하려면 ROCm의 작동 방식을 알고 CUDA에서 ROCm으로 변환할 수 있는 개발자가 필요합니다(엔비디아에서 AMD 하드웨어로 전환하는 경우).
ZLUDA 프로젝트는 개발자가 CUDA 코드를 ROCm 플랫폼으로 포팅하는 데 도움이 되지만 버튼을 클릭하는 것만큼 간단하지 않고 완료됩니다. CUDA는 엔비디아가 구축한 풍부한 생태계 덕분에 여전히 뛰어난 성능을 유지하고 있습니다. CUDA는 AI를 구축하기 위한 광범위한 라이브러리, 대규모 하드웨어 설치 기반, 경험이 풍부한 개발자 인력, ROCm보다 더 나은 문서를 제공합니다. CUDA 개발자를 찾고 고용하는 것이 더 쉬우며 광범위한 문서/라이브러리를 통해 CUDA를 중심으로 구축하기가 쉽습니다. ROCm은 해야 할 일이 많습니다.
요약
전반적으로 AMD는 데이터 센터에서 엔비디아에 비해 의미 있는 진전을 이루지 못하는 것으로 보입니다. MI300X 램프가 잘 진행되고 있는 동안 AMD는 엔비디아의 점진적인 매출 성장을 보여주지 못했습니다. 엔비디아는 AMD보다 더 나은 성장, 더 나은 마진, 더 강력한 경쟁 포지셔닝 및 훨씬 더 넓은 해자를 가지고 있습니다. 데이터 센터는 이야기의 큰 부분을 차지하므로 AMD 투자자에게는 좋지 않지만 여전히 낙관할 이유가 있습니다.
별로 숨겨지지 않은 상승 가능성
AMD가 Xilinx 인수를 통해 FPGA(Field Programmable Gate Arrays)에 큰 투자를 했다는 것은 비밀이 아닙니다. FPGA는 한쪽에는 범용 CPU와 GPU가 있고 다른 한쪽에는 ASIC(주문형 집적 회로)이 포함된 스펙트럼의 중간에 존재합니다. ASIC은 완전히 특정 기능을 위해 특별히 제작된 반면, 범용 하드웨어는 전반적으로 가능한 최고의 성능을 제공하도록 제작되었습니다. 범용 하드웨어는 ASIC이 구축된 특정 사용 사례에서 ASIC 성능을 저하할 가능성이 높습니다.
특정 사용 사례에 맞게 초기 제조 후 FPGA를 다시 배선하고 다른 목적으로 변경할 수 있습니다. 이는 AMD의 모듈식 접근 방식을 기반으로 하며 공통 FPGA 베이스보드를 구축하고 이후에 다양한 하드웨어 최종 용도에 맞게 수많은 사용자 정의 버전을 만들 수 있습니다. 데이터 센터에 최적화된 I/O, 모바일 SoC에 최적화된 전력 효율성, AI PC에 최적화된 지연 시간 등 AMD는 다양한 사용 사례에 적합한 견고한 하드웨어를 제공할 수 있습니다. AMD의 경쟁력 있는 포지셔닝은 "AI 공장" 공급업체로서의 엔비디아의 위치 대신 데이터 센터에서 엣지까지 모든 AI에 대한 원스톱 상점이 될 수 있습니다. AMD의 모듈식 접근 방식과 FPGA가 제공하는 유연성을 통해 AMD는 적은 비용으로 매우 경쟁력 있는 하드웨어를 제공할 수 있습니다. AMD가 새로운 수요를 포착하거나 엔비디아의 지분을 빼앗아 충분한 성장을 촉진할 수 있다면 회사는 수익성 있는 데이터 센터 부문에서 엔비디아의 차선책으로 확고히 자리잡으면서 운영 레버리지를 의미있게 확장할 수 있습니다.
결론
AMD는 시가총액 측면에서 엔비디아보다 훨씬 작지만 투자자들이 낙관하는 데에는 여전히 몇 가지 이유가 있습니다. 업계는 역사적으로 대규모 인프라 구축을 진행하고 있으며 현재 AMD가 엔비디아보다 뒤처져 있지만 더 넓은 산업의 급속한 성장이 이를 지원할 가능성이 높습니다. 게다가 이 회사는 엔비디아의 값비싼 기계에 비해 더 비용 경쟁력 있는 제품으로 자리매김하고 있습니다. AI 산업은 아직 초기 단계이고 빠르게 발전하고 있지만, 산업 성장은 기본적으로 낙관적입니다. 그러나 저는 AMD가 가까운 미래에 이미 상당한 가격을 책정한 준결승전보다 낮은 성과를 낼 것으로 예상합니다. 이러한 이유로 저는 1년 반 동안 수익 성장이 보이지 않으면서 10배의 매출로 거래되는 회사에서 많은 기회를 볼 수 없기 때문에 AMD를 현재 수준에서 보류로 평가합니다.