최근 수정 시각 : 2024-11-09 17:40:05

AMD RYZEN AI 300 시리즈

라이젠 AI 300 시리즈에서 넘어옴

||<-3><table width=100%><table bordercolor=#fff,#1c1d1f><tablebgcolor=#f26522><color=#fefefe> RYZEN 시리즈
||<tablebgcolor=#fff,#1c1d1f><tablebordercolor=#f26522><tablewidth=100%> RYZEN 1000 시리즈
RYZEN 2000 시리즈 RYZEN 3000 시리즈 RYZEN 4000 시리즈
RYZEN 5000 시리즈 RYZEN 6000 시리즈 RYZEN 7000 시리즈 RYZEN 8000 시리즈
RYZEN 9000 시리즈
RYZEN AI 시리즈
RYZEN AI 300 시리즈
Threadripper 시리즈 Embedded 시리즈
EPYC 시리즈 Athlon 시리즈 기타


1. 개요2. ZEN 5 제품군
2.1. Strix Point
2.1.1. 공식 발표
2.2. Strix Halo
2.2.1. 공개 전 정보 및 루머
3. 평가
3.1. 긍정적 평가3.2. 부정적 평가3.3. 복합적 평가

[clearfix]

1. 개요

2024년 6월 컴퓨텍스 타이베이에서 발표되어 동년 7월에 출시된 NPU가 내장된 ZEN 5 마이크로아키텍처 기반의 RYZEN 시리즈.

2. ZEN 5 제품군

2.1. Strix Point

||<table align=center><tablebordercolor=#f26522><rowbgcolor=#f26522><rowcolor=white><|2> 모델명 ||<|2> 소켓 ||<-3> CPU ||<-2> GPU ||<|2> PCIe
버전
총 레인수
(사용 가능) ||<|2> 메인
메모리
컨트롤러
(규격)
(MHz) ||<|2> TDP
(cTDP)
(W) ||
<rowcolor=white> 코어 구성
(일반 코어 + 컴팩트 코어)
(스레드)
동작 속도
(프리시전 부스트)
(GHz)
L3
캐시
메모리
(MB)
모델명 클럭
(MHz)
중저전력용 모바일 제품군
<colbgcolor=black><colcolor=white>Ryzen™ AI 9 HX 375 FP8 4 + 8
(8 + 16)
2.0
(~5.1)
24 Radeon™ 890M 2900 PCIe 4.0
16(16)
DDR5
5600
LPDDR5(x)
7500
(듀얼채널)
256 GB
28
(15 ~ 54)
Ryzen™ AI 9 HX 370 4 + 8
(8 + 16)
2.0
(~5.1)
24 Radeon™ 890M 2900
Ryzen™ AI 9 365 4 + 6
(8 + 12)
2.0
(~5.0)
24 Radeon™ 880M 2900
기업용 중저전력용 모바일 제품군
Ryzen™ AI 9 HX PRO 375 FP8 4 + 8
(8 + 16)
2.0
(~5.1)
24 Radeon™ 890M 2900 PCIe 4.0
16(16)
DDR5
5600
LPDDR5(x)
8000
(듀얼채널)
256 GB
28
(15 ~ 54)
Ryzen™ AI 9 HX PRO 370 4 + 8
(8 + 16)
2.0
(~5.1)
24 Radeon™ 890M 2900
Ryzen™ AI 7 PRO 360 3 + 5
(6 + 10)
2.0
(~5.0)
16 Radeon™ 880M 2900


====# 공개 전 정보 및 루머 #==== 내장그래픽이 대폭 상향될 예정으로, RDNA 3.5 아치텍처를 채용하고 그래픽코어를 16개로 늘릴 예정이다. 다만 RDNA 3 12CU인 8700G도 기본 사양에선 메모리 병목에 가까운 성능을 보이는 점, 울트라북은 전력 제한이 더 크게 작용할 거란 점을 감안하면 실성능향상은 기대보다 못미칠 가능성이 높다. 물론 3nm공정에 Zen5와 RDNA 3.5의 전성비 향상폭이 있을테니 인텔 아크 내장그래픽대비 우위는 보이겠지만.

일부 루머에서는 콘솔과 동등한 40CU를 때려박아 데스크탑 4060, 노트북 4070 MAX-Q와 거의동등한 수준이라는데, 아래의 Halo의 초기 루머랑 섞인 소리일 가능성이 높다.[1] 일부 루머나 유출에서는 하이엔드는 스트릭스 헤일로로 40CU를 때려박고 퍼포먼스 이하 라인업의 제품들은 포인트로 나뉜다는 내용도 존재한다.

인텔처럼 하이브리드 방식으로 간다는 의견도 존재한다. 물론 Phoenix 2(8500G와 8300G)가 이미 다이 하나에 Zen4+4c 하이브리드로 나왔으니 다이 개수와 상관없이 Zen5+5c 하이브리드로 못 만들 이유는 없다.

최대12코어(4×Zen 5, 8×Zen 5c) 24스레드 구성이 될 것으로 보이며 L3캐시가 24MB로 증가하였다. NPU는 XDNA2 마이크로아키텍처를 사용하고 45TOPS의 성능이 될 것으로 예상되며 CPU 전체의 성능은 77TOPS가 될 것으로 예상된다.

Strix point APU명칭이 8050/9050이 아니라 Ryzen AI 300으로 변경된다. [2] AMD가 AI 과대광고에 편승하기 위해서 모델명을 바꾼 것으로 추측되며 100과 200을 건너뛰고 300을 명명법으로 사용한 이유는 NPU를 포함한 3번째 세대 또는 인텔의 코어 Ultra 200 보다 더 높은 번호를 얻기 위해서 사용한 것으로 보인다.[3]

2.1.1. 공식 발표

  • TSMC 4nm 공정
  • 표준 TDP 감소
  • 신형 아키텍처 NPU 탑재[4]
  • 네이밍 변경
  • 전 라인업에 이종(heterogeneous) CPU 마이크로아키텍처 도입
    2024년 7월 24일에 공개된 Zen 5 마이크로아키텍처 관련 추가 정보를 통해 Zen 5 코어, Zen 5c 코어 → 클래식 코어, 컴팩트 코어로 명명되었다.
    • 클래식 코어: Zen 5 마이크로아키텍처 기반 코어
    • 컴팩트 코어: Zen 5c 마이크로아키텍처 기반 코어[5][6]
  • 신형 내장그래픽
    • RDNA 3.5 마이크로아키텍처: RDNA 3의 마이너 체인지
    • 코어 수 증가로 인한 체급 상향. 최대 12 → 16코어
  • CCX 구조와 L3 캐시 메모리 구성 변경
    클래식 코어와 컴팩트 코어를 같은 CCX내에 넣지 못해 한 다이 내에서도 클래식 CCX(4개의 Zen 5 코어, 16 MB)와 컴팩트 CCX(8개의 Zen 5c 코어, 8 MB) 해서 CCX 2개로 분할되었다[7]. L3 캐시도 클래식 코어별(16 MB), 컴팩트 코어별(8 MB) L3 공유 캐시 메모리로 분할되었다. 한 다이 내에서도 CCX와 L3 캐시가 분할된 건 Zen 2 마이크로아키텍처 이전을 떠올리기도 하지만, 그때는 일괄 4 (클래식) 코어 CCX 2개로 8코어 CCD(다이)를 구성했기에 구체적으로는 또 다르다.

2.2. Strix Halo

2.2.1. 공개 전 정보 및 루머

모바일 고급형 버전 또는 Strix Point의 데스크탑 버전이라는 루머가 있다. 피닉스가 데스크탑, 호크포인트가 모바일용으로 나온것을 본다면 가능성이 높다.

2개의 CCD에 총 16개의 Zen 5 코어와 64MB(32MB×2)의 L3 캐시가 존재하며, iGPU, NPU, I/O가 통합되어 있는 GCD가 존재하는 칩렛 구조이다. iGPU의 성능은 유출에 따르면 256bit LPDDR5X 8000MT/s에 RDNA 3.5 40CU라는 미친스펙을 지녔다. 애플의 M시리즈와 비슷하게 별도의 고대역폭 메인 메모리 및 대형 내장그래픽을 채용해 내장그래픽으로 외장급 성능을 확보하는 방법이다.

유출된 정보에 따르면 내장그래픽 성능은 90W에서 동작하는 RTX 4070 모바일과 비견되는 수준이라고 한다.[8] RDNA 3.5 40CU의 성능을 가늠하기 위해서 타 GPU와 비교를 해 보자면, 40CU 내부에는 2560개의 SP와 5120개의 FP32 유닛이 들어 있으며, 체급 상으로는 노트북용 RTX 4070(4608개의 SP)와 일치한다.[9] 그리고 비슷한 체급의 AMD GPU는 나비33 풀칩인 RX7600(XT)와[10] RX6800M, RX6850M XT[11]와 비견해 볼 수 있는 수준이다.

GPU와 V램클럭 차이 때문에 데스크탑 그래픽 카드와 비교했을 때 RX 7600/RTX 4060도 못 잡을 가능성이 더 높은 상황이다. 루머상으로는 스트릭스 헤일로가 256bit 8000MT/s 램을 사용한다고 되어 있는데, 대역폭으로 환산해보면 256GB/s이고, RX7600의 VRAM 대역폭은 288GB/s이기 때문이다. 단순히 이 비율과 비슷한 성능이 나온다고 가정하면 RX7600의 89% 정도가 된다.[12][13]

이상의 정보를 종합 시 GeForce 50은커녕 GeForce 40 모바일과 비교해도 최대 성능과 전성비 모두 밀릴 것이 확실시되는 상황이라 가성비 게임용 제품으로서만 승부해야 한다. 이전에 유사한 컨셉으로 나온 인텔의 카비레이크-G[14]하고도 비교하면 고성능을 유지하며 노트북을 작게 만든다는 장점은 있을 것이며, 인텔 CPU에 AMD GPU가 묶이는 일을 경계한 엔비디아의 견제에 더해 라이젠 이후 인텔이 AMD 견제를 위해 빠르게 단종하여 판매량이 신통치 않았던 카비레이크 G와 다르게 AMD가 자체적으로 판매를 끌고 갈 수 있기에 사정이 좀 더 나을 것이다.

인피니티 캐시와 비슷한 역할을 할 것으로 예상되는 32MB의 MALL 캐시가 존재하여 병목현상을 줄여준다고 한다. NPU는 XDNA 2 엔진이 있으며 50TOPS의 성능이며 CPU와 GPU를 포함한 성능은 100TOPS 이상일 것으로 추청된다.[15]

3. 평가

3.1. 긍정적 평가

  • Strix Point의 내장 그래픽 성능
    노트북들의 쿨링 능력은 갈수록 신장되는 추세로, 특히 16인치 노트북들에선 30-40W 이상의 전력인가를 지속할 수 있는 경우가 꽤 흔해지고 있다. 이러한 고전력 구간에서는 체급이 올라간 내장그래픽이 더욱 빛을 발할 수 있다. 아키텍처 마이너 체인지 또한 긍정적인 부분으로, RDNA3가 RDNA2대비 퇴보한 IPC로 구설수에 올랐음을 감안하면 이러한 행보는 환영받을만하다. 유일한 흠이 있다면 CPU 코어 수 증가로 인해 동 TDP에서 CPU 각 코어와 GPU에 할당할 수 있는 전력이 낮아져 20W 미만의 구간에서는 게임성능이 되려 퇴보했다는 점이다. #

3.2. 부정적 평가

  • 높은 코어 간 통신 레이턴시
    일반 코어와 컴팩트 코어를 같은 CCX에 넣지 못해[16], 코어 간 레이턴시가 최대 200ns 가량에 달하는 것으로 드러났다. 메테오 레이크에서 아예 다른 타일에 있는 LP-E코어의 레이턴시가 120ns 수준이고 이 부분에서 평가가 나빴음을 고려하면 상당히 우려스러운 수준인데, 코어 수 상향에 따른 작업의 병렬화 수준이 높아질수록 코어 간 레이턴시는 상당히 중요하기 때문이다.

    다만 Apple Silicon M 시리즈도 비슷한 수치가 나오는 결과가 있고, 캐시 일관성(cache coherence)이 훨씬 중요하다는 이야기가 있는데, 실제 체감 성능에 어느 정도 영향을 주는지는 검증이 필요하다. 게다가 HW 구조상 7000 시리즈와 별 차이 없는 9000 시리즈도 X 제품군 출시 초기에는 AI 300 시리즈와 비슷하거나 약간 더 나쁜 레이턴시를 보였다가 AGESA 업데이트로 해결되었기에 설정(펌웨어) 문제일 가능성도 있는데, AI 300 시리즈에 대한 관심이 떨어져서 그런지 개선/해결 여부에 대한 언급이 없어 전망도 불투명한 상황.

3.3. 복합적 평가

  • 컴팩트 코어
    컴팩트 코어가 전면적으로 도입된 첫 세대이고, 인텔 12세대 코어 i 시리즈의 하이브리드 프로세서에 포함된 E-코어와 마찬가지로 이에 대해서는 평가가 엇갈린다. 인텔이 스케줄링 난이도 증가라는 리스크를 감수하면서도 E-코어라는 모험을 강행한 것에는 P-코어 아키텍처 대형화를 통해 성능 향상을 꾀하고 이로 인해 나타나는 부작용인 저전력 구간 전성비 후퇴 및 면성비 감소로 인한 단가 증가를 억제하여 두 마리 토끼를 잡는다는 명확한 목적이 있어서였다.
    라이젠의 컴팩트 코어는 인텔의 그것과는 확연히 결이 다른데, 인텔 P-코어와 E-코어의 아키텍처가 서로 다른 것과 다르게 라이젠의 클래식 코어와 컴팩트 코어의 아키텍처는 서로 동일하고 2대1 SMT까지 그대로 지원하여 성능 격차도 더 적어 스케줄링 미스가 나는 경우에도 성능 손해가 훨씬 더 적다. 하지만 반대급부로 전성비·면성비 이득 역시 인텔에 비해 상대적으로 적은 것이 함정이다. 라이젠의 경우는 애시당초 그렇게까지 거대한 아키텍처도 아니었고, 전성비와 면성비도 상당히 앞서 있는 상황이어서 성공해도 이득이 그렇게 크지 않을 것인데 굳이 없는 리스크를 만들어야 했냐는 것에 대해 평가가 갈리는 것은 피하기 어려우며, E-코어 도입 후에도 P-코어 숫자를 최대 6 ~ 8개로 유지시켜준 인텔과는 다르게 최상위 라인업에서조차 겨우 4개밖에 넣지 않은 Strix Point는 이 부분에서 감점 요인이 있기도 하다.
    인텔 E-코어처럼 전성비보다 면성비를 중시했다는 분석이 있다[17] #.


[1] 심지어 이중삼중 짜깁기를 했는지 40CU로 데탑 4070 잡을거란 루머도 있다(.......) [2] 처음에는 레노버에서 8050시리즈로 유출되었지만 # 이후 레노버 관계자의 발표에 따르면 사실이 아니라고 하였고 # 레노버에서 유출 하루 뒤 ASUS에서 Ryzen AI 9 HX 170라는 모델명이 확인되었다. # ASUS의 유출 2주 뒤 Ryzen AI 9 HX 370이라는 모델명이 유출되었다. # [3] AMD에서 메인보드 칩셋명을 700을 생략하고 인텔과 같은 800번대 칩셋을 출시하는 것을 보면 인텔을 의식해서 명명법을 변경했을 가능성이 높다. [4] 3세대 라이젠 AI탑재 [5] Zen 5 코어 대비 25% 작지만 Zen 5코어와 IPC와 ISA가 동일하다. TSMC 3nm 공정을 사용했다. [6] Strix Point의 모든 Zen 5c 코어의 클럭은 2.0 ~ 3.3GHz이다. [7] AMD RYZEN 8000 시리즈부터 도입, 특히 8000 시리즈는 저가형/저전력 제품에 한정해서 컴팩트 코어가 들어간 셈이기에 8440U는 총 4코어인데 2 CCX라는 변태적인 구성을 선보였다. [8] 데스크탑 RTX 4070급의 성능을 낼 것이라고 혼동하여 잘못된 정보가 확대 재생산되는 경우도 있지만, 데스크탑용 RTX 4070(5888SP)가 아닌 노트북용 RTX 4070(4608SP)을 의미하는 것이다. 노트북용 RTX 4070은 90W TDP에서는 Time Spy 그래픽 스코어 기준 11,500점 수준의 성능을 낸다. [9] 물론 에이다 러브레이스와 RDNA3의 실성능이 FP32 갯수와 일치하지는 않는다. [10] RDNA 3 36CU에 128비트 GDDR6이 들어있다. [11] RDNA2 40CU가 들어있다. [12] 실제로도 7840U, 8840U 계열에 들어있는 12CU GPU는 램 대역폭에 발목이 묶여서 제 성능을 못 내고 있기 때문에 합리적인 추정이다. 데스크탑용 RDNA 3 APU 내장그래픽도 램 대역폭의 한계로 인하여 발목이 묶여 12CU 제품과 8CU 제품간의 실제 게임성능 차이가 고작 10%밖에 벌어지지 않았다. [13] 다만 가정이지만 8533MT/s 램을 쓰거나, RDNA 3.5에서 RDNA 3 대비 델타 컬러 압축 기술 등을 발전시켜 동일 대역폭이라도 효율을 더 개선하는데에 성공했다면 충분히 Time Spy 11,000점 급의 성능을 낼 수 있다. 또한 실제 사용 환경에서 CPU 및 RAM이 밀접하게 붙은 일체형에 가까운 구조를 가질 것으로 예상되기에 필요한 하드웨어 단계 로직이 줄어들어 레이턴시가 개선되면서 실질적인 체감 성능은 크게 안 밀릴 수도 있다. [14] 2017년 발표 당시 탑재된 GPU가 모바일용 RX 560을 능가하는 스펙을 가졌으며, 성능이 당대 본격적인 게임용 GPU의 최소로 여겨졌던 GTX 1050을 가뿐히 넘었었다. [15] # [16] AMD RYZEN 8000 시리즈도 마찬가지였고 특히 8440U는 총 4코어인데 2 CCX라는 변태적인 구성을 선보였지만, 명백히 저가형/저전력 제품에 한정해서 컴팩트 코어가 들어간 셈이기에 전혀 이슈화되지 않았다. [17] 절대적으로 전력을 퍼먹지는 않지만, 동일 성능 기준으론 기존 코어(P-코어)의 클럭을 낮춰서 맞추는 게 오히려 전력을 덜 쓴다.

파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 문서의 r211에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r211 ( 이전 역사)
문서의 r211 ( 이전 역사)