상위 문서: 인텔 코어 Ultra 시리즈
Intel® Core™ Ultra 시리즈 및 마이크로아키텍처 | |||||
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1px -11px" |
Optimization 최적화 |
Process · Optimization 공정 미세화 · 최적화 |
Process · Architecture 공정 미세화 · 마이크로아키텍처 변경 |
||
Intel 7 |
Intel 4 + TSMC N5 · N6
|
TSMC N3B · N6 | |||
인텔 코어 i 시리즈 참조 |
1세대[L]
● Meteor Lake 메테오 레이크 (2023) ( Redwood Cove 레드우드 코브 + Crestmont 크레스트몬트) |
2세대
● Lunar Lake 루나 레이크 (2024)[L] ( Lion Cove 라이언 코브 + Skymont 스카이몬트) |
|||
Process · Architecture 공정 미세화 · 마이크로아키텍처 변경 |
|||||
TSMC N3B · N5 · N6 | |||||
2세대
● Arrow Lake 애로우 레이크 (2024) ( Lion Cove 라이언 코브 + Skymont 스카이몬트) |
3세대
● Panther Lake 팬서 레이크 (2025) (Panther Cove 팬서 코브(가칭) + Darkmont 다크몬트(가칭)) |
||||
사용 모델은 ●으로 표시 | |||||
1. 개요
인텔 코어 Ultra 시리즈의 2세대 CPU 버전이다.코어 i 시리즈 네이밍의 연장선으로 인텔 15세대라고도 불린다.
코어 Ultra 시리즈 최초로 데스크탑 제품군 CPU 모델이 출시된다.[1]
2. 공통
코어 울트라 2세대는 대상 플랫폼에 따라 루나 레이크와 애로우 레이크로 나뉜다. 공통적으로 이 두 제품군은 같은 CPU 아키텍처인 라이언 코브와 스카이몬트 아키텍처가 들어가게 된다.P-코어로 활용이 되는 라이언 코브 아키텍처는 명령어 디코더가 6-Wide 에서 8-Wide로 확장이 되며, 그 외에도 백엔드에 위치한 정수, 부동소숫점 등의 유닛이 확장이 되어 메테오 레이크에 탑재된 레드우드 코브에 비해 IPC +14%의 성능 향상폭을 가진다. 해당 아키텍처에 관한 자세한 설명은 다음 항목으로.
E-코어로 활용이 되는 스카이몬트 아키텍처는 명령어 디코더가 6-Wide에서 무려 9(3×3)-Wide로 확장되었으며[2] 비순차 처리 규모의 대폭 확장, 2배 가량의 백엔드 연산유닛 확장으로 인해 (기존 LP-E 코어와 비교 시) 정수 IPC +38%, 부동소숫점 IPC +68%라는 성능 향상을 이뤄냈다. 이는 13세대 인텔 CPU의 빅코어로 들어가던 랩터 코브와 비교시 정수, 부동소숫점 모두 +2% 향상된 수준의 IPC라고 한다. 해당 아키텍처에 관한 자세한 설명은 다음 항목으로.
하이퍼스레딩이 빠졌고, 스케줄러의 변경으로 E-코어 우선적인 작업 배분이 이뤄진다. 사실 SMT는 10% 이상의 면적을 잡아먹으며 각종 Hazard와 보안 문제를 일으키기 때문에 차라리 SMT를 빼고 여분의 공간에 추가적인 디코더, ROB와 캐시를 넣어서 높은 IPC를 구현하는 것이 현대의 CPU 설계 기조라서[3] 얼핏 보면 인텔이 최신 트렌드를 충실히 따라가는 것으로 보일지 모르나 이는 표면적인 현상일 뿐, 실제로는 기획 단계에서부터 의도하고 뺀 것이 아니라 개발 과정에서 문제가 생겨 뺀 것이라는 루머가 파다하다.
3. 모바일 저전력용: 루나 레이크
===# 출시 전 정보 #===루나 레이크는 저전력 모바일용으로 설계된 제품군이다. 정격전력 8~17W[4]로, 메테오 레이크-U 라인업을 대체하는 것에 골자를 두고 있다.
-
CPU
CPU 면에서 봤을때 전작인 메테오 레이크-U와 비교하면 2개의 성능 코어 + 8개의 효율 코어 + 2개의 LPE 코어(12코어 14스레드)에서 4개의 성능 코어 + 4개의 효율 코어(8코어 8스레드)로 코어 수로만 비교하면 성능이 줄어든 것 처럼 보이는 착시효과가 존재한다. 그러나 실제 성능과 관련이 있는 성능 코어는 2개에서 4개로 증가했다는 점[5], 효율 코어의 개수는 절반으로 줄어들었으나 개별 코어의 IPC가 랩터 코브와 유사한 수준으로 늘어났다는 점[6], 그리고 인텔 메테오레이크의 LPE 코어는 아예 별도의 다이에 위치하여 idle 환경이 아니면 아예 켜지지도 않는다는 점을 감안하면 오히려 업그레이드 되었다는 평이 중론.
코어 수의 차이로 인해 AMD의 스트릭스 포인트나 6개의 P-코어를 탑재한 Core Ultra 7 1세대(28W)를 잡기는 어렵고, 대략적으로 AMD의 크라켄 포인트나 4개의 P-코어를 탑재한 Core Ultra 5 1세대(28W)와 유사한 멀티코어 성능을 가지며, 이 제품들이 경쟁 상대가 될 것으로 예상이 된다. 실제로 유출된 벤치마크 결과를 보면 Geekbench 6.2 기준으로 멀티코어 성능이 11400점인것으로 나오는 상황이다. 이 점수는 Core Ultra 5 1세대의 성능과 정확히 일치한다.
통합 메모리 구조와 E코어 아키텍처·공정 일신으로 인해 루나 레이크는 특히 극저전력 구간에서의 전성비를 크게 높이는데 성공했으며, 인텔은 루나 레이크가 ARM이 더 전성비가 좋다는 관념을 깨뜨릴 것을 자신하고 있다.[7]
인텔의 2024년 8월 Hot Chips 발표 자료에 따르면 P-LP(E) 코어 간 레이턴시 및 LP E 코어 클러스트 내 코어 간 레이턴시가 극적으로 개선되었다고 한다. [8]
-
GPU
내장 GPU는 베틀메이지 아키텍처 2세대 Xe 코어 8개가 들어간다.[9] 코어 1개당 들어가는 EU의 갯수가 알케미스트 기반 1세대 Xe 코어 대비 16개에서 8개로 감소했으나, 대신 1개의 EU당 들어있는 연산유닛의 수가 8개에서 16개로 늘어나 결과적으로는 동일한 체급이다. 하나의 FP32 연산유닛은 ADD + MUL 2 ops를 수행하므로 Xe2 코어는 한 사이클당 256 ops의 FP32 연산을 수행한다.
1024개의 SP는 전작인 메테오 레이크-H에 들어가는 8 Xe 코어와 동일한 수준이며, 메테오 레이크-U에 들어가는 4 Xe 코어 GPU에 비교하면 2배 가량의 성능향상폭을 가진다. 인텔 측에서는 전작 대비 50%의 성능 향상이 이뤄졌다고 주장하고 있지만, 실질적으로 GPU의 TOPS 수를 통해 클럭을 역산하면 최대 2.04GHz가 나오고[10], 이는 메테오 레이크-H보다 오히려 떨어지는 수준이다.
따라서 결론적으로는 최대 성능 자체는 8 Xe 코어가 들어간 메테오 레이크-H와 비교시 비슷하지만, 전력 소모를 비교하면 60fps로 3DMark를 구동 시 메테오 레이크는 25~29W를 소비하는 반면 루나 레이크는 같은 인터포저 상에 적층된 메모리까지 포함해서 14~18W를 소비한다고 한다. 인텔 측의 50% 성능 향상 또한 최대 성능 향상폭이 아닌 동일 전력대에서의 향상폭일 가능성이 매우 높다.[11]
그리고 실제로 유출된 Time Spy Graphic Score 또한 3000점대 후반의 점수를 보이며 메테오 레이크-H GPU의 1.5배가 아닌 소폭 향상에 그치는 모습을 보여주고 있다. 루나 레이크는 PL1 17W, PL2 30W의 스펙을 가지고 있으며, 제품의 컨셉상 기존의 U 라인업의 전력을 소모하며 H 라인업 급의 성능을 보여주는 것을 목표로 만들어진 CPU이기 때문에 최대 60W까지 집어먹는 메테오 레이크-H 라인업 대비 1.5배 수준의 성능 향상은 애초에 불가능했다.
전력효율은 충분히 상승한 셈이나, 스트릭스 포인트나 크라켄 포인트와 경쟁하며 핸드헬드 게이밍 PC에 활용되기 위해서는 3DMark 점수가 잘 나온 만큼 게임도 잘 돌릴 수 있어야 하는데, 게임 최적화가 얼마나 잘 진행될지에 관해서는 출시가 되어야 알 수 있을 듯 하다.
-
NPU
NPU는 인텔의 4세대 NPU가 탑재된다. Core Ultra 7 기준으로 6개의 타일이 들어가며, 각 타일은 8비트 정수 연산을 기준으로 2048 MAC per cycle을 수행하며 16비트 부동 소숫점 연산을 1024 MAC per cycle을 수행할 수 있는 512-Wide MAC Array가 탑재된다. 인텔측의 설명에 따르면 전작인 메테오레이크에 들어간 3세대 NPU에 비해 4배의 성능인 48TOPs의 성능을 낼 수 있다고 하며, CPU와 GPU 내의 XMX, 그리고 NPU를 모두 조합하면 총 120TOPs의 AI 연산 성능을 낼 수 있다고 홍보하고 있다.
-
생산공정 및 출시일정
일반적인 사용과는 별로 관련이 없는 NPU를 제외하면 가장 큰 변화가 있었던 부분은 생산공정 분야이다. 2개의 타일이 전량 TSMC 제로 주문이 되었으며 연산을 담당하는 파트의 다이는 TSMC의 3nm 공정인 N3B, 그리고 IO를 담당하는 다이는 TSMC N6으로 생산이 이뤄졌다. 전작인 메테오레이크의 CPU가 인텔 4, GPU가 TSMC N5였던 점을 감안하면 공정 면에서 일신이 이뤄진 셈이다.
루나 레이크의 출시가 지연된다는 루머가 있었으나, 인텔은 부인했다. 2024년 9월 3일에 공식 출시되는 것으로 확정되었다. 이로써 출시가 지연된다는 루머는 거짓인 것으로 드러났다.
3.1. 제품
자세한 내용은 인텔 코브 마이크로아키텍처/사용 모델 문서의
루나 레이크
부분을
참고하십시오.3.2. 성능 및 전성비 분석
루나 레이크의 CPU 성능 및 전성비는 어떤 벤치마크로 분석을 했는가? 어떤 웹진에서 측정했는가? 싱글코어인가 아니면 멀티코어인가? 실사용에서의 전력 효율은 어떠한가? 에 따라서 평가가 크게 갈리는 상황이다.Arc V140 GPU의 성능 또한 벤치마크 기준인가 아니면 게임 기준인가? 게임 성능은 누가 측정했는가? 에 따라서 구도가 판이하게 나뉘어진다. 본 문단에는 신뢰할 수 있는 다양한 자료를 첨부했으며, 판단은 독자의 몫이다.
3.2.1. CPU
- 싱글코어 성능 및 전성비 [ 펼치기 · 접기 ]
- ||<width=50%>
||
||
루나 레이크 CPU 성능 지표
시네벤치 2024 멀티코어는 절전 모드 406점, 표준 모드 497점, 최대 성능 모드에서 602점의 성능을 보여주며 529점인 Ultra 7 165U 보다는 앞서지만 882점, 912점의 점수를 내는 Ultra 7 155H와 8840HS에 비해서는 더 낮다. Geekbench 6에서 역시 메테오레이크-U 대비는 우위, 메테오 레이크-H나 AMD의 8코어 라인업과 비교해서는 열세이다.
시네벤치 2024 기준 루나 레이크 CPU 전력 대비 효율
SPEC 2017 기준 루나 레이크 CPU 성능 및 IPC
칩스 앤 치즈 측의 자료에 따르면 Zen 5와 비교시 IPC는 우세, 클럭을 감안한 총 성능은 동등하며, 두 번째의 자료에 다르면 Zen 5와 비교시 IPC는 동등, 클럭을 감안하면 소폭 열세이다. 특이사항이라면 E 코어인 스카이몬트 아키텍처의 정수 연산 IPC가 Zen 4와 거의 비슷하며, 부동 소숫점 연산 IPC는 이전 세대의 P코어인 레드우드 코브와 거의 비슷하다는 점이다.
Geekerwan 측의 측정 자료에 제시된 IPC의 향상폭은 이전의 데이터와 비교하면 다소 보수적이다. Geekerwan 측에 따르면 라이언 코브의 IPC 향상 폭은 정수 +15.3%, 부동소숫점은 +4.6%에 불과하다. 그리고 스카이몬트의 IPC는 인텔의 공식 자료에 제시되었던 것 처럼 급격한 상승이 보여지지 않으며, Zen 4 보다도 더 낮은 IPC를 보인다고 한다.
Geekerwan의 영상에 따르면 원인은 루나 레이크의 E 코어가 L3에 직접적으로 접근할 수 없는 LPE 코어나 다름없기 때문이라고 설명하고 있다. 루나 레이크의 E 코어인 스카이몬트는 4개의 코어가 합해져 하나의 클러스터를 이루는데, 이 쿼드 코어 클러스터가 공유하는 L2 캐시의 용량이 4MB이다. 따라서 메모리 액세스 지연시간을 측정하면 4MB 까지는 P 코어와 E 코어간의 액세스 시간 차이가 얼마 나지 않으나, 4MB를 넘어가게 되면 L3에 접근하지 못해 SLC 캐시에 접근해야 하는 스카이몬트의 지연 시간이 최소 3배 이상으로 벌어진다. 이로 인해 스카이몬트의 성능이 제한되었다고 한다.
파일:50ce4cef8ccf395163c898841a4e5f9d.jpg 루나 레이크 CPU 단일 코어 전성비
3, 4번째 자료는 SoC을 통한 전력 측정이 기준이며 5, 6번째 자료는 리눅스 기반 마더보드 전력 측정이 기준이다.
두 번째로 제시된 데이터는 퀄컴 측이 발표한 단일 코어 전성비 곡선이다. 퀄컴 측의 발표에 따르면 Oryon이 가장 전성비가 좋고 그 뒤로 라이언 코브, Zen 5, Zen 4, 레드우드 코브 순서로 전성비가 좋다고 발표했다.
3, 4번째로 제시된 데이터는 Geekerwan이 측정한 전성비 곡선인데, Geekerwan 측에 따르면 SPEC 2017 기준 정수, 부동소숫점 모두 라이언 코브가 자신이 동작하는 모든 전력 범위 내에서 Zen 5에 비해 큰 폭의 우위를 점한다. 3, 4번째 자료는 SoC을 통한 전력 측정이 기준이기 때문에 리눅스 기반 마더보드 전력 측정으로 데이터를 얻어낸 5, 6번째 자료에 비해 정확하지만 Oryon과의 비교 자료는 결여되어 있다는 점을 참고하자.
5, 6번째의 데이터는 리눅스 상에서 측정된 데이터이다. 퀄컴 스냅드래곤 X Elite에 내장된 Oryon과의 비교를 위해 4, 5번째의 데이터를 참고해야 하는데, 윈도우 상에서는 0.62W의 유휴전력을 보이는 루나 레이크는 리눅스 커널 상에는 완전한 최적화가 이뤄지지 않아서 3W를 소모한다. 이를 감안하고 보더라도 정수 연산의 경우 퀄컴의 Oryon과 비교시 모든 전력 범위 내에서 우위를 점하며, 부동 소숫점에 한해 7W를 넘어가는 고전력에서는 Oryon에게 추월을 허용한다. 리눅스에서의 전력 관리 문제가 조정된다면, 부동 소숫점에서 라이언 코브와 Oryon이 교차하는 지점이 뒤로 더 밀릴 수도 있다.[13]
- 멀티코어 성능 및 전성비 [ 펼치기 · 접기 ]
- ||||
||
시네벤치 R23 기준 루나 레이크 CPU 전력 대비 효율
출처별 편차가 있긴 하지만 이상의 결과를 종합할 경우, 루나레이크는 10W 미만 구간에서 타 제품 대비 전성비 우위를 보이며, 10W 초과 구간에서는 라이젠에게, 18 ~ 30W 구간 사이 어딘가에서는 메테오레이크-H에게 역전을 허용한다고 볼 수 있다. 물론 루나레이크가 28W가 아닌 15W급의 대체제라는 것을 감안하면 중전력 구간에서 메테오레이크-H 대비 열위를 보이는 것은 그다지 의미를 부여하긴 힘들다.
- CPU 실사용 성능 및 전성비 [ 펼치기 · 접기 ]
- ||||||
||||||
||
PCMark 기준 루나 레이크 CPU 전력소모
그리고 그 외에도 동일한 30W로 전력제한을 걸어두고 Office, 어도비, 다빈치 리졸브와 같은 작업 프로그램을 구동할 때에 루나 레이크가 Apple M3 11W에 버금가는 성능을 보여주었다.
실사용 시의 전력 효율이 높아진 이유는 고성능, 저전력의 E코어 덕택이다. 루나 레이크는 별도의 LP-E코어가 존재하지 않고 P코어와 E코어가 붙은 CPU타일만 있어 표면상으로는 LP-E코어가 포기된 것처럼 보이지만, 인텔에 따르면 둘이 합쳐진 것에 가깝다고 한다. 하나의 다이에 실장되어 있지만 각각의 전력공급 계통(파워레일)을 가지고 있어 P코어에는 전력이 차단된 상태로 E코어만 구동이 가능한 구조를 가지고 있다고. 하지만 P코어와 E코어가 CPU 타일에 하나로 붙어있기 때문에 코어간 버스를 통한 통신 레이턴시는 스트릭스 포인트처럼 그리 느리지는 않다.
3.2.2. GPU
- 3DMark 벤치마크 결과 [ 펼치기 · 접기 ]
- ||<width=50%> (3DMark Fire Strike(그래픽 스코어)) ||<width=50%>
||
루나 레이크 GPU API별 벤치마크 성능
- 게임 성능 측정 결과 [ 펼치기 · 접기 ]
- ||<width=50%>
||<width=50%>
||
루나 레이크 GPU 실제 게임 성능
네이티브 해상도 측정 결과.
FSR 및 FG 적용 결과는 출처 링크 참고
Cyberpunk 2077도 마찬가지로 Arc 140V는 메테오레이크-H 대비 32% 우위를 점하지만, 890M과 비교시에는 18% 쳐진다. FSR3/ XeSS를 켜면 Arc 140V가 890M을 거의 따라 잡지만, FSR3 프레임 생성 기능을 키면 140V가 가장 저열한 것을 또다시 확인 가능하다.
Shadow of the Tomb Raider 720p에서 Arc 140V는 메테오레이크-H 대비 25%, 890M 대비 6% 우위를 점한다. 1080p에서도 메테오레이크-H 대비 21%, 890M대비 13% 앞선다. XeSS 품질 모드가 활성화된 상태에서는 25% 성능 우위를 점한다.
톰스하드웨어의 게임 벤치마크를 요약하면, 네이티브로 게임을 했을 때의 성능 기준에는 Arc 140V가 HX370의 890M에 비해 소폭 뒤쳐지고, FSR3나 XeSS를 켜면 Arc 140V이 890M과 거의 동일하지만, 프레임 생성 기능에서는 프레임 생성으로 인한 이점을 하나도 보지 못하는 상황이 보여진다는 것으로 요약할 수 있다.
네이티브 해상도 측정 결과.
27종 평균 성능, 각 게임의 성능은 출처 링크 참고
해당 벤치마크는 AMD Radeon 890M, Arc 140V와 메테오 레이크의 Arc 1세대 8-Core GPU를 테스트한 결과이며 28W의 전력 제한이 걸린 결과이다. 전력 제한으로 인하여 AMD Radeon 890M 측의 클럭이 2032 MHz로 제한이 걸려 있다는 점을 감안해야 하지만, 적어도 30W대의 동일 전력에서는 890M보다 140V가 더 좋은 성능을 보여준다는게 확실해졌다. 물론 192 GB/s의 전용 메모리 대역폭을 가지고 더 많은 전력을 소모하는 RTX 3050Ti가 40~60% 더 앞서는 성능을 보여주지만, 인텔의 내장그래픽도 충분히 본궤도에 올랐다는 것을 의미한다.
Jarrod, Geekerwan의 15W, 30W, 전력제한 해제 순
그리고 Geekerwan의 자료에 따르면 15W, 30W로 전력 제한이 걸리는 상황에는 Arc 140V가 메테오 레이크 Core Ultra 9 185H, AI 9 HX370에 비해 큰 폭의 우위를 가져가지만, 전력 제한이 아예 해제하여 Core Ultra 9 185H의 GPU가 90W, AI 9 HX370의 GPU가 80W까지 인가하는 상황에는 기하평균 기준으로 루나 레이크가 55.3fps의 성능을 낼 때, 54.3fps의 성능을 내는 메테오 레이크한테 거의 따라잡히며, 61.1fps의 성능을 내는 스트릭스 포인트에는 추월을 허용한다.
- GPU 전성비 측정 결과 [ 펼치기 · 접기 ]
- ||
||
||
루나 레이크 GPU 전력 대비 효율 그래프
루나레이크의 내장그래픽은 TSMC N3B의 수혜를 받아 거대한 전성비 향상폭을 달성했으며, 17W급으로 기존 28W급의 성능을 능가한다는 개발목표를 충실히 달성했다.[16] 전력 대비 효율 그래프를 참고하면 3DMark와 같은 벤치마크 상에서는 무조건 HX370의 890M을 앞지르며, 게임 구동시에도 20W 극후반대 이하에서는 HX370의 890M를 소폭 상회하며 엎치락뒤치락 하는 성능을 보인다. 스냅드래곤을 상대로는 더블 스코어로 격차를 벌리며 2배 이상의 전성비 우위를 점한다.
가장 인상적인 점은 바로 드라이버로, 드라이버의 한계로 인해 벤치마크상에서 나타나던 성능 포텐을 실사용환경에 이끌어내지 못하는 문제에 큰 진전을 보였다는 것이다. 벤치점수와 실성능간의 괴리는 HD 내장그래픽 시절부터 인텔 GPU들을 고질적으로 괴롭히던 문제였는데, 루나레이크의 성능 지표는 인텔이 소위 말하는 '드라이버 리스크'를 극복해내기 시작했다는 신호로 볼 수 있다.
결과적으로 루나 레이크의 내장그래픽은 대성공이라고 볼 수 있으며, 향후 행보에 따라 인텔 GPU에 대한 이미지가 바뀌는 신호탄이 될 수도 있다.
3.2.3. 전력 소모 및 배터리 효율
- 기존 U, H 라인업과의 비교 [ 펼치기 · 접기 ]
- ||||||<width=50%>
||||||<width=50%>
||
U 라인업 CPU 전력 소모 지표
실제 노트북에 적용된 루나 레이크의 CPU 전력 제한은 최대 40W, 평균 30W에 걸려있다. 스펙시트 상으로 루나 레이크의 최대 전력 소모 한계인 PL2가 37W임을 감안하면, 스펙 시트 상의 전력 제한 한도를 따라가는 셈이다. 자료에 따라 상이하지만 독일 사이트인 Computerbase에 따르면 루나 레이크의 CPU 전력은 평균 30W, Notebookcheck에 따르면 53W를 소모한다. 전작인 메테오 레이크-U 라인업의 PL2가 57W로 걸려있고, 7840U도 비슷한 전력을 소모하는 것을 보면 루나 레이크의 CPU 전력 소모는 U 라인업에 훨씬 가까움을 알 수 있다.
H 라인업 CPU 전력 소모 지표
루나 레이크 GPU 전력 소모 지표(상단)
U 라인업 및 H 라인업 GPU 전력 소모 지표(하단)
- 배터리 사용시간 지표 [ 펼치기 · 접기 ]
- ||<width=50%>
||<width=50%>
||
루나 레이크 배터리 효율 지표
결과적으로 기존 인텔 노트북들에 비하면 배터리타임에서 장족을 이루었으며, 실사용환경에서는 퀄컴의 스냅드래곤과 비등한 수준의 배터리타임을 확보하는데 성공했다. 따라서 윈도우 환경에서 굳이 x86을 포기하고 ARM으로 넘어갈 필요가 없다는 사실을 보여주었다. 비슷한 배터리 사용시간이라면 가격은 비슷하면서 호환성은 떨어지는 퀄컴 스냅드래곤을 쓸 동기가 없기 때문이다.
3.3. 평가
3.3.1. 긍정적 평가
벤치마크에 따라 성능 우열 관계가 판이하게 나뉘긴 하지만 큰 틀에서 루나 레이크에 대해 요약해보면 대체로 긍정적이다.-
개선된 싱글코어 성능 및 전성비
싱글코어 기준으로 봤을 때 라이언 코브와 스카이몬트 아키텍쳐는 다른 모든 기존의 x86 기반 CPU 아키텍쳐 대비 더 높은 성능을 훨씬 적은 전력을 소모하면서 낼 수 있고, ARM 명령어 셋을 처리하는 퀄컴 Oryon과 비교했을 때에도 정수 연산의 경우 모든 전력 범위 내에서 우위를 점하며, 부동 소숫점에 한해 7W를 넘어가는 고전력에서는 Oryon에게 추월을 허용한다.
이렇게 증가한 단일코어 효율을 통해 PCMark, UL Procyon Office 벤치마크 상에서 경쟁 제품과 비슷한 성능을 발휘하면서도 절반 혹은 그 이하의 전력을 소모한다. 그 외에도 Office, 어도비 포토샵, 다빈치 리졸브와 같은 작업용 소프트웨어에서 높은 효율성을 보였다. 만약 자신이 압축 프로그램이나 비디오 인코딩과 같이 병렬화가 높게 이뤄진 소프트웨어를 주로 구동하지 않고 어도비 포토샵[17]과 같이 제한된 수의 스레드만 활용하는 오피스 작업이나 간단한 게임, 그리고 오래 가는 배터리를 추구한다면 루나 레이크가 탑재된 노트북을 고려해 볼 만 하다.
네이티브 해상도 측정 결과. 27종 평균 성능, 28W 전력 제한 |
AMD 측의 게임 성능 측정 결과. 업스케일링 및 보간 기술 적용 |
-
인텔 Arc 내장 그래픽의 우수한 성능과 전성비
내장그래픽 역시 전성비와 드라이버가 대폭 개선되었다. 자료에 따라 우열 관계가 다르지만 이상의 자료를 최대한으로 취합해 보면 루나 레이크의 Arc 140V는 전작인 메테오 레이크에 비하면 거의 항상 우세인 구도를 차지한다.
게임 성능을 기준으로 구체적인 비교를 한 결과를 취합하면 다음과 같다. 루나 레이크의 Arc 140V는 30W로 제한이 걸려 있는데, 메테오 레이크의 Arc 1세대 GPU가 루나 레이크의 Arc 140V와 유사한 게임 성능을 내기 위해서는 90W까지 전력 제한을 해제해야 한다.[18] 그리고 퀄컴의 스냅드래곤 X 시리즈와 비교하면 모든 전력 구간에서 최대 2배 가량의 격차를 벌리며 압도적인 우위를 점한다.[19] 마지막으로 루나 레이크의 Arc 140V와 HX370의 Radeon 890M을 비교하면 두 GPU 모두 30W, 혹은 그 이하로 동일한 전력 제한을 걸어둔 상황에는 140V의 우위[20], Arc 140V에 30W를 인가한 채로 890M에 80W의 전력을 인가하면 Arc 측이 10% 가량 뒤쳐지는 열세 구도를 보인다고 정리할 수 있다.
따라서 그래픽 감속기로 대변되는 인텔 GPU의 기존 이미지에 대한 종말을 고했다. 다만 AMD측의 발표치에서 볼 수 있듯이 업스케일링과 프레임 생성을 통한 보간 기술을 쓰려면 890M측이 아직 우위를 점하고 있다. FSR3 + FG 환경에서의 나쁜 특성과 1% Low로 측정이 되는 스터터링 지표, 그리고 AAA급 게임이 아닌 마이너한 분야의 게임에서 최적화가 훨씬 나빠진다는 점은 앞으로 개선해야 할 과제이다.
-
개선된 NPU 성능
크게 주목받지는 않았지만 NPU성능 역시 경쟁사들과 동일한 수준으로 맞춰 Copilot+ 지원 요건을 충족하게 되었다.
-
배터리 사용시간 증대를 통한
ARM의 공세 저지
루나레이크는 "인텔 프로세서가 ARM만큼 효율적일 수 없다"라는 편견을 깨기 위해 출시되었고, 결과적으로 높은 실사용 환경 전성비와 우수한 내장그래픽 성능으로 큰 틀에서의 개발 목적을 달성했다. 그 결과 스냅드래곤 X 시리즈를 앞세워 PC시장을 본격적으로 개척하려던 퀄컴의 공세를 무위로 돌리고 되려 관짝에 넣어 못질하는데 성공했다. 추가적으로 공개가 되고 있는 테크 리뷰어들의 리뷰 영상에 따르면 한 자릿수 대의 전력을 소모하는 저부하 환경에서는 루나 레이크가 배터리 사용시간 측면에서 스냅드래곤과 비교하더라도 별 차이가 안날 정도로 오래 간다. 반대로 많은 시스템 자원을 필요로 하는 환경에서는 스냅드래곤과의 거리가 멀어지고 Zen 5 계열 CPU와 유사한 배터리 사용시간으로 수렴한다는 단점 또한 가지고 있다. 종합적으로 배터리 사용시간 측면에서 아직까지는 스냅드래곤 X 시리즈가 소폭 우위를 점한다는 평이 다수이지만 그리 큰 차이는 아니며, 호환성 부분에서 손해를 생각하면 굳이 스냅드래곤을 구매할 필요성이 사라졌다. 다만, 후술할 생산비용 문제로 루나레이크는 일회성 프로젝트가 될 것으로 예상되며, ARM의 공세를 지속적으로 막을 수 있을지 의문이 들며, 레이크필드처럼 있었는데 없는 실증용 제품이 될 우려가 높아졌다.
3.3.2. 부정적 평가
다만 기술적인 관점에서 보자면 좋게만은 보기 어렵다.-
투자 대비 획득한 성과 저조
루나레이크는 마이크로아키텍처의 대대적인 체급향상은 물론 통합 패키지 구조, TSMC 3nm 공정 등 기존에 인텔이 해오던 방식을 모두 버리고 사실상 전성비와 상품성만을 위해 가용 가능한 모든 카드를 꺼내들었다. 그런데 막상 자사기술 타사기술 가리지 않고 모든 것을 총동원했음에도 그렇게까지 압도적이지는 않다. 하이퍼스레딩까지 버린 라이언 코브는 x86-64 프로세서들이 기존에 사용하던 구조를 그대로 사용하고 하이퍼스레딩도 유지한 스트릭스 포인트의 젠5 일반 코어와 비교해 IPC가 별반 차이 없다. 전성비 역시 기술적인 측면에서는 상당히 우려스럽다. 물론 Cinebench 2024, SPEC 2017 기준 단일코어 전성비는 타 x86 CPU 대비 충분히 높지만, ARM 명령어 셋을 사용하는 CPU까지 비교대상에 포함시킨다면 N3B 기반임에도 N4에서 제조된 스냅드래곤 X 시리즈에 비해 코어별 전성비가 상황에 따라서는 오히려 밀리기도 한다. 동일한 N3B에 한 세대 이전의 아키텍처를 사용한 애플의 M3와 비교시 코어 전성비는 구간에 따라서는 2배도 벌어지는 등 정말 답이 나오질 않는 상황. 따라서 실사용 환경 배터리 타임과는 별개로 결국 큰 소리 치던것과 달리 ARM 대비 전성비 동급 내지 우위를 점했는지에 대해서는 다소 애매하다.
-
비싼 완제품 가격
이는 비단 루나 레이크에만 한정되는 문제점은 아니다. 경쟁사인 AMD 스트릭스 포인트 탑재 노트북에도 공통적으로 지적이 되는 사항인데, 바로 AI 연산 기능 및 온디바이스 AI를 지원하는 NPU 및 특화기능이 들어갔다는 이유로 최근 출시가 되는 노트북의 가격이 과도하게 높아지고 있다는 점이다. 너도나도 AI 노트북, AI 스마트폰이라 마케팅을 하며 제품 가격을 계속 올려 팔지만, 사실 100 TOPS 수준의 칩셋으로 돌리는 온디바이스 AI의 성능은 장난감 그 이상도 이하도 되지 못하는 상황이다. 제대로 된 온디바이스 AI를 굴리려면 Geforce 외장 그래픽을 쓰거나, 아니면 온디바이스가 아닌 클라우드형 LLM 서비스를 사용해야 하는 상황임에도 각종 빅테크 기업들은 AI 키워드로 마케팅을 하며 노트북 단가 상승의 수단으로 쓰고 있다. ASUS Zenbook S14 기준 258V 32GB RAM 모델의 경우 국내 출시가 기준 ₩2,199,000만원인데, Zenbook 14 155H 32GB RAM 탑재 모델이 국내 출시가 1,699,000원에 비해 50만원 가량 상승했으며 레노버도 비슷하게 출시했다.
-
소결
기존에도 각종 간접적인 정황들은 있었으나, 루나레이크는 애플 외의 기업들과 비교해도 인텔의 마이크로아키텍처 설계능력 우위가 사실상 사라졌다는 것을 완벽히 증명한 세대가 되었으며, 인텔이 증명해낸 것 이상으로 앞으로 증명해 나가야 할 것이 더 많다는 숙제를 남겼다.
이러한 일이 발생한 이유로 꼽히는 것은 인텔은 주요 경쟁사중 P코어의 기반 아키텍처가 가장 오래된[21] 편이라 한계에 봉착한 것이 아니냐라는 분석이 나오고 있고, 인텔도 당연히 이를 인지하고 있기에 2026년 노바 레이크에 탑재 예정인 팬서 코브에서 AMD의 Zen과 같이 대대적인 아키텍처 재설계가 예정되어있는데, 이를 통해 설계 능력을 증명해내지 못하면 큰 위기에 봉착할 것이다.
3.3.3. 복합적 평가
-
낮은 코어 수로 인한 멀티코어 성능 약세
지금까지 제조사와 제품을 막론하고 프로세서의 코어 수는 세대가 지날수록 점진적으로 증가했으나, 루나 레이크는 오히려 코어의 수가 줄어들었다. 전작 격인 메테오 레이크-U에 비교해도 P 코어의 수는 2개에서 4개로 증가했으나, 대신 E 코어는 8개에서 4개로 훨씬 줄어서 LP-E 코어를 제외해도 총 코어의 개수가 적어졌다. 게다가 P 코어의 하이퍼스레딩 지원이 빠졌기 때문에 총 스레드 수는 12코어 14스레드 → 8코어 8스레드로 더 줄어들었다.
멀티코어 전성비는 코어 수가 적은 CPU가 불리하다. 전력-성능 그래프는 보통 스윗 스팟을 넘기기 이전 지점에서는 선형적인 특성을 보이나 스윗 스팟을 넘기게 되면 지수적인 전력 소모 증가를 보이는데, 코어 수가 적은 CPU는 동일한 멀티코어 성능을 얻기 위해서 각 코어의 클럭을 훨씬 더 주어야 하고 이로 인해 전성비 특성이 매우 악화된다.[22]
멀티코어 성능을 기준으로 구체적인 비교를 한 결과를 취합하면 다음과 같다. 루나 레이크의 8코어 CPU는 10W를 초과하는 거의 모든 구간에서 AMD HX370 대비 열세를 보인다. 그리고 메테오 레이크와 비교시 18W 구간 아래에는 우세를 보이나, 18 ~ 30W 구간 사이에서는 각 IT 웹진의 테스트마다 우열이 갈리는 백중세를 보이며, 30W 구간을 초월하면 절대열세를 보인다.
단일코어 자체의 성능과 효율은 크게 향상되었기 때문에 오피스와 같이 8 스레드 이하를 사용하는 일반적인 작업에는 높은 성능을 보이면서도 효율도 좋지만 이런 점 때문에 성능의 한계가 명확하다. 전작인 메테오 레이크-U와 비교하면 더 나아졌다고 볼 수 있지만, 더 높은 SKU인 H 라인업들을 상대로 비교하면, Blender, 7-Zip과 같은 압축 프로그램, Handbrake와 같은 비디오 인코딩 벤치마크에서 멀티코어 성능의 약세로 인해 부족한 모습을 보이고 있는 상황이다.
물론 근본적으로 루나 레이크는 메테오 레이크-U 라인업을 계승하는 저전력 제품군이기 때문에 큰 단점으로 부각되지는 않는 상황이다. 더 높은 성능이 필요하다면 메테오 레이크-H 및 곧 출시될 애로우 레이크라는 선택지가 있기 때문. 하지만 만약 자신이 여러 개의 창을 동시에 띄워두면서 노트북을 사용하는 타입이거나 압축 프로그램이나 비디오 인코딩과 같이 병렬화가 높게 이뤄진 소프트웨어를 주로 구동한다면, 루나 레이크가 들어간 노트북을 후보로 두는 것에 대해 재고해 볼 필요가 있다.
-
CPU와 함께 패키징된 메모리
메모리가 인터포저 위에 적층된 구조이며 같은 인터포저에 프로세서 타일과 메모리를 수평으로 쌓아 올려서 하나의 패키징으로 묶은 형태이기 때문에 사용자가 메모리를 업그레이드하는 것이 불가능하다. 이로 인해 32 GB 단일인 Ultra 9를 제외하면 메모리 16 GB와 32 GB로 모델이 나뉘어져 판매된다.
루나 레이크가 고성능 작업을 위한 제품은 아니기 때문에 주 이용 환경을 생각하면 메모리 16 GB도 별 문제가 되지 않을 가능성이 크지만, 몇 년 후에는 16 GB로 이용하는데 좀 답답해질 가능성은 있다. 물론 그 때는 메모리 뿐만 아니라 CPU 성능도 문제가 될 가능성이 크지만, 어쨌든 장기적인 관점에서 16 GB를 선택해야 할지 32 GB를 선택해야 할지 고민의 대상이 하나 더 늘어난 것은 사실이다. 당연히 전작인 메테오 레이크에서 지원하는 64 GB의 메모리로의 업그레이드는 불가능하다.
하지만 CPU와 램 간의 거리가 가까워졌다는 점. 그리고 최대 6400MHz를 지원하는 기존의 DDR5보다 더 빠른 8533MHz를 지원하면서도 전력을 덜 소모하는 LPDDR5X를 장착했다는 점은 장점이다.
4. 데스크탑 및 모바일 중·고전력용: 애로우 레이크
===# 출시 전 정보 #===정격 전력 최대 125W로, 메테오 레이크-H, 랩터레이크-HX, 랩터레이크-S를 대체하는 것에 골자를 두고 있다.
인텔 코어 200 라인업 정리 |
- CPU
-
애로우 레이크-S
CPU는 루나 레이크와 동일한 라이언 코브 아키텍처와 스카이몬트 아키텍처를 각각 P-코어와 E-코어로 활용한다.
애로우 레이크에서 CPU-Z 벤치마크를 수행한 결과, 단일 스레드에서 i9-14900KS보다 무려 20% 향상된 성능을 보였다는 루머가 있다. 모델명은 알 수 없으나, 멀티 스레드 성능을 근거로 추정하면 기존 인텔 코어 i의 i5에 해당하는 Core Ultra 5일 가능성이 높다고 한다. 다만, 아직 정식 출시 전이기 때문에 실제 결과인지는 알 수 없다. -
애로우 레이크-H
CPU는 루나 레이크와 동일한 라이언 코브 아키텍처와 스카이몬트 아키텍처를 각각 P-코어와 E-코어로 활용하며, 추가적으로 크레스트몬트 아키텍쳐를 LPE-코어로 활용하여 두 개의 코어를 집어넣는다.
유출된 긱벤치 자료를 참고하면 i7 이상급 라인업은 6 + 8 + 2 코어 구성을 갖추며 i5 이하급 라인업은 4 + 8 + 2 코어 구성을 갖출 것으로 예상이 된다. 자료를 보면 E-코어 클러스터가 10코어라고 표기되어 있으나, 스카이몬트 아키텍쳐는 4코어 클러스터 구성으로 L2를 통하여 내부 코어 간의 통신을 하며, 이 4코어 클러스터가 다른 P-코어들과 함께 L3을 보유하며 서로 통신한다는 점을 감안하면, 긱벤치 상에 표기된 10코어는 실질적으로 8 + 2 코어라고 보는 것이 합리적이다.
-
애로우 레이크-U
명칭은 애로우 레이크지만 CPU는 메테오 레이크와 동일한 레드우드 코브 아키텍처와 크레스트몬트 아키텍처를 각각 P-코어와 E-코어, 그리고 LPE-코어로 활용한다.
루머에 따르면 생산 공정은 인텔 4에서 인텔 3[23]으로 다이 쉬링크가 이뤄지며 레드우드 코브와 크레스트몬트 아키텍쳐도 소소한 개선이 있을 것이라고 한다. 이런 점을 감안하면 상당히 이질적인 라인업이다.
추가적인 유출에 따르면 레드우드 코브 플러스(RWC+)가 P-코어로 탑재되며 크레스트몬트 인핸스드(CME)가 E-코어로 탑재된다고 한다. RWC+는 기존의 레드우드 코브와는 다르게 엔터프라이즈용 라인업인 Xeon 6에 들어간 아키텍쳐이며, 프론트엔드의 디코더 폭이 8-Wide로 확장되었다고 한다. 인텔 3 공정 적용으로 인하여 기존의 메테오 레이크-U 라인업과 비교하여 베이스 클럭이 대폭 늘어났다고 한다.[24]
구성은 MLID에 따르면 6 + 8 + 2 구성이지만 애로우 레이크-H 하위 라인업이 4 + 8 + 2 코어인데 -U 라인업에서 그렇게 넣어줄 리는 거의 없고, 중화권 측의 유출 자료처럼 2 + 8 + 2 코어 구성이 더 유력하다. -
랩터 레이크 리프레시 리프레시
CPU나 나머지 iGPU 등등의 구성은 모두 인텔 13세대와 동일하다. 실질적으로 리네이밍, 적나라하게 말하면 우려먹기 제품이며 이 제품군은 Core Ultra 200 이 아닌 Core 200 명칭으로 출시된다고 한다. 자세한 내용은 인텔 13세대로.
애로우 레이크-S용 GPU / 애로우 레이크-H용 GPU |
- GPU
-
애로우 레이크-S
데스크탑용 애로우 레이크-S에 탑재되는 i GPU는 Xe2 코어를 탑재한 루나 레이크와는 다르게 전 세대인 메테오레이크-U의 GPU 타일을 공정만 N5에서 N5P로 바꾼 채로 재활용한다.[25] 메테오 레이크-U와 동일한 Xe1 4코어 구성을 가지고 있다. -
애로우 레이크-H
모바일 제품군 또한 루나 레이크와는 다르게 Xe2(배틀메이지) 아키텍처가 아닌 메테오레이크의 Xe1(알케미스트) 아키텍처를 강화시킨 Xe+를 사용한다고 한다. XMX가 추가되면서 AI 연산 성능이 4배로 증가했고 2배 강력한 레이트레이싱 성능과 2배로 늘어난 L2 캐시 용량을 가진다고 한다. Xe+ 8코어 구성을 가지고 있다.
-
NPU
NPU는 인텔의 3세대 NPU가 탑재된다. 루나 레이크의 NPU 4보다는 더 낮은 성능을 가지고 있으나 Zen 5를 포함한 데스크탑용 CPU중에서는 가장 높은 13TOPS의 정수 8비트 연산 성능을 가진다. 데스크탑용 애로우 레이크-S에는 13TOPS의 NPU와 각각 15, 8TOPS의 CPU, GPU AI 연산 성능을 합하여 최대 36TOPS의 연산 성능을 가지며, 모바일용 애로우 레이크-H는 13TOPS의 NPU와 각각 9, 77TOPS의 CPU, GPU AI 연산 성능을 합하여 최대 99TOPS의 연산 성능을 가지게 된다.
-
생산 공정 및 출시 일정
원래 인텔 20A 공정이 주력이 될 예정이었으나, 어느 순간 슬금슬금 20A의 비중이 줄어들기 시작해, 나중에 가서는 U5 이하 라인 일부 SKU의 CPU 타일만 20A를 사용한다는 소식이 나왔고, 그러다가 2024년 9월, 인텔은 비용 문제를 이유로 20A의 양산을 취소한다고 발표했다. 결국 애로우 레이크는 전량 TSMC 공정으로 나오게 되었다. 베이스 타일이 인텔 22FFL, CPU 타일 N3B, GPU 타일 N5, SoC 타일 N6로 알려졌다.
4.1. 제품
자세한 내용은 인텔 코브 마이크로아키텍처/사용 모델 문서의
애로우 레이크
부분을
참고하십시오.4.2. 상세
4.2.1. 작업 및 AI
- 애로우 레이크-S CPU 벤치 성능 [ 펼치기 · 접기 ]
- *
퀘이사존 벤치마크
Cinebench, Geekbench 기준 애로우 레이크-S CPU 성능
- 애로우 레이크-S CPU 작업 성능 [ 펼치기 · 접기 ]
- *
탐스하드웨어 작업 벤치
- 푸젯 작업 벤치
- 테크파워업 작업 벤치 1_렌더링
- 테크파워업 작업 벤치 2_게임개발
- 테크파워업 작업 벤치 3_인코딩
- 테크파워업 작업 벤치 4_오피스툴
- 테크파워업 작업 벤치 5_과학연산
- 테크파워업 작업 벤치 6_압축
- 퀘이사존 작업 벤치
- 쿨앤조이 작업 벤치 1_압축
- 쿨앤조이 작업 벤치 2_렌더링
- 쿨앤조이 작업 벤치 3_인코딩
- 쿨앤조이 작업벤치 4_영상 렌더링
작업 기준 애로우 레이크-S CPU 성능
첫 번째 제약은 L3 캐시 내에서 주고받는 데이터의 레이턴시가 늘어났다는 점이다. # David Huang의 주장에 따르면 Cinebench와 Geekbench는 대부분 L2 캐시 내에서 실행되지만, SPEC으로 측정할 수 있는 성능은 전반적으로 캐시와 메모리에 훨씬 더 민감하기 때문에 치명적이라고 한다. 실제로 루나 레이크와 랩터 레이크의 L3 캐쉬 간 데이터 주고 받는 레이턴시는 약 55 사이클인 반면, 애로우 레이크(265K)는 약 73 사이클, 메테오 레이크(155H)는 80 사이클이라고 한다. 이는 성능에 큰 걸림돌이 된다. 이전 세대에 비해 링 클럭이 후퇴한 것이 L3 캐시 레이턴시 사이클 증가의 원인이라고 한다. 코어 클럭과 링 클럭 사이의 차이가 이전 세대보다 훨씬 더 크게 벌어졌으며, 이 문제점은 비교적 일반적인 코어 배치 레이아웃을 가지는 메테오 레이크 또한 공유하고 있다고 한다. 이 약점은 추후에 바이오스나 마이크로코드 수정으로도 개선할 수 없는 하드웨어적인 약점이라는 성격이 있다. 이러한 제약으로 인하여 Task 방식으로, 코어 하나가 자기 일만 하고, 메모리도 자기것만 쓰고 끝마친 다음, 다른 Task가 생기는 형태여야 제 성능을 발휘할 수 있다.
두 번째 제약은 AVX512의 부재라는 점이다. 연산이 많더라도 AVX2, FMA3(256bit 레지스터) 수준의 연산이어야 하고, 512비트 레지스터까지 풀로 쓰는 작업이면 Zen 5 계열보다 앞서기는 쉽지 않다.
이로 인하여 코어 자체의 성능과는 별개로 언코어 부분에서 걸리는 여러 제약들로 인해 테크파워업의 작업성능 그래프에 나타난 것처럼 작업에 따라 애로우 레이크-S의 성능 편차가 심하게 나뉜다. 특히 멀티코어를 활용하면서 L3 캐시를 통해 코어간의 데이터를 주고받거나 혹은 DRAM까지 데이터를 찾아 불러와야 할 때 불리해진다. 구체적으로는 영상 인코딩과 시네벤치로 대표되는 렌더링 관련이나 퀵싱크를 활용한 작업은 높은 성능을 내지만, 그 외에는 동률이거나 낮은 성능을 내는 추세를 보이고 있다. 가장 의외로 받아 들여지는 점은 인텔의 텃밭이던 어도비 포토샵에서조차 라이젠 9000 시리즈에 크게 밀리는 결과를 보여준 점이다.
인텔은 모바일 라인업에서 메테오 레이크에서 같은 문제를 범하고 나서 그 문제를 인지하고 루나 레이크에서는 수정했지만, 데스크탑 라인업에서는 루나 레이크보다 나중에 나온 애로우 레이크에서 그 점을 수정하지 않고 강행해서 출시했다. 이는 원래의 로드맵을 보면 알 수 있는데, 원래는 애로우 레이크-S보다 루나 레이크가 더 나중의 세대였으며, 인텔 18A 공정을 통해 생산될 인텔 16세대로 분류되어 있었다. 따라서 루나레이크는 더 새로운 버전의 라이언 코브 코어를 탑재하고 있으며, SoC의 많은 IP 블록도 업데이트 되었다고 한다.
4.2.2. 게임
- 애로우 레이크-S 외장 그래픽 성능 [ 펼치기 · 접기 ]
- *
퀘이사존 벤치마크
외장 그래픽을 사용한 게이밍 측면에서는 전작을 한참 상회하던 경쟁사의 게임 특화 모델 X3D시리즈의 전세대 라인업인 7800X3D에게 285K는 아예 논외가 되어 비교 대상에서부터 제외되고 있으며, 이젠 2세대 전의 라인업인 5800X3D에도 열위를 보이는 부분이 있다는 점[26][27]에서 게이밍 분야에선 추락할 대로 끝까지 추락했다.
CPU / GPU 병목 테스트
급감한 게임 성능 또한 코어 간 레이턴시 증가가 원인으로 지목이 되고 있다. P코어나 E코어를 비활성화 시키고 사용하는게 더 나을 수준이라는 벤치마크 결과로 인해 P코어 - E코어 - P 코어 - E코어 순으로 배치된 CPU 코어 타일 배치가 그 원인이라는 가설 또한 제시되었다. 이는 열을 많이 뿜어내는 P코어 주변에 열을 덜 뿜는 E코어라는 열 배출이 쉬운 공간을 둘수 있어서 발열 관리가 좋아진다는 설계 의도로 보인다. 실제로 애로우 레이크는 온도 관련으로는 역대급이라는 긍정적인 평가를 받고 있다. 그러나, 이런 설계로 인해 코어들 끼리 링버스로 데이터를 주고 받는데, 이 P코어 E코어 배치에 띄엄띄엄 걸려버리는 바람에 큰 지장이 생기고, 이는 곧 레이턴시 증가를 초래했다는 주장이다. # 그 레이턴시 증가가 게임 프레임 같은데서 상당한 문제를 일으킨 것이다.
이 부분에 대해 증명하기 위해 아예 코어들을 비활성화 해서 P코어끼리, 또는 E코어만 활성화 해서 사용하거나, 아니면 최대한 P-E 코어를 번갈아서 데이터가 이동하는 경계를 최소화 하는 방향으로 지그재그로 비활성화 한다는 여러 시나리오로 테스트를 시행한 영상이 공개되었다. # 그 결과는 다음과 같다.
일단 첫 번째로, P코어 E코어 상관없이 게임에서 활용하는 스레드는 최대한 확보해야 성능이 제대로 발휘된다. 영상 내의 사이버 펑크 2077의 경우는 14 스레드까지 활용하는 것으로 추정되며, 12코어 이하가 활성화 되면 상당한 성능 하락이 관측된다.
두 번째로, P코어와 E코어의 경계를 통과하는 횟수를 최대한 줄여야 성능이 그나마 개선된다.
마지막으로, 상부 기점에서 물리적으로 최대한 가까운 코어들을 켜야 한다는 점이다. 중간에 E코어가 있든 없든 SoC 타일로부터 멀리 있는 코어를 끄는 것이 약간이라도 성능 개선에 도움이 된다.
이런 방식으로 대조 실험을 한 결과 최적의 조합을 맞추어 보니 최대 6%에 가까운 프레임 개선이 있었다는 결론이었다. 물론 이 정도의 개선 가지고는 전세대나 경쟁사에 비해서 어림도 없는 수준이다. 게다가 각자가 하는 게임마다 스레드 활용 갯수를 다 미리 파악해서 일일이 바이오스에서 최적의 코어 파킹을 해주고, 게임을 종료하면 리부팅해서 다시 되돌리는 작업을 해야 하는 등등 매우 번거로운 일들이 수반되기 때문에, 일반 게임 유저들에게 선뜻 권할 만한 방식도 아니다.
한편으로는 비교적 일반적인 코어 배치 레이아웃을 가지는 메테오 레이크 또한 이 문제를 공유하고 있기 때문에 L3 레이턴시 증가의 원인은 코어 배치 레이아웃이 아니라는 David Huang의 주장 또한 공존하는 상태이다. Geekerwan 측의 영상에 따르면 그냥 복합적으로 총체적인 난국이라고 한다. 어느 쪽이 맞든 이 약점은 추후에 바이오스나 마이크로코드 수정으로도 개선할 수 없는 물리적인 약점이라는 성격이 있다.
- 애로우 레이크-S 내장 그래픽 성능 [ 펼치기 · 접기 ]
- *
내장 그래픽 벤치마크
애로우 레이크-S용 GPU / 애로우 레이크-H용 GPU
이는 전 세대인 메테오레이크-U의 GPU 타일을 공정만 N5에서 N5P로 바꾼 채로 재활용한 덕분이다. 보통 같은 세대의 CPU라면 데스크탑용 내장 그래픽은 타임 스파이 최대 900점 수준의 화면 표시기를 넣어주지만 노트북용에 들어가는 내장 그래픽의 구성은 더 크게 챙겨주기 때문이다. 이 때문에 내장 그래픽 설계를 그대로 우렸음에도 불구하고 전작인 인텔 14세대나 RDNA 2 정도나 넣는 라이젠 9000 시리즈의 내장 그래픽에 비해 2배 이상의 우위를 가지는 것이다.
요약하자면 DX12 게임 성능을 기준으로 Radeon 780M, 메테오 레이크-H 및 애로우 레이크-H에 탑재되는 Arc 1세대 8코어 GPU는 GTX 1050Ti ~ GTX 1650 사이의 성능을 내며, Time Spy 기준으로는 약 3천점대의 점수를 낸다. 게임 성능을 기준으로 삼으면 Arc 1세대 8코어 GPU 측이 소폭 열세이다.
8500G에 탑재되는 Radeon 740M과 메테오 레이크-U 및 애로우 레이크-S에 탑재되는 Arc 1세대 4코어 GPU는 780M의 60% 정도의 수준의 게임 성능을 내며 Time Spy 기준으로는 2천점을 넘길듯 말듯한 점수를 낸다. 게임을 기준으로 삼았을 때는 대략 GTX 1630보다 한 티어 낮은 성능을 낸다고 보면 된다.[28]
마지막으로 데스크탑용 인텔 14세대에 내장되었던 UHD Graphics 770과 그 경쟁자인 RDNA2 2CU GPU는 Radeon 740M이나 Arc 4코어 GPU 대비 절반 이하의 성능을 낸다. Time Spy 기준으로는 900점 가량의 점수를 낸다.
4.2.3. 오버클럭 마진, 온도 및 전력
- 애로우 레이크-S 전력 [ 펼치기 · 접기 ]
- *
퀘이사존 벤치마크
애로우 레이크-S의 전성비는 이전 세대인 인텔 14세대에 비하면 크게 늘어났다. 그러나 인텔 14세대는 6GHz를 넘기는 차력쇼를 하며 전성비가 극히 악화된 제품이기 때문에 경쟁사의 제품들과 비교해야 전성비가 어느 정도 레벨인지 가늠해 볼 수 있다.
문제는 AMD의 ZEN 5와 비교했을 때는 아직 떨어지는 편이라는 점이다. 테크파워업 전성비 그래프 링크 탐스하드웨어 전성비 그래프 링크 ZEN 4의 Non-X나 X3D 라인업보다도 떨어지는데 ZEN 5도 이쪽에는 한참 못미치므로 논외.[29] 국내에서도 신성조가 방송으로 그 점을 피력했다. 영상 링크 스샷 링크
- 애로우 레이크-S 오버클록 특성 [ 펼치기 · 접기 ]
- *
애로우 레이크-S의 전압/클록 특성
이러한 실패의 원인으로는 변화한 CPU 아키텍처와 제조공정 모두가 원인으로 지목되고 있다. CPU 아키텍처는 타사의 기조에 따라 비대화 되었는데, 이는 고클럭을 달성하는데 장애물이 된다. CMOS 배치를 조밀하게 설계해야 그만큼 기생 Capacitance도 적고, 클럭을 올리기 용이한데 인텔의 라이언 코브는 정 반대의 사상을 가지고 설계되었다. 물론 오버클럭이나 60배수 이상의 환경을 상정하지 않는다면 바뀐 방향성이 더 낫긴 하지만 오버클럭의 면으로만 봤을때는 악영향을 끼쳤다는 것이 중론.
공정 역시 상당한 하자가 있다. TSMC 3nm는 비록 전성비는 우수하지만, FinFET 기반 3nm라는 점 때문에 클럭 측면에서는 한계가 명확한 공정이다. 특히 N3B는 PPA 3요소 중 Area(면적)에 지나치게 올인했다가 수율이 저조해지는 바람에 Performance(성능)와 Power(전력)의 향상분을 상당 부분 토해내게 되었고, 따라서 N4P 대비 향상폭도 신통치 못하게 되어버렸다. 결과적으로 웨이퍼 단가만 폭증하고 성과물은 저조해 실패한 공정이라는 평가를 받고 있다.
저전력에서의 전성비는 상대적으로 낮은 클럭으로 동작하는 루나 레이크의 싱글코어 전성비 곡선에서 볼 수 있듯이 기존 인텔 7 공정보다 훨씬 양호한 모습을 보여주었으나, 클럭쇼로 대변되는 인텔, 나아가 철저히 고클럭 제품에 기반해 돌아가는 소비자 데스크탑 CPU 자체에는 특히나 부적합하다.[30] 물론 다르게 말하면 인텔은 이러한 부적합성과 단가의 불리함을 알면서도 N3B 사용을 강행해야 했을만큼 아키텍처의 상태가 불량해 경쟁사 AMD 대비 어떠한 방식으로라도 공정상 전성비 우위를 확보하는 것이 절실했다고 볼 수 있다. 따라서 공정 문제 역시 그 근본을 파고들면 인텔이 아키텍처 설계능력 및 공정 경쟁력을 모두 잃어버린 것에서 시작했다는 결론에 도달한다.
4.3. 평가(애로우 레이크-S)
실질적으로 U 라인업을 대체하며 울트라북을 타겟으로 좋은 성과를 거두며 호평을 받은 루나 레이크와는 다르게 애로우 레이크는 겨우 인텔 12세대와 라이젠 5000 시리즈를 힘겹게 이기는 수준에 불과한 처참한 게이밍 성능으로 인해 혹평을 받고있다. 절대적인 성능은 퀘존 벤치상으로 DDR4 플랫폼인 라이젠 5800X3D와 엎치락 뒤치락 하는 형국이다. 그토록 강조했던 게이밍 전성비 포인트도 사이버펑크 2077에서 전세대 i5-14600K와 코어 울트라 9 285K가 같은 전력을 먹는데 성능은 i5-14600K가 낫다는 벤치마크도 나올 지경이니 사실상 의미를 상실했다.무엇보다 가장 뼈아픈 점은, "바로 전 세대까지 인텔은 자사의 공정에 발이 묶여 있어서 제 힘을 못 낸 것 뿐이지, 공정만 정상화되면, 전통의 세계 탑급의 반도체 설계 능력을 발휘해서 압도적인 능력을 뽐낼 것"이라는 기대를 처참하게 무너뜨렸다는 점이다. 현 세대 반도체 상용 최고의 공정 중 하나인 TSMC의 3nm 공정을 동원해서 나온 결과가 이렇기 때문에 이제는 공정 탓을 할 수 없게 되었으며, 인텔의 설계 능력이 오히려 타사 대비 저열하다는 사실이 만천하에 드러났다. 바로 몇 주 전에 경쟁사의 ZEN 5가 출시 당시 너무 큰 기대를 모았다가 소소한 개선에 불과한 제품임이 드러나자 집중 포화를 받았는데, 이 제품은 아예 퇴보했다는 점에서 더 큰 실망감을 주고 있다.
어떤 용도에서 파고 들어봐도 적합한 용도 포인트가 보이지 않는다는 점이 이 CPU의 시장 반응을 어둡게 만들고 있다.
- 게임용으로 쓰기에는 너무 낮은 게임 성능으로 장점이 퇴색되었다. 게다가 레이턴시 증가 때문에 고성능 CPU의 사용 이유가 되는 1% Low 같은 특성도 더 크게 퇴색되었다.
- 작업용으로 쓰기에는 Cinebench, Geekbench 상으로 측정이 되는 멀티코어 성능과는 다르게 용도에 따라 편차가 심하다.
- 오버클럭을 해서 각종 성능을 끌어 올려서 사용하기에도 오버클럭 마진과 같은 특성이 좋지 못하다.
- 장점이라면 이전 세대였던 인텔 14세대보다 온도, 전력 특성이 좋아졌다는 점이지만 그 점만 보고 넘어가기에는 위에 언급된 성능이 좋지 못하다.
- AMD CPU를 사용하는 유저 입장에는 그런 장점조차 유효하지 않다. 절대 성능은 굳이 거론할 필요도 없고, 전력 대비 성능 측면에도 전 세대 Non-X나 X3D 라인업, 현 세대 X 라인업에게 뒤쳐지고, 작업에서도 특정 작업을 제외한 평균적인 작업 성능 측면에서는 9950X가 우위이다.
- Copilot+ 요건을 충족하지 못하므로 전성비에 대한 민감도가 상대적으로 낮은 데스크탑 PC에서는 NPU가 실질적으로는 장식용에 불과하다.[31]
- 특정 작업을 신경 쓰고 넘어가기에는 인텔의 메인보드가 너무 고가이며, 추후 업그레이드 가능성도 불투명하다.[32] 차라리 AMD CPU 시스템에 저가형 인텔 Arc GPU를 추가하는 것이 훨씬 가성비 좋은 선택이 된다.
이런저런 상황을 고려했을 때, 작업용 퀵싱크 기능 사용자, 그 중에서도 오직 인텔 제품만 쓰는 12세대 이전 제품 사용자가 신제품만을 기다리면서 버티다가 이번에 새 시스템을 갖추는 경우를 상정하는 식으로 경우의 수를 좁히고 좁혀야 가까스로 이 제품을 합리적으로 선택할 경우의 수가 생긴다.
이 신제품을 평가하는 하드웨어 마니아들 사이에서 '모래낭비'라는 오명을 얻었던 인텔 11세대인 로켓레이크가 유사한 사례로 소환되는 중이다. 심지어 안 그래도 회사가 큰 위기에 빠진 상황에서 나온 신작의 성능이 전작에 비해 퇴보했다는 설계 측면의 문제로 인해 AMD FX 시리즈마저 떠올리게 하는 측면이 있다.
4.3.1. 긍정적 평가
-
개선된 멀티스레드 성능
싱글 스레드 점수는 14세대 대비 인상적이지 않았지만, E-코어의 IPC 향상에 힘입어 출시 전 예상과 달리 Cinebench, Geekbench 등으로 측정이 되는 멀티코어 성능 지표상으로는 우수한 모습을 보여주었다. 그래서 하이퍼스레딩 없이 멀티 성능에서 9950X에게 빼앗긴 왕좌를 되찾아 왔다. 이는 특화 작업 소프트웨어, 앱들에서 향상된 성능이라는 수익을 거둘 수 있었다.
-
Arc 내장 그래픽의 우수한 성능
매번 그래픽 감속기라는 오명을 듣던 내장 그래픽을 드디어 환골탈태 시켰다. 인텔 14세대, 그리고 Zen 5를 탑재한 라이젠 9000 시리즈와 비교하더라도 큰 폭의 성능 향상을 보여주었다. 특히 하위 라인업의 경쟁력이 돋보인다. 245K 수준에서도 내장 그래픽 성능이 AMD APU군에 속하는 8500G를 약간 앞지르고, 외장 그래픽 카드 GTX 1630의 바로 아랫급에 해당하는 성능을 낸다는 점이 괄목할 만 하다. 만약에 초기 가격 거품이 빠지고, 저가형 메인보드 들도 출시된다면, 245K를 이용해서 내장 성능 만으로도 나쁘지 않은 게임 환경을 구축할 수 있을 것으로 예상해 볼 수 있다.
-
크게 개선된 온도
애로우 레이크를 가장 부정적으로 보는 의견들 조차도 이 분야에 대해서는 극찬하는 추세다. 퀘이사존 리뷰에 따르면, 부하가 많이 걸리는 작업 시 퍼포먼스 설정의 285K, 265K, 245K는 최대 5도 개선으로 14세대 대비 미세한 개선에 그쳤지만, 게임 구동 시에는 14세대에 최소 9도, 최대 16도 개선이 이루어 졌고, 경쟁사인 젠5 CPU들과 비교해도 10도 전후로 우위를 가진다. 이는 쿨링 비용 지출도 줄일 수 있으므로, 가성비에도 직결되는 점이다.[33]
4.3.2. 부정적 평가
-
전세대 대비 확실하게 하락한 성능
전체적으로 애로우 레이크에 부정적인 평가를 내리는 소비자들은 로켓 레이크의 재림을 넘어 초월하는 수준의 프레스캇과 진지하게 겨루어볼 만한 수준급 망작이라는 것에 이견이 없다는 평가를 내리고 있다. 실제로도 로켓 레이크와 비슷한 양상을 띄면서도 부분적인 문제는 심화되기까지 한 것이 보이는데, 사용 가능한 유효 스레드 수가 감소한 것 등(코어 수 감소/SMT 삭제)의 유사점과, 작업 성능의 개선점 전무 등과 같은 애로우 레이크에만 존재하는 차이점이 각각 있다. -
퇴보한 게임 성능
하이엔드 게이밍을 표방하는 한화 90만원이 넘는 최신 최상위 라인업인 285K가 14900K와 비교해 평균 게임 성능이 소폭 하락한 것이 확인되었는데, 비교 대상인 14900K는 손상 결함 논란으로 인한 안전 패치를 받아 성능이 가장 큰 폭으로 약화된 제품이었지만 285K는 그것마저도 추월하지 못할 정도로 게임 성능이 매우 크게 하락한 제품이 되었다. 그로 인해 당연히 게임 성능적인 측면에서는 악평이 주가 되고 있다. 게다가 배그를 위시한 각종 주류 FPS 게임들의 유저들이 '그래도 클럭 마진을 모두 끌어모아 오버클럭한 기준으로는 인텔이 더 낫다'는 근거로 사용되던 1% Low 프레임에서조차 AMD의 동급 ZEN 4, 1~2단계 하급 ZEN 5 라인업에 밀리는 점은 그 어떤 쉴드도 칠 수 없는 문제점이다. 적어도 12세대 엘더레이크, 13, 14세대 랩터레이크 및 리프레시는 여러 문제는 있을 지언정 그 부분에서는 강점이 확고했지만, 이번에 그조차도 박살난 것이다. 하드 게임 유저들이 그래픽 카드 대비 성능 상승 폭이 그렇게 크지 않다는 점을 감수하고도 고가의 CPU를 구매하고, 쿨링 성능을 끌어올려서 각종 오버클럭이나 램 오버를 수행하는 실용적인 중요한 이유는 바로 1% Low, 0.1% Low 프레임이 확연히 개선 되는 것을 체감했기 때문이었다. 그런데, 이 CPU가 이런 특성을 지니고 있다면 애초에 CPU와 연관 부품들에 고가를 투자해야 할 이유 역시 사라진다. -
설계 미스로 코어 간 레이턴시 증가
애로우 레이크는 L3 캐시로 접근하는 레이턴시의 증가로 인해 게임 및 작업 성능이 저하되었다. 인텔은 이 문제를 인지했으나, 데스크탑 라인업에서는 수정하지 않고 출시했다. 이 문제의 원인에 대한 여러 가설이 있지만 이들의 진위 여부와 관계 없이 바이오스나 마이크로코드 수정으로도 개선할 수 없는 물리적인 약점이다. 특히나 더 뼈아픈 점은 경쟁사는 ZEN 4든, ZEN 5든 출시 이후 꾸준한 바이오스 업데이트나 지원 프로그램으로 성능을 끌어올리고 버그나 약점은 줄여왔다는 점인데 인텔은 그러지도 못한다는 것이다. -
윈도우 스케줄러가 P코어와 E코어를 제대로 구분하지 못함
컴퓨트 타일에 P코어는 P코어끼리, E코어는 E코어끼리 뭉쳐서 배치하던 전작들과 달리 이번에는 효율적인 발열 관리를 위해 285K 기준으로 P코어 2개 - E코어 8개 - P코어 4개 - E코어 8개 - P코어 2개의 순서대로 배치를 해놨다. 이렇게 하면 P코어의 발열들이 분산되므로 의도대로 온도 관리에 있어서는 개선된 면모를 보여줬다. 문제는 출시 시점에서 윈도우의 스케줄러가 코어 순서를 그냥 배치된 그대로 인식해버린다. 그러니까 만약 10스레드를 끌어써야 하는 상황이라면 12~14세대의 경우 맨 앞의 P코어 5개를 정상적으로 끌어다 쓰지만 285K의 경우 P코어 2개 + E코어 8개를 끌어다 쓰며 뒷쪽의 P코어 6개가 노는 상황이 발생한다. 게임에 따라서는 앞단의 E코어 8개와 맨 끝의 P코어 2개를 꺼서 P코어 6개 - E코어 8개가 순서대로 인식되게끔 한 쪽이 더 프레임을 잘 뽑아내기도 한다. # -
여전히 기대에 못 미치는 전성비
출시 직후 사람들의 반응은 전성비가 14세대 대비 크게 개선된 것을 보고 그 부분에 대해서는 환호했지만, 좀 더 냉정하게 분석해 보면서 평가가 다소 복합적으로 바뀌었다. 웬만한 현세대 CPU들 거의 다 14세대 랩터 레이크와 비교하면 그보다 전성비 나쁜 CPU를 찾기가 힘들 정도라는 점을 생각했을 때, '유별나게 전성비가 낮은 14세대와 비교해서 낫다고 해서 전성비가 좋다고 말할 수 있냐?'는 점이다. 냉정하게 7nm에서 3nm로 올라간 물건에게 기대할 만한 전성비는 아니라는 평이며, ZEN 5[34]와 비교하더라도 우위를 가지지 못하며 기대에는 만족할 만한 물건이 아니라는 평이다.
-
빠듯한 클럭 마진과 거의 의미없는 오버클럭
지금까지 인텔은 10년 이상 그 위험성을 감수하고서라도 실제 구입 후 사용할 때 오버클럭이 잘 된다는 이점은 확실한 CPU들을 쭉 내 왔다. 그런데, 그 기조가 이번에 최초로 무너졌다. 출시 후 전세계 리뷰어 벤치 사이트들이 입을 모아서 말하는데, P코어의 오버클럭 마진은 거의 없는 수준이고, E코어의 오버클럭은 그래도 양호한 편이지만, 과거 CPU들과 비교될 수준은 아니며, 오버클럭을 해서 생기는 성능상의 이점 역시 미미한 수준이 되어 버렸다는 결론이다. 많은 유저들이 '그래도 오버하면 성능 향상 폭이 크기 때문에' 인텔을 선택하기도 했지만, 지금 기조에서는 그 동기가 사라져 버릴 위기에 처했다.
4.3.3. 복합적 평가
-
미묘한 작업 성능
라이젠 1, 2세대 시절과 비교하면 격세지감이 오지만, 이 분야는 인텔이 점점 경쟁사 대비 우위가 강해지는 분야다. 그런데, 이번에 나온 애로우 레이크는 그 비교우위가 다소 미묘하다는 평가다. 하이퍼스레딩 삭제 및 클럭 퇴보로 인해 그나마 신형 아키텍처로 얻었던 IPC가 상당부분 상쇄되었으며, 올라간 멀티코어 성능이 실제 환경에서의 작업성능 향상으로 완전히 치환되지 않는 모습이다. 그나마 유리한 퀵싱크를 활용한 작업을 제외하면 작업 성능은 경쟁사 젠5 대비해 앞서거니 뒷서거니 해서 용도에 따라 장점을 취하면 되는 수준이지, 압도하는 수준은 아니라는 평이다. 게임에서 폭망했다면 작업이라도 압도해야 경쟁사 대비 확실한 용도 영역을 나누어갈 수 있는데, 이렇게 미묘하다면 이도 저도 아닌 물건이 되어버린다.
-
NPU 탑재
인텔 테스크탑 프로세서 최초로 NPU가 탑재되었다. 하지만 여타 동 세대 NPU들이 그렇듯 성능이 유용한 수준이 아니라서 제대로 된 활용이 불가능하며, Copilot+ 지원 요건에도 미달한다.
===# 평가(애로우 레이크-H/HX) #===
4.3.4. 긍정적 평가
4.3.5. 부정적 평가
4.3.6. 복합적 평가
4.4. 기타
- 오버 클럭에 관해서는 신제품이 나오자 마자 구매해서 히트스프레더를 분리해서 분석하는, 소위 '뚜따'를 시행한 전 개그맨 정종철[35]은 "P코어의 오버 마진은 거의 없고, E코어의 오버 마진은 제법 있지만, 전체 오버를 통한 효율은 그닥"이라는 평가를 내린다. # # 정종철은 '그 동안 인텔 파운더리를 사용한 공정의 특징이 오버클럭을 통한 성능 향상 폭이 크다는 특징이 있었고, TSMC 공정을 사용한 AMD의 특징이 오버클럭을 통한 성능 향상 폭이 그렇게 크진 않다는 특징이 있었는데, 이번 애로우 레이크가 TSMC를 통해 제조되면서 지금까지 특성이 소멸된 것이 아닐까' 하는 추론을 하면서 영상을 마무리 한다.
- 메인보드 지원이 이번 15세대 한 세대로 끝나고 다음 세대에서는 또 소켓이 바뀔 것이라는 루머가 돌고 있었으나, 다시 그것을 덮는 루머가 나왔다. #
[1]
기존의
메테오 레이크는 인텔 4 공정 문제로
데스크탑이 취소되어
노트북 제품군 한정으로 출시되었다. 때문에 급하게 땜빵으로 투입된 물건이
인텔 14세대다.
[2]
최대 3개의 마이크로옵을 발행할 수 있는 3개의 Complex Decoder
[3]
물론 이로 인해 TR 갯수와 면적이 늘어나게 되는데 TSMC 2nm 이후부터는 실질적인 PPA 향상이 없다. 마케팅용 공정 노드 상으로는 A16, A14까지 붙지만, 실제로는 CMOS의 물리적인
Gate Length는 10nm대에서 더 줄어들지 못하고 있었던 상황이었다. 지금까지는 이를 해소하기 위해 FinFET, GAAFET과 같은 기술을 도입하고
PMOS의 전하 이동도를 개선하여 PMOS가 NMOS의 2배 수준의 Width를 가지지 않아도 되게 함으로써 M2 Track 수를 줄여 Standard Cell의 세로 축 길이를 줄였으며,
Gate를 Contact에 맞닿게 함으로써 CPP를 줄여
Standard Cell의 면적을 줄여나가는 식으로 공정을 발전시켜서 "스탠다드 셀 면적이 줄어들었으니 nm가 개선된걸로 치자" 라는 식의 홍보를 했다. 그러나 2nm 이후 세대의 공정 부터는 BSPDN의 도입 이외에는 적어도
CFET 소자가 도입되기 이전까지는
면적 축소의 여지가 거의 없어진 상황이다. 면적 축소는 PMOS와 NMOS를 아예 둘 다 수직으로 적층하는 CFET 소자가 도입되어야
본격적인 축소가 가능할 것으로 전망이 되는 상황. 그렇기 때문에 단가 문제를 해소하기 위해 각 반도체 회사에서는 인터포저 위에 여러 다이들을 적층하거나, 칩렛 구조 등을 도입하면서 차세대 패키징에 관심을 가지는 중이다.
[4]
기존 U 라인업 SKU에 비해 2W 늘어났는데, 22FFL 인터포저 위에 함께 탑재되어 같은 패키징으로 포함이 된 LPDDR5 램으로 인한 영향이다.
[5]
코어 구성에 따른 성능 차이는 매우 크다. 스냅드래곤 8 Gen이 1세대에서는 1+3+4 구조였으나, 같은 8코어 구성을 유지하더라도 1+4+3, 1+5+2, 2+6+0 구성으로 성능 향상을 하는 것을 보면 알 수 있다.
[6]
그 이전까지의 인텔 E-코어는 스카이레이크와 유사한 수준의 IPC를 가졌다.
[7]
사실 인텔의 말은 이론적으로 보면 딱히 틀릴 것도 없는 것이 RISC가 CISC보다 태생적으로 성능·효율이 더 좋은 것은 사실이지만 이는 어디까지나 여러 요소 중 하나일 뿐, 반도체의 성능과 전성비를 결정하는 가장 큰 요소는 ISA가 아닌 개발주체의 설계(아키텍처)와 제조(팹) 기술력이다.
[8]
P 코어 - LP E 코어 간 레이턴시: 약 55 ns, E코어 클러스트 내 레이턴시: 20 ns대 중반 (P코어 간 레이턴시와 비슷한 수준)
[9]
EU 64개, SP(FP32) 1024개
[10]
Core Ultra 5 계열은 벤치마크 유출을 통해 1.85GHz의 클럭으로 GPU가 작동한다는 것이 드러났다.
[11]
54W 이상의 전력을 소모하는 메테오 레이크-H의 최대 GPU 성능을 잡지는 못하더라도 28W 메테오 레이크-H GPU 성능이 17W 루나 레이크-V GPU 성능이랑 동급이기 때문에, 동일 17W 상에서 기존 메테오 레이크-H의 128EU GPU의 1.5배 성능을 낸다면 틀린 말은 안한 셈이 된다.
[12]
155H와 258V는 최대 클럭이 4.8GHz로 서로 동일하다.
[13]
번역 출처
[14]
P 코어 4개 + E 코어 4개
[15]
물론 스냅드래곤에서 게임을 구동하면 에뮬레이션으로 돌아가는 것은 감안해야 하지만, 어차피 게임들이 ARM 네이티브를 지원할 리 없으니 현실에서는 오버헤드 패널티를 받지 않는 상황은 없다.
[16]
세 번째의 자료를 보면 3DMark 구동시 루나 레이크의 Arc 140V가 17W를 소모할 때의 성능과 메테오 레이크의 1세대 Arc가 28W를 소모할 때의 성능이 정확히 일치한다.
[17]
포토샵은 최대 6스레드까지 원활하게 활용한다.
[18]
이 경우 90W를 소모하는 메테오 레이크의 Arc 1세대 GPU가 Bilibili 기준으로 0.9%의 우위, Geekerwan 기준 -2%의 열세 구도를 가지며 종합적으로 오차범위 내의 게임 성능을 낼 수 있다.
[19]
물론 이는 호환성 문제가 크다.
[20]
Geekerwan, Tom's Hardware, Notebookcheck 3곳에서 교차 검증.
[21]
출시 시점 기준 인텔 샌디브릿지 마이크로아키텍처(2012), AMD는 Zen 1(2017), 퀄컴의 오라이온(2024), 애플의 M1(2020).
[22]
장점 부문에 서술된 싱글코어 전성비와는 다른 이야기이다.
[23]
일반 소비자용 제품으로 출시되지는 않았지만 인텔 3 공정은 Xeon과 같은 B2B 라인업을 통하여 어느정도 검증이 이뤄진 공정이다. 물론 3나노라는 명칭과는 다르게 인텔 4의 하프노드에 해당하는 공정으로 타사의 3나노와 같은 집적도를 가지고 있지는 않다.
[24]
Phoronix의 분석에 따르면, 인텔 3 공정과 마이너 업데이트된 아키텍쳐가 적용이 된 Granite Rapids는 코어당 3.9W를 소모하며 3.2Ghz의 클럭을 유지한다. 인텔 7 공정으로 생산된 이전 세대는 6.01W/Core의 전력 소모를 보이는데, 6% 더 높은 클럭을 유지하며 전력 소모를 35% 낮춘 것이다.
[25]
출처 : [26] 여러 커뮤니티의 실기 게임 프레임 테스트를 기준으로, QHD에서 5800X3D에게 확실하게 패배하며 UHD 이상이 되어서야 285K가 경합 또는 근소 우위를 보이는 것으로 나타났다. [27] 5800X3D는 DDR4 기반 285K는 DDR5 기반 시스템인데도 불구하고 인텔의 열위가 발생한다는 점에 의해 애로우 레이크의 문제가 더욱 심각하다고 할 수 있다. [28] RDNA3 12CU인 780M과 RDNA3 4CU인 740M 간의 성능 차이가 1.7~1.8배 정도라는 점이 의아할수도 있지만 AMD APU에 내장그래픽은 램 대역폭에 제약을 받기 때문에 그렇다. 실제로 780M 12CU와 8CU간의 차이는 CU 수 차이에 비하면 훨씬 좁고, 스트릭스 포인트 또한 RDNA 3.5 16CU를 사용하는 890M과 12CU인 880M 간의 차이가 좁다. [29] ZEN 4의 Non-X나 X3D 라인업의 전성비가 높게 나오는 것은 TDP가 낮게 설정되어 전력 소모는 적지만 실제 성능 하락은 전력 제한에 비례하지 않기 때문에 나오는 일종의 착시일 가능성이 크다. 역으로 전력 제한을 풀었을 때 전력 소모량에 정비례하게 성능이 오르지 않는 것을 생각하면 된다. [30] N3E 공정을 사용하면 이렇게까지 되지는 않았겠지만 CAPA 부족으로 인해 N3E를 사용하는 것은 어렵고 인텔에게 사용 가능한 3nm 선택지는 N3B가 유일했을 가능성이 높다. [31] 오직 CPU만으로 AI를 돌리는 조건을 상정하면 NPU 성능이 메리트 있어 보이지만, 사실상 AI를 돌린다고 하면 NPU 따위는 비교도 안되는 퍼포먼스를 보여주는 GPU의 성능을 끌어다가 쓰는 것이 훨씬 낫기 때문에 현실성 없는 메리트라 할 수 있다. [32] 애로우 레이크 리프레시가 취소되었다는 소식 때문에 차세대에서는 소켓 규격이 바뀔 것이라는 관측이 지배적이기 때문이다. 물론 이 예측이 아직 확정된 건 아니다. [33] 단, 이 CPU가 그나마 강점을 보일 것으로 보이는 작업 용도로 사용할 때 온도가 뜨겁기로 유명한 14세대와 거의 비슷한 수준까지 치솟는다는 점이 매우 아쉬운 점이다. [34] ZEN 5는 AMD의 과장된 발표로 인해 출시 전 기대가 너무 높았기 때문에 출시 후 기대에 못 미친 성능에 실망한 유저들이 동일 X라인업 기준으로 ZEN 4 대비 전성비가 상당히 개선된 점을 과소평가한 경향이 있었다. [35] 개그맨으로 유명한 사람이지만, 은퇴 후에 의외로 하드웨어 유튜브 활동도 하고 있고, 그동안 쌓은 재력을 통해서 나름 유저들이 하기 힘든 시도들을 영상으로 만들어 채널에 올려주곤 한다.
출처 : [26] 여러 커뮤니티의 실기 게임 프레임 테스트를 기준으로, QHD에서 5800X3D에게 확실하게 패배하며 UHD 이상이 되어서야 285K가 경합 또는 근소 우위를 보이는 것으로 나타났다. [27] 5800X3D는 DDR4 기반 285K는 DDR5 기반 시스템인데도 불구하고 인텔의 열위가 발생한다는 점에 의해 애로우 레이크의 문제가 더욱 심각하다고 할 수 있다. [28] RDNA3 12CU인 780M과 RDNA3 4CU인 740M 간의 성능 차이가 1.7~1.8배 정도라는 점이 의아할수도 있지만 AMD APU에 내장그래픽은 램 대역폭에 제약을 받기 때문에 그렇다. 실제로 780M 12CU와 8CU간의 차이는 CU 수 차이에 비하면 훨씬 좁고, 스트릭스 포인트 또한 RDNA 3.5 16CU를 사용하는 890M과 12CU인 880M 간의 차이가 좁다. [29] ZEN 4의 Non-X나 X3D 라인업의 전성비가 높게 나오는 것은 TDP가 낮게 설정되어 전력 소모는 적지만 실제 성능 하락은 전력 제한에 비례하지 않기 때문에 나오는 일종의 착시일 가능성이 크다. 역으로 전력 제한을 풀었을 때 전력 소모량에 정비례하게 성능이 오르지 않는 것을 생각하면 된다. [30] N3E 공정을 사용하면 이렇게까지 되지는 않았겠지만 CAPA 부족으로 인해 N3E를 사용하는 것은 어렵고 인텔에게 사용 가능한 3nm 선택지는 N3B가 유일했을 가능성이 높다. [31] 오직 CPU만으로 AI를 돌리는 조건을 상정하면 NPU 성능이 메리트 있어 보이지만, 사실상 AI를 돌린다고 하면 NPU 따위는 비교도 안되는 퍼포먼스를 보여주는 GPU의 성능을 끌어다가 쓰는 것이 훨씬 낫기 때문에 현실성 없는 메리트라 할 수 있다. [32] 애로우 레이크 리프레시가 취소되었다는 소식 때문에 차세대에서는 소켓 규격이 바뀔 것이라는 관측이 지배적이기 때문이다. 물론 이 예측이 아직 확정된 건 아니다. [33] 단, 이 CPU가 그나마 강점을 보일 것으로 보이는 작업 용도로 사용할 때 온도가 뜨겁기로 유명한 14세대와 거의 비슷한 수준까지 치솟는다는 점이 매우 아쉬운 점이다. [34] ZEN 5는 AMD의 과장된 발표로 인해 출시 전 기대가 너무 높았기 때문에 출시 후 기대에 못 미친 성능에 실망한 유저들이 동일 X라인업 기준으로 ZEN 4 대비 전성비가 상당히 개선된 점을 과소평가한 경향이 있었다. [35] 개그맨으로 유명한 사람이지만, 은퇴 후에 의외로 하드웨어 유튜브 활동도 하고 있고, 그동안 쌓은 재력을 통해서 나름 유저들이 하기 힘든 시도들을 영상으로 만들어 채널에 올려주곤 한다.