1. 개요2. 상세 내용
2.1. 특징2.2. 토폴로지
3. 관련 문서2.2.1. PCI Express 듀얼 칩셋
2.3. 속도 및 레인 개수별 커넥터 규격2.4. 폼팩터2.4.1. CEM 규격
2.5. PCI Express를 이용한 파생 규격2.6. PCI Express를 이용한 주요 장치2.6.1. PCI Express coProcessor
2.7. 수요 증가와 비용 및 인증 문제2.6.1.1. PCI Express Graphics (
그래픽 카드)2.6.1.2. PCI Express
CPU2.6.1.3. PCI Express PPU2.6.1.4. PCI Express 전용연산장치
2.6.2. PCI Express 저장장치2.6.3. PCI Express
사운드 카드2.6.4. PCI Express
근거리 통신 카드2.6.5. PCI Express 기타 데이터버스 확장카드1. 개요
이전의 PCI, PCI-X, AGP 표준을 대체하도록 설계된 고속 데이터 전송에 사용되는 연결 단자 표준이다. 줄여서 PCIe 또는 PCI-e로도 표기한다.2003년에 인텔, 델, HP, IBM이 합작하여 PCI 의 후속 인터페이스로 발표하였고, 2004년부터 적용된 규격이다.
2. 상세 내용
2.1. 특징
-
직렬 통신
일반적으로 병렬 방식이 직렬 방식보다 빠르지만, 신호 동기화나 지연 등의 문제로 병렬 방식은 고속화가 한계가 있기 때문에 현재 컴퓨터 쪽에서 병렬 인터페이스는 사장되어 가고 직렬 인터페이스를 고속화하는 것이 추세이다. 외부 인터페이스는 USB, IEEE1394 등 전부 직렬 방식으로 대체되었고, 저장소 인터페이스 역시 병렬 방식에서 직렬 방식인 SATA, SAS로 변경되었다.
-
레인 (lane)
비트(bit) 대신 레인(lane), 여기서 Lane은 Differential Signal을 의미한다. 기존의 확장부 인터페이스는 전부 병렬 방식이지만 PCIe는 직렬 방식을 사용한다. 본래 단위 명칭은 레인이지만 ×로 줄여서 표기하는 하는데, 그 대신 × 앞이 아닌 (2×, 4×, 8×) 뒤에 표기하는 것으로 (×1, ×2, ×4, ×8, ×16) 구분하고 있다. × 앞의 숫자 표기는 변수의 2배를 의미하는 2x같은 배수 개념으로, × 뒤에 숫자 표기는 배수 개념보다는 개수 개념으로 더 많이 쓰이기 때문. 즉 Differential Signal 개수를 의미한다. 최초 버전 기준으로 모두 레인당 대역폭이 250 MiB/s으로 (Half-Duplex) 그래픽 카드에 사용되는 PCIe ×16 단자의 경우 250×16 = 4 GiB/s (Half-Duplex)의 대역폭으로 동작한다. 즉, PCIe ×16은 PCIe 인터페이스가 16개의 레인으로 할당되었다는 뜻이다. PCIe 장치와 호스트는 통신을 시작할 때 최대 지원 속도 정보를 주고받아서 필요한 만큼의 레인을 가져갈 수 있다.
이 레인 방식은 얼핏 보면 병렬 통신과 유사한 것처럼 보이지만, 기존의 오래된 규격인 병렬 통신이 각 클록마다 모든 라인에서 비트가 도착할 때까지 기다린 후 이를 순서대로 짜맞춰서 최종적으로 하나의 데이터를 얻는 것과는 달리, PCI Express의 레인 개념은 각 레인별로 서로간에 간섭없는 송수신이 이뤄지며 각 레인별로 별도로 데이터가 완성되는 특징을 가진다. 즉, 네트워크 통신에서 두 컴퓨터 사이에 랜카드를 1/2/4/8개 연결한 것과 비슷한 형식의 동작을 한다고 보면 된다. 이러한 특성때문에 컴퓨터와 장착카드 간의 유연한 협상이 가능하고 서로 레인 갯수가 맞지 않아도 적당히 맞춰서 사용할 수 있게 된다.
-
쌍방향 통신
PCIe는 입출력 모두 동시에 가능한 풀듀플렉스 통신이기 때문에 실제 데이터 대역폭은 데이터 전송 대역폭의 2배다.
-
상호 호환성
상위 버전의 PCIe를 사용하는 장치도 하위 버전의 슬롯에 장착할 수 있지만, 대역폭은 둘 중 더 낮은 쪽을 따라간다. 예를 들어 PCIe 1.0 ×16 슬롯에 PCIe 3.0 ×16을 지원하는 그래픽 카드를 장착할 경우 최대 성능이 안 나올 수도 있다. 요즘 고사양 게임들은 PCIe 1.0 ×16의 대역폭보다 높은 데이터 대역폭을 요구하기 때문. 물론, 네이티브 PCIe 1.0 ×16 슬롯인 메인보드가 인텔 CPU 기준으로 LGA 775 세대이기 때문에 CPU 성능 병목까지 영향을 많이 받으므로, 최소한 해당 그래픽 카드와 같은 세대의 상위 CPU를 장착할 수 있는 메인보드와 조합해서 PCIe 1.0 ×16과 동급의 스케일링으로 맞추고 테스트해야 제대로 확인할 수 있다.
2.2. 토폴로지
PCI Express의 토폴로지는 대략적으로 위의 다이어그램처럼 구성되어 있다. Root Complex는 메인보드의 노스브리지 칩셋, PCIe Endpoint가 그래픽 카드, 사운드 카드, 카드 타입의 SSD 등의 PCIe를 호스트 인터페이스로 사용하는 각종 장치에 대응되고, Memory는 시스템 메인 메모리에 대응된다. 그림에는 대응되는 다이어그램이 보이지 않지만 PCIe Bridge to PCI/PCI-X는 굳이 따지자면 사우스브리지에 대응할 수 있다.
Root Complex에서 다른 곳을 거치지 않고 곧바로 PCIe Endpoint에 도착하는 경우는 대표적으로 그래픽 카드가 있다. 다른 장치들보다도 대역폭에 더 민감한 제품이기 때문. 대역폭에 덜 민감한 제품들은 상대적으로 저속 버스들을 제어하는 사우스브리지를 거치는 방식을 이용한다. 상대적이라고 부르는 것은 PCI도 한때는 ISA를 능가하는 고속 버스로 취급받았으나, PCI Express가 등장한 이후로 상대적으로 저속 규격이 되어버렸기 때문.
Switch 다이어그램은 노스브리지가 지원하는 최대 PCIe 레인 개수가 한정되어 있기 때문에 메인보드가 이를 초과하는 PCIe 기반 슬롯들이 탑재되어 있을 경우 메인보드가 지원하는 모든 슬롯에 다 장착해서 동시에 사용할 수 없는 문제가 발생할 수밖에 없다. Switch를 통해 장착되어 사용하는 슬롯은 활성화하고, 장착되지 않거나 장착되었다 하더라도 사용하지 않는 슬롯은 비활성화하는 식으로 선택적으로 제어해주며, 노스브리지의 PCIe 레인 개수가 충분히 넉넉하다면 Switch가 필요없이 메인보드에서 제공하는 모든 슬롯들을 다 사용할 수 있다.
2000년대 말부터 노스브리지가 CPU에 내장되기 시작하면서 Root Complex는 사실상 CPU 내부의 각종 I/O 컨트롤러를 가리키게 되었다.
2.2.1. PCI Express 듀얼 칩셋
점점 노스브리지가 CPU에 내장되는 추세였으나 빠르게 늘어나는 PCIe 대역폭을 감당하기 위해 외부에서 듀얼로 구성해 처리하기도 한다.가령 AMD의 칩셋중 X670(E)와 X870E는 Promontory 21 칩셋 2개를 PCI Express 4레인으로 묶어 사용한다.
2.3. 속도 및 레인 개수별 커넥터 규격
||<|2> 버전 ||<-2> 날짜 ||<|2> 인코딩 ||<|2> 데이터
전송률 ||<-5> 대역폭 ||
전송률 ||<-5> 대역폭 ||
발표 | 적용 |
1레인 (×1) |
2레인 (×2) |
4레인 (×4) |
8레인 (×8) |
16레인 (×16) |
|||
1.0~1.1 | 2003년 | 2004년 6월 | 8b/10b | 2.5 GT/s | 250 MB/s | 500 MB/s | 1 GB/s | 2 GB/s | 4 GB/s |
2.0~2.1 | 2007년 1월 | 2007년 8월 | 8b/10b | 5 GT/s | 500 MB/s | 1 GB/s | 2 GB/s | 4 GB/s | 8 GB/s |
3.0~3.1 | 2010년 11월 | 2011년 7월 | 128b/130b | 8 GT/s | 984.6 MB/s | 1.969 GB/s | 3.938 GB/s | 7.877 GB/s | 15.754 GB/s |
4.0 | 2017년 6월 | 2018년 | 128b/130b | 16 GT/s | 1.969 GB/s | 3.938 GB/s | 7.877 GB/s | 15.754 GB/s | 31.508 GB/s |
5.0 | 2017년 | 2019년 5월 | 128b/130b | 32 GT/s | 3.938 GB/s | 7.877 GB/s | 15.754 GB/s | 31.508 GB/s | 63.015 GB/s |
6.0 | 2019년 6월 | 2022년 4월 | 1b/1b | 64 GT/s | 7.877 GB/s | 15.754 GB/s | 31.508 GB/s | 63.015 GB/s | 126.031 GB/s |
7.0 | 2022년 6월 | 미정 | 1b/1b | 128 GT/s | 15.754 GB/s | 31.508 GB/s | 63.015 GB/s | 126.031 GB/s | 256 GB/s |
출처
출처: Wikimedia Foundation
위에서부터 4레인, 16레인, 1레인, 16레인, 레거시 PCI 슬롯이다.
한 슬롯에 최대 75W 전력을 공급할 수 있어서,[1] 해당 전력 이상의 전력을 소비하는 확장카드는 별도의 추가 전원이 필요하다. PCIe 4.0 규격부터는 한 슬롯에서 최대 300W까지 공급 가능하다고 알려젔지만[2] 이는 오보로 밝혀졌다 # 컴퓨터 파워에서는 PCIe 용 보조전원이 있는데 1개당 6핀은 75W, 8핀은 150W, 12핀[3]은 450W, 16핀은 600W까지 공급 가능하다.
외부 출력 단자도 있으나, 디지털 영사기 등 특수 분야에서 많이 사용하며 주변에서 쉽게 찾아볼 수 있는 제품 사이에는 델 에일리언웨어 노트북 중 일부에 장착되는 외장형 그래픽 카드 커넥터가 있다. 커넥터 형태는 독자 규격이지만 전기 신호는 PCIe 신호를 그대로 사용한다. 이것이 달려 있지 않은 노트북 사용자들을 위해서 ExpressCard나 남는 mPCIe 슬롯에서 PCIe 레인을 끌어와 노트북에 그래픽 카드를 꽂을 수 있도록 해주는 제품도 있다. 다만 해당 포트가 그래픽 카드를 연결하기 위해 설계된 게 아닌 만큼 이런 식의 연결로는 대역폭이 충분하지 못해 그래픽 카드의 성능을 100% 뽑아내지 못할 수 있다. eGPU와 http://www.hwtools.net/eGPU.html 참조.
메인보드에 따라 16레인 슬롯 형태만 만들어 놓고 실제 접점은 4레인이나 8레인까지만 채워 둔 슬롯이 있을 수 있다. 반대 경우도 존재해서, 1x, 4x, 8x 등의 레인 슬롯의 끝 부분을 열어 놔서 장치 쪽 레인에 상관 없이 끼울 수 있게 한 슬롯도 있다. 위 두 경우 모두 다 슬롯과 장치가 전기적으로 연결된 레인으로만 작동한다. 2000년대 중반 모 컴퓨터 회사에서 서버 컴퓨터를 20만 원에 떨이했을 때, 메인보드에 PCIe 16레인 슬롯이 없어서 슬롯 끝이나 그래픽 카드를 잘라내는 개조가 유행한 적이 있다. 메인보드를 개조하면 아무 장치나 꽂을 수 있지만 메인보드 보증이 날아가고, 그래픽 카드 쪽을 건드리면 그래픽 카드 보증이 날아간다. 이런 메인보드의 경우 성능란에 PCIe 3.0 ×16 (×4) PCIe 3.0 ×16 running at ×4 등으로 표기된다. 둘 다 슬롯 형태는 ×16이지만 접점은 4레인 까지밖에 없음을 의미한다. 그리고 최근 발매되는 프로세서는 PCIe 컨트롤러를 내장하는 경우가 많아서 메인보드 칩셋에서 제공하는 레인 말고 프로세서에서 제공하는 PCIe 16레인을 그래픽 카드에 사용하는 경우가 대부분이다.
장치에 따라 16레인은 주로 그래픽 카드에, 4레인이나 2레인은 주로 M.2 형태 PCIe SSD에, 1레인은 사운드 카드, 랜 카드 등 나머지 용도에 주로 사용된다.
PCI Express 표준에는 12레인과 32레인 또한 존재하지만 이 규격으로 제작된 장치는 존재하지 않는다.
완제품 서버 등지에서 내부 인터커넥팅 용도나 백플레인 연결 등으로 극히 드물게 보이는 편.
혹시라도 꽂고 싶은 장치와 메인보드 접점이 달라서 개조를 하려고 하면, 당연하겠지만 보드, 카드 중에 가격이 싼 쪽을 마개조해서 꽂아야 한다. 위에도 나와있듯 보증수리는 물건너가기 때문. 멀쩡한 걸 임의로 잘라낸거라 얼렁뚱땅 넘어가거나 우겨서 무상수리를 받아낼 수도 없다. 사실 잘라내서 꽂는 거 자체는 크게 어렵진 않아서, 보증이 지나서 아쉬울 게 없는 구형 시스템에서는 한번 시도해 볼 만은 하다. 뒷 부분 금속핀이 7핀이면 1X 포트, 7핀을 넘으면 그래픽 카드 단자에 꽂으면 된다.
PCI-SIG 공식 홈페이지에 명시된 PCI Express 호환 장치들의 규격 목록
2.4. 폼팩터
- PCI Express Standard (2004년 이후): 흔히 PCIe 확장 카드에 사용되는 그 폼팩터이다. 데스크톱용 그래픽 카드도 이 폼팩터에 해당한다.
- PCI Express Mini Card (2005~2013년): Mini PCI Express, Mini PCIe, Mini PCI-E, mPCIe, PEM라고도 불렀던 파생 폼팩터로, 한때 무선랜 카드에 많이 보였던 폼팩터였다. 현재는 M.2로 대체되어서 구형 제품이나 임베디드 시스템이 아닌 한 찾아보기 힘들어졌다. Full Size와 Half Size로 나뉜다.[4]
- PCI Express External Cabling (2007년 이후): 외부 확장 케이블용 폼팩터. External PCI Express, Cabled PCI Express, ePCIe라고도 부르는 편이다.
- PCI Express M.2 (2013년 이후): 현재 고속 SSD와 무선랜 카드에 주로 사용되고 있는 폼팩터.
- PCI Express OCuLink (2015년 이후): 광학 구리 케이블용 폼팩터.
2.4.1. CEM 규격
PCI Express는 장착되는 애드인 카드의 폼팩터가 규정되어 있다.- FHHL - Full Height Half Length - 높이 111.15mm 이하, 길이 167.65 mm 이하 - 최대 8레인
- FHFL - Full Height Full Length - 높이 111.15mm 이하, 길이 312 mm 이하 - 최대 16레인
- HHHL - Half Height Half Length - 높이 68.9mm 이하, 길이 167.65 mm 이하 - 최대 16레인
이 규격들은 서버와 같은 엔터프라이즈 제품에서는 칼같이 지켜지지만 소비자용 제품들중 특히 블로워 타입을 제외한 중고급형 그래픽카드들은 이 규격을 훨씬 초과하는 것들이 많다. 그래도 케이스 호환성을 위해 높이는 어느정도 지켜진다.
2.5. PCI Express를 이용한 파생 규격
-
인텔 Direct Media Interface (2004년 이후)
915 칩셋부터 도입된 규격. 노스브리지(Input Output Hub)와 사우스브리지(Input Output Controller Hub) 칩셋이 따로 존재했을 초기에는 '노스브리지 ↔ 사우스브리지'의 인터커넥트로 사용되었다가, 2009년 린필드 프로세서 계열의 1세대 코어 i7, i5와 P55 칩셋부터 노스브리지가 CPU에 내장되고 사우스브리지가 PCH로 계승되면서 'CPU ↔ PCH'의 인터커넥트로 사용되고 있다. - DMI (2004~2010년): PCI Express 1.0 4레인을 이용한 초기 버전.
- DMI 2.0 (2011~2014년): PCI Express 2.0 4레인을 이용한 두 번째 버전.
- DMI 3.0 (2015년~2021년): PCI Express 3.0 4레인을 이용한 세 번째 버전. (Z590, H570 칩셋 한정으로 8레인을 이용)
- DMI 4.0 (2021년 이후): PCI Express 4.0 4레인을 이용한 네 번째 버전. (H670, Z690 칩셋은 8레인을 이용)
-
VIA Ultra V-Link (2004~2010년)
VIA에서 개발된 인터커넥트 규격. PCI Express 1.0 4레인을 이용하여 노스브리지 ↔ 사우스브리지에 사용되었다. -
AMD A-Link Express (2004~2011년)
AMD한테 인수되기 전 ATI가 메인보드 칩셋을 개발했을 시절에는 2004년 11월 RS480 칩셋부터, ATi 인수 후 AMD에서는 2006년 10월 580X, 480X 칩셋부터 도입된 규격. 기본적인 특징은 인텔의 DMI와 유사하지만, 마지막 세대까지 노스브리지와 사우스브리지가 따로 존재하는 형태로 유지되었다. - A-Link Express (2004~2005년): PCI Express 1.0 4레인을 이용한 초기 버전.
- A-Link Express II (2005~2009년): PCI Express 1.1 4레인을 이용한 두 번째 버전.
- A-Link Express III (2010~2011년): PCI Express 2.0 4레인을 이용한 마지막 버전.
-
AMD Unified Media Interface (2011~2016년)
AMD 1세대 A 시리즈(라노) APU와 함께 발표된 인터커넥트 규격으로, 인텔의 CPU ↔ PCH처럼 따로 존재했던 노스브리지와 사우스브리지 구성에서 노스브리지가 APU에 통합되고 남은 사우스브리지가 FCH로 계승되면서 APU ↔ FCH로 사용되었다. 모바일용 칩셋은 PCI Express 1.1 4레인을, 데스크톱용 및 임베디드용 칩셋은 PCI Express 2.0 4레인을 이용했으며, 해당 PCI Express 대역폭은 2세대 라이젠 시리즈와 함께 등장한 400 시리즈(X470, B450) 칩셋까지 유지되었다. - NVM Express (2011년 이후)
- SD Express (2018년 이후)
- CFExpress (2017)
- SATA Express (2013~2018년)
-
Mobile PCI Express Module (2011년 이후)
NVIDIA에서 노트북을 위한 PCIE 파생 슬롯으로 작고 200w 까지 전원을 추가 공급 가능하다. 최신 버전은 2세대지만 버전 자체는 3.1로 불린다. PCIE 3.0에 대응된다. -
Compute Express Link (2019년 이후)
2019년에 데이터 센서 규모에 적합한 고속 CPU ↔ I/O 장치 및 CPU ↔ 메모리, 캐시 일관성을 보장하기 위해 Dell EMC, 마이크로소프트, 시스코, 알리바바, 인텔, 페이스북, 구글, HP, 화웨이가 연합해서 개발한 개방형 표준 인터커넥트 규격. PCI Express 5.0을 이용했으며, 이후에 AMD, NVIDIA, 에즈락, GIGABYTE, ARM Holdings, 마이크론 테크놀로지를 비롯하여 수많은 업체들이 CXL 연합에 가입한 상태이다. -
Apple MPX (2019년)
애플에 의해 개발되어 맥 프로 2019에 탑재된 독자 확장 규격. '인텔 CPU의 PCIe 4.0 미지원 문제'와 'PCIe 3.0의 대역폭 한계' 등을 극복하기 위해 도입되었으며, 기존 PCIe 3.0과도 호환 가능하다. ISA와 함께 쓰는 VESA 로컬처럼 기존의 PCIe x16 슬롯에 별도의 특수한 슬롯을 추가한 형태다.
2.6. PCI Express를 이용한 주요 장치
2.6.1. PCI Express coProcessor
PCI Express 버스를 통해 CPU에 직접 연결되기 때문에 CPU의 연산을 보조하는 코프로세서 카드가 많이 사용한다. 아래의 GPU와 PPU 등은 모두 이런 CPU 연산 보조 프로세서들이다.[5]2.6.1.1. PCI Express Graphics ( 그래픽 카드)
업계에서는 PCI Express를 이용한 그래픽 카드를 PCI Express Graphics, 줄여서 PEG라고 부르고 있다. 그래픽 카드가 PCI Express를 이용하는 장치들 중에서도 흔하게 볼 수 있는 장치이기 때문.CPU와 직결 통신하는 그래픽 카드라서 메인보드의 칩셋에서 지원하는 PCIe 버전은 그래픽 카드와 연결되는 PCIe 버전과는 무관하지만, 메인보드의 디자인에 따라서 PCIe의 새로운 버전을 사용할 수 없는 경우가 있다. 메인보드의 PCIe 슬롯과 CPU의 PCIe 컨트롤러는 핀 대 핀으로 완전히 직결되는 것이 아니라 중간에 PCIe 스위치 #, 클록 생성기, 클록 드라이버 # 등의 다른 IC가 들어가며, 이들도 PCIe의 새로운 버전을 지원하지 않으면 CPU와 그래픽 카드가 새로운 버전을 지원하더라도 사용할 수 없다. 결정적으로 PCI SIG의 인증을 받아야만 공식적으로 PCIe 버전 지원을 홍보할 수 있다.
인텔이 샌디 브리지에서 아이비 브리지로 넘어가던 시기에 일부 Z68/P67 보드 #는 아이비 브리지 CPU를 사용할 때 CPU에서 나오는 PCIe 레인만 PCIe 3.0을 지원하는데, 이것도 물리적인 설계가 변경되고 CPU에서 나오는 PCIe 레인에 PCIe 스위치 IC가 PCIe 3.0으로 교체되었기 때문에 가능하다. 그리고 일부 Z490/H470 보드는 로켓 레이크 장착 시 PCIe 4.0이 사용이 가능하다. # 역시 PCIe 지원을 위한 설계 및 보조 IC가 전부 PCIe 4.0 지원 스펙으로 변경되었기 때문. #
AMD는 파일드라이버에서 스팀롤러로 넘어갈 때 CPU의 PEG용 PCIe 레인을 3.0으로 업그레이드하고 FM2에서 FM2+로 소켓을 변경했다. AM3 소켓 기반 CPU에서는 PCIe 레인이 직접 나오지 않고 노스브리지를 거치는 구조였으며, AM3 최후기 900 시리즈 칩셋까지도 PCIe 3.0을 지원하지 않았다. 결국 AM4 소켓 기반 CPU에 와서 PCIe 3.0이 지원되었다. FM2+ CPU는 FM2 메인보드에 장착이 불가능하고, AM4 CPU는 AM3 메인보드에 장착이 불가능하므로 같은 소켓에서 PCIe 리비전이 달라지는 경우는 없었다. 그리고 3세대 라이젠에서 PCIe 4.0을 지원하기 시작했다. 초기 바이오스에서는 3세대 라이젠 장착 시 X470/B450 메인보드에서도 PCIe 4.0 지원 옵션을 허용해 두었고, 실제로 일부 X470/B450 메인보드는 PCIe 4.0을 지원하려고 했다. 그러나 기존에 출시된 메인보드가 CPU에서 나오는 레인 배선이나 클록 생성기, 드라이버 등을 PCIe 4.0을 염두에 두고 설계하지 않았기 때문에 AMD의 바이오스 업데이트로 곧 막아 버렸다. # # 이것 때문인지 인텔용 메인보드처럼 기존에 출시된 X470/B450 메인보드를 리비전해서 PCIe 4.0 지원 가능하게 출시한 제조사는 없었다.
AMD의 경우에는 CPU 내부에 상위 PCIe 컨트롤러가 내장되어 있고 그래픽카드도 상위 PCIe 버전을 지원한다면 억지로 PCIe 4.0을 활성시키는 개조 바이오스를 설치해서 우회가 가능한 경우도 있다. 단, B450 자체가 PCIe 4.0을 염두에 두고 설계한 칩셋이 아닌데다 추가 테스트와 인증을 받지 않았으므로 정상 동작이 보장되지는 않는다. 일부 보드의 경우에 이런 식으로 보증되지 않는 기능의 사용이 가능한 경우가 있긴 하다. 다만 메인보드 제조사에서 보증하지 않는 동작을 하는 것이며 이는 하드웨어의 손상, 시스템 안정성의 저하가 발생할 수 있다는 점은 염두에 두어야 한다.
따라서, 원칙적으로는 그래픽 카드가 지원하는 PCIe 스펙을 온전하게 이용하려면 CPU 내부에 있는 PCIe 컨트롤러, 메인보드의 PCIe 신호 설계, 메인보드 BIOS 차원에서의 활성화까지 모두 충족되어야 이용할 수 있고, 일부 PEG의 경우 제일 마지막의 BIOS까지는 어찌저찌 해 볼 수도 있을 수 있다는 이야기이다.
2022년 1월 기준으로 PCIe 5.0을 지원하는 메인보드 칩셋은 없으며[6], 예외적으로 엘더 레이크를 장착할 수 있는 Z690, H670, B660, H610 메인보드는 CPU 직렬 레인을 통해서만 PCIe 5.0을 사용할 수 있다.
PCIe용 저장장치를 제외하면 아래 PCIe 카드들을 모조리 흡수할뻔했다. 사실 PCIe 연결용 코프로세서들은 대부분 그래픽카드가 그 기능을 가져갔고 그래픽카드의 디스플레이 포트와 HDMI가 음성출력도 가능했기 때문에 AMD의 트루오디오 처럼 그래픽 카드가 사운드카드까지 겸하는 기술을 이미 2013년부터 실용화하였다. 그러나 음향연산력은 사운드카드 보다 뛰어났으나 모니터/TV 내장 스피커는 한계가 있어서 아직 사운드카드나 메인보드 내장사운드를 완전히 대체하지 못했다.
저장장치 역시 CPU가 그래픽카드의 저장장치 접근은 2020년까지 4Gb(256MB)가 한계여서 불가능에 가까웠다. 그러나 Resizable BAR 기술 등 CPU가 그래픽 카드의 모든 저장장치에 액세스가 가능해 이론상으론 그래픽카드 내부에 SSD, 음성출력까지 겸할 수 있다.[7]
2.6.1.1.1. 역대 과도기
-
ISA → VLB (1993년)
그래픽카드가 처음 등장하였을 때 연산은 CPU가 모든걸 처리했고 CPU가 처리한 데이터를 화면에 뿌려주는 사실상 DAC역할을 하던 것이 전부였다. 또한 당시 환경은 텍스트 위주였고 해상도와 컬러표현 수도 적어서 대역폭도 그렇게 클 필요가 없어 ISA 버스의 8MB/s(하프 듀플렉스 모드), 16MB/s(풀 듀플렉스 모드) 대역폭은 별 문제가 되지 않았다. 3D게임 같이 전송해야 할 데이터가 증가해 기존의 8비트 너비를 16비트로 높인 ISA로도 한계가 오자 ISA를 확장해 대역폭을 높인 VESA Local Bus 가 등장하고 사용된다. VLB는 한쪽은 ISA고 한쪽은 추가된 포트였다 보니 기존 카드들에 대한 호환성도 있었으며 대역폭이 필요한 SCSI 카드 등도 VLB포트를 사용하기도 했다.
-
VLB → PCI (1994년)
1992년 인텔의 PCI 규격이 등장한지 얼마 안 되었을 무렵, VESA 규격 그래픽 카드는 상술하듯 여러 문제가 있었고 ISA 규격은 대역폭의 한계(ISA 16MB/s, PCI 133MB/s)로 얼마 지나지 않아 그래픽 카드를 필두로 PCI긴 널리 적용되기 시작했다. 그래픽 카드가 그나마 빨리 갈아탄 편이었고, 다른 장치들은 2000년대에 들어서야 ISA가 특수 산업 분야 말고는 대부분 퇴출되었다.
-
PCI → AGP (1997~1999년)
1997년 Accelerated Graphics Port(가속 그래픽 포트) 규격이 등장한 초기에는 무늬만 AGP일 뿐 대역폭은 기존 레거시 PCI와 다를 바 없을만큼 낮은 대역폭으로 인해 널리 채택하지 않았다. 이후 1998년부터 대역폭의 한계가 온 레거시 PCI 대신 2배의 대역폭인 본래의 AGP 1.0(1× 배속 266MB/s)를 활용하기 시작하면서 대대적으로 그래픽 카드에 적용되기 시작했고 1999년부터는 레거시 PCI 대비 8배의 대역폭인 AGP 2.0(4× 배속)이 도입되면서 레거시 PCI 대신에 AGP가 주력 그래픽카드 슬롯으로 자리잡기 시작하였으며 이후 2000년대 들어 AGP 3.0(8× 배속 2133MB/s)가 도입되었다. 물론 그래픽카드를 제외한 유선/무선랜 카드, 사운드 카드 등의 다른 장치들의 경우 여전히 PCI를 고수하여 그래픽 카드는 AGP, 나머지는 PCI가 기본이었다. 다만 산업용에서는 레거시 PCI와 ISA를 장비를 운용하기도 했는데 특히 그래픽카드의 경우 화면 출력용이면 충분했기에 AGP 그래픽카드들보다 더 늦게 출시한 페르미 아키텍처 기반의 모델의 그래픽카드(GT 520, GT 610)를 끝으로 레거시 PCI 타입의 그래픽카드가 나오지 않게 되면서 오히려 AGP 그래픽카드보다 더 오래 살아남았다.
-
AGP → PCI Express (2004~2006년)
PCIe 1.0이 도입된 초기에 엔비디아는 PCIe-AGP 양방향 변환이 가능한 브리지 칩인 BR02(HSI라고도 불림)를 개발했고, ATI는 "우린 PCIe 네이티브다"라는 생각으로 라데온 9000 시리즈의 인터페이스를 PCIe로 바꾼 라데온 X300~X600 시리즈를 개발했다. 엔비디아는 GeForce 4, FX 시기에 브리지 칩을 써서 인터페이스만 PCIe로 바꾼 지포스 PCX 시리즈를 출시했으나, 안 그래도 욕 많이 먹은 FX 시리즈 기반이었기 때문에 큰 재미를 보지는 못했다. GeForce 6, 7 시리즈에는 일부 모델 한정[8]으로 네이티브 AGP/PCIe 칩셋이 섞여 있고, 다른 종류의 인터페이스가 필요하다면 브리지 칩으로 지원했다. GeForce 8 시리즈부터는 모두 네이티브 PCIe로 가면서 동시에 브리지 칩 지원을 중단했다. 반면 ATI는 예상보다 AGP 시장이 오래 버텼기 때문에 PCIe-AGP 단방향 변환만 가능한 브리지 칩인 Rialto를 개발했고, 라데온 X700 시리즈부터 AMD한테 인수된 HD 4000 시리즈까지 일부 모델의 AGP 버전[9]을 만드는 데 이걸 잘 써먹었다. 결국, AMD도 HD 5000 시리즈부터는 더 이상 AGP 타입을 채택하지 않게 되었다. PCIe, 그것도 상위 버전으로 갈아타고 있는 지금은 모두 옛날 이야기.
-
PCIe 구버전 → 신버전 (각주 참고)[10]
AGP → PCIe 과도기에는 슬롯이라는 커넥터 규격조차 서로 달랐기 때문에 서로 다른 규격의 장치를 보유했을 때 해결 방법이 난감했다. 그에 비하면 PCIe 버전 간 과도기는 슬롯도 통일[11]되어 레인 개수 호환만 충족하면 어떻게든 동작할 수 있어서 훨씬 나은 편이다. 심지어 레인 개수가 적으면 해당 배속으로 동작하기 때문에 슬롯 부분을 자르는 식으로 억지로 껴맞춰도 작동은 한다. 다만 속도(대역폭)의 경우 하위 버전에 동기화되기 때문에 혹시라도 고사양 게임이나 고사양 작업 등의 여러 부문에서 제 성능이 안 나올 수 있음을 감안해야 한다.[12] 지금도 PCIe 규격을 널리 채용되고 있으므로 버전 바뀌는 시기가 매번 올 때마다 겪어보게 될 문제라고 볼 수 있다.
2.6.1.1.2. 대역폭과 게임 성능
- 참조 목록
- 2009년 9월 23일, TECHPOWERUP AMD Radeon HD 5870 PCI-Express Scaling Review
- 2010년 3월 27일, TECHPOWERUP GeForce GTX 480 PCI-Express Scaling Review
- 2012년 5월 7일, TECHPOWERUP Ivy Bridge PCI-Express Scaling with HD 7970 and GTX 680 Review
- 2014년 11월 1일, TECHPOWERUP GeForce GTX 980 PCI-Express Scaling
- 2015년 11월 4일, TECHPOWERUP AMD Radeon Fury X PCI-Express Scaling
-
2016년 6월 22일, Gamers Nexus PCIe 3.0 x8 vs. x16: Does It Impact GPU Performance?
- 2016년 12월 13일, TECHPOWERUP NVIDIA GeForce GTX 1080 PCI-Express Scaling
- 2018년 9월 25일, TECHPOWERUP NVIDIA GeForce RTX 2080 Ti PCI-Express Scaling
- 2019년 7월 7일, TECHPOWERUP PCI-Express 4.0 Performance Scaling with Radeon RX 5700 XT
- 2019년 12월 18일, ComputerBase PCI-E 3.0 vs. PCI-E 4.0: Was bringt PCI-Express 4.0 mit einer RX 5500 XT wirklich?
- 2019년 12월 22일, 쿨엔조이 [상세 리포트] RX 5500 XT PCI-E 이슈
- 2019년 12월 22일, 퀘이사존 [AVING의 상세 리포트] RX 5500 XT PCI-E 3.0 vs 4.0 이슈
- 2019년 12월 20일, tom's HARDWARE Is AMD’s Radeon RX 5500 XT Hamstrung by VRAM and PCIe Bandwidth?
-
2019년 12월 23일, Hardware Unboxed 5500 XT PCIe 3.0 vs. PCIe 4.0, Hamstrung by PCIe Bandwidth?
- 2020년 2월 4일, PC Games Hardware PCIe 3.0 vs. 4.0 in Spielen: Alles eine Frage des Grafikkarten-Speichers
- 2020년 2월 6일, 기글하드웨어 라데온에서 PCIe 4.0과 PCIe 3.0의 성능 비교
-
2020년 8월 24일, Hardware Unboxed 5700 XT PCIe 4.0 vs 3.0 + RTX 2080 Ti PCIe Scaling
- 2020년 9월 16일, TECHPOWERUP NVIDIA GeForce RTX 3080 PCI-Express Scaling
-
2020년 9월 18일, Gamers Nexus NVIDIA RTX 3080 PCIe 3.0 vs. PCIe 4.0 x16 Benchmarks (& Intel vs. AMD for 3080 Discussion)
-
2020년 9월 23일, Hardware Unboxed RTX 3080, PCI Express 4.0 vs. 3.0 Benchmark
- 2020년 11월 5일, 쿨엔조이 AMD RYZEN 5000 시리즈 벤치마크 부록 #4 PCIe 4.0 / 3.0 테스트 (RYZEN 9 5900X)
-
2021년 3월 24일, PCI Express 4.0 VS 3.0 Gaming Performance | RTX 3090 | Ryzen 9 5950X
- 2022년 11월 18일, 퀘이사존 RTX 4090 PCIe 4.0 / 3.0 테스트 (RYZEN 7 5800X3D)
게임을 할 때도 그래픽카드는 결국 CPU가 지시하는 것에 따라 연산을 행하게 된다. 이때, PCIe 대역폭은 CPU의 명령어를 얼마나 그래픽카드에 빨리 전달하냐를 결정하는데, 아무리 CPU 성능과 그래픽카드의 성능이 좋다 하더라도 PCIe 대역폭이 떨어지면 연산과정에서 병목현상이 발생하여 성능이 감소하게된다.
사실 PCIe의 대역폭은 대중적인 버전 x16 기준으로 실제 사용되는 수준에 비하면 매우 널널한 대역폭을 가지고 있다. 당대 최상급 그래픽카드를 사용한 벤치마크에서는 하나같이 PCIe 대역폭에 따른 게임 성능차이가 크지 않았으며, 이로 인해 PCIe의 버전이 게임 성능에 있어서 가지는 중요성은 거의 무시되기 십상이다.
그러나, 콘솔 세대 교체 등 게임 사양이 급격하게 증가할 때는 CPU 와 GPU 사이의 통신량도 따라 증가하면서 대역폭 사용량이 크게 늘어난다. 이런 이유 등으로 PCIe의 대역폭이 부족하면 따른 게임 성능에 가시적인 영향이 나타나고 있으며, 결국 PCIe 대역폭 부족으로 인해 나타나는 성능 저하는 CPU 성능 부족시 발생하는 성능저하(하위 1% 프레임레이트, 저해상도에서의 프레임레이트 등)와 동일한 형태로 나타난다. CPU 성능이 부족하든, PCIe 대역폭이 부족하든 그래픽카드 입장에서의 결과는 'CPU의 명령을 제때 전달받지 못한다'로 같기 때문.
x16으로 판매하는 일반적인 중급 이상 카드 기준, 대체로 원래 대역폭의 1/4 (x4 사용, 한세대 이전 버전의 x8 사용, 또는 두세대 이전 버전의 x16 사용)이 되면 가시적인 성능 저하가 나타나며, 그보다 더 낮아지면 극심한 성능 저하를 보인다. 그리고 같은 대역폭이면 이전 세대의 성능이 조금 더 떨어지는 편이며, CPU 직결보다 메인보드 칩셋에 연결하는 쪽의 성능이 좀 더 차이나게 떨어지는 경향이 있다.
결국 성능에 민감하다면 x8 사용, 한세대 이전 버전의 x16 사용이 실질적인 성능 저하를 피할 수 있는 마지노선이라고 볼 수 있다. 때문에 처음부터 x8, x4로 판매하는 5500XT, 6500XT 등을 이전 세대 PCIe로 사용하면 해당 문제를 겪기 쉬워진다.
특히 VRAM 부족 시에 PCIe 레인을 통해 CPU의 공유 메모리를 점유하면서 PCIe 대역폭에 더 큰 영향을 받으며, 이는 서로다른 VRAM 용량을 가진 5500XT끼리의 비교에서 확인할 수 있다. 2023년에는 AAA 게임 VRAM 요구량 이슈가 나오면서 RTX 3070을 16GB로 개조하여 비교한 결과 #가 나오기도 했다. 라데온 RX 5600 XT, 6GB -> 12GB 개조 테스트
현재로서는 PCIe 4.0에서 5.0으로 넘어가는 과도기에 해당하며, RTX 4090등 최상급 카드가 모두 4.0만 지원하는 등 성능 차이가 크지도 않고(3.0 vs 4.0) 확인하기도 힘든 상황(4.0 vs 5.0)이다. 특히, 아직까지 PCIe 대역폭으로 인한 성능 저하는 아직까지는 마니아들의 영역인 고사양 게임의 수백 프레임 단위에서 나타나는 성능 문제이기 때문에 당장은 별다른 관심을 받지 못하고 있다. 그러나, 더 높은 사양을 요구하는 최신 게임 및 최신 사양이 나타날 수록 차이가 두드러지게 될것 이기 때문에 시간이 갈수록 대역폭 차이에 의한 성능 격차는 커질 것으로 보인다.
-
현황
현황을 살펴보자면, 2016년 중반 당시엔 PCIe 3.0 ×16 규격에 그래픽 메모리 용량이 8 GB인 지포스 GTX 1080이 PCIe 3.0 ×8 대역폭 대비 1% 정도의 성능 차이를 보였으며, 이 정도면 당장 PCIe 4.0을 지원해도 성능 향상은 사실상 없을 것이다가 주류였다. 그러다가 2018년 이후에는 게임의 요구 대역폭이 나날이 높아짐에 따라 비로소 PCIe 3.0 ×8과 ×16에 의한 성능 차이가 점점 커지기 시작하고, 2019년 이후 4 GB와 8 GB 두 가지로 출시된 라데온 RX 5500 XT를 통해 그래픽 메모리 용량에 따라 PCIe 대역폭의 의존도가 달라져 성능 차이를 드러내는 것으로 밝혀졌으며,[13] 2020년에 들어서는 라데온 RX 5700 XT를 통해 PCIe 4.0 ×16 대역폭과 PCIe 3.0 ×16 대역폭의 성능 차이가 작년까지 출시된 게임들의 경우는 큰 차이 없었지만, 최신 고사양 게임들은 PCIe 3.0 ×16급의 대역폭조차 더 이상 남아도는 대역폭이라고 보기 어려울 정도로 게임 성능 차이가 두드러지게 나타나고 있다. 앞으로 출시될 고사양 게임들을 생각하면 PCIe 4.0 ×16 대역폭이 부질 없는 정도가 아니라 요구 사양이 된 셈이다.
특히, 라데온 RX 5500 XT는 GPU 성능 자체가 당대 하이엔드가 아닌데다 4 GB, 8 GB 해서 2가지 종류로 판매된 라인이기 때문에 PCIe 대역폭과 그래픽 메모리 용량의 관계를 파악할 수 있는 특이한 벤치마크이다. 하지만 안타깝게도, 해당 벤치마크가 보여주는 복합적인 특성 때문인지 PCIe 대역폭을 무시하고 그냥 그래픽 메모리 용량에 따른 성능 격차로 오해하는 사람들이 많다.
2020년 11월에 AMD 4세대 라이젠 CPU가 등장한 이후, 해당 CPU로 테스트할 경우 지포스 RTX 3080 PCIe 3.0 ×16과 PCIe 4.0 ×16의 성능 차이가 인텔 10세대 코어 i CPU로 테스트했을 때보다 더 두드러지기 시작했다.
-
상기 벤치마크를 볼 때 유의 사항
상기 제시된 자료들에도 FPS를 측정할 때, 평균 프레임만 관찰하는 자료들이 많이 보이나, 이런 자료만으로 성능차이를 단언하는 것은 위험하다. 실제로 PCIe 대역폭은 CPU 성능처럼 평균 프레임에 대한 영향이 지대하진 않다. 따라서 위 벤치마크 자료들을 볼 때는 하위 1% 평균 프레임 레이트에서 격차를 위주로 관찰하면 차이를 좀더 명확히 볼 수 있으며, 역시 고해상도보다는 저해상도의 게임 성능 변별력이 더 큰 경향을 보여준다.
2.6.1.2. PCI Express CPU
인텔 제온 파이나 CELL-Broadband Engine 등이 있으나 대부분 실패한다.
중앙 CPU의 부족한 부동소수점 연산을 보조하기 위해 제작했는데 어차피 GPU가 그 부족한 부동소수점 연산을 훨씬 잘 보조했기 때문이다.
2.6.1.3. PCI Express PPU
물리 연산 전용 프로세서로 현재는 그래픽카드에 통합되었다.
PhysX 문서 참조
2.6.1.4. PCI Express 전용연산장치
ASIC이나 FPGA 로 구성되어 AI 연산, 암호화폐 채굴 등에 사용된다.Pcie를 사용하는 Nvme m.2 단자에도 사용되는데 사진의 AI 연산 가속기는 40tops의 AI 연산을 지원해 윈도우 AI 코파일럿 인증의 최소 사항을 만족 못시키는 CPU를 위해 쓴다.
2.6.2. PCI Express 저장장치
2.6.2.1. PCI Express SSD
PCIe 버전에 따른 속도 증가가 가장 확실하게 드러나는 장치로, 낸드 플래시 메모리의 대장격인 SLC와 그 낸드플래시와 DRAM의 중간적인 속도를 보여주는 옵테인 메모리의 경우는 PCIe 속도 규격조차 부족할 정도다. 보통 NVMe 프로토콜을 사용한다.-
PCI Express Standard 타입의 SSD
그래픽 카드처럼 PCI Express 확장 카드 형태의 SSD도 2007년 8월에 바이올린 메모리의 바이올린 1010 SSD를 통해 처음 등장했다. 지금처럼 고속 SSD에 어울리는 표준 프로토콜도 따로 없이 HDD에 사용되었던 AHCI 기반이었고, 일반 가정에서는 구경하기 힘든 SSD였으며, 지금도 일반 가정용 시장에 힘을 쓰지 못 하고 있다. 가격은 둘째치고 공간적인 문제, 메인보드의 슬롯 지원과 케이스의 여유 공간에 따른 탑재 가용성 문제, CPU와 메인보드 칩셋의 PCIe 슬롯 개수 부족 문제 등이 산재되어 있기 때문.
-
PCI Express Standard To PCI Express M.2
하급 H,A보드사용자들이나 SSD를 매우많이 사용하는 사용자들혹은 기업들을 위해 만들어진 확장 카드. 대부분 PCIe버전에 영향받지않으며 16레인에 M.2단자가 2개이하로 달린경우 커패시터조차도 없는 단순한 형태이지만 4레인규격의 카드는 커패시터가 달린경우가 많으며 고급형 버전의경우 냉각을위해[14] 블로워 팬을 장착한다.
설계상 두가지 종류가 존재하는데, 호스트의 PCIe 슬롯을 M.2 슬롯으로 직접 매핑한 라이저 방식 카드와 PCIe 스위치가 달린 카드 두 종류가 존재한다. 전자의 경우 호스트의 PCIe를 직접 매핑한게 다 이므로, 호스트의 레인을 직접 사용한다. 다만 이 방식은 PCIe 4x4 카드를 4레인 슬롯에 연결하는 것과 같이 호스트의 PCIe 레인이 부족한 경우 첫번째 카드만 사용이 가능하며 루트 컴플렉스에서 bifurcation을 지원해야 한다. 만약 호스트가 bifurcation를 지원하지 않으면 레인이 충분하여도 첫번째 연결된 장치만 사용이 가능하다. 후자의 경우 이와 달리 1 레인만 있어도 대역폭에 제한이 가해 질 뿐 사용이 가능하며 호스트의 bifurcation 지원이 필요하지 않다.
-
PCI Express M.2 타입의 SSD
2011년에 발표된 NVMe 프로토콜과 2013년에 발표된 M.2 커넥터 규격이 등장하면서 일반 가정에서도 PCIe를 이용한 SSD를 쉽게 접할 수 있게 되었다. M.2 타입의 SSD는 기존 2.5인치 타입의 SSD 대비 비싼 가격대라도 사이즈가 매우 작은 폼팩터라는 확실한 강점이 있어서 점유율이 꾸준히 높아지고 있다.
2024년 1분기 기준 최초로 팀그룹과 MSI에서 발표했으며 #[15]랑 #[16] 2개가 발표되었으며 낸드플래시 자체생산사중 최초로 마이크론이 T700을 공개및 출시해 상용화 되었고 하이닉스가 퀘이사존 라이브에서 해치 H01을 공개했다.
2.6.2.2. PCI Express 하드디스크
SATA와 PCIe를 직결한 SATA Express 기술도 등장했다. 기존 SATA 3의 3배나 되는 데이터 대역폭을 가졌으나 m.2 NVMe에 밀려서 거의 사용되지 않는다.
NVMe 2.0 부터 하드디스크도 PCI Express에 연결이 가능하다. 다만 NVMe 2.0이 2020년에 발표되었으나 2022년까지 그러한 하드디스크는 출시 되지 않았다.
2.6.2.3. PCI Express HBA
SATA/ SAS 포트나 Fiber Channel를 PCI Express로 확장하는 카드. 개인 소비자용 제품은 2-8개 정도지만 SAS는 65535개의 디스크를 SAS를 통해 사용 가능하다.FC HBA의 경우 NIC도 그렇고 트랜시버도 똑같이 생겼지만 FC HBA는 네트워크 기능이 없는 아예 다른 제품이다.
2.6.3. PCI Express 사운드 카드
PCI Express를 이용한 사운드 카드는 그래픽 카드보다도 훨씬 늦은 2008년 11월에 ASUS XONAR HDAV 1.3 Deluxe를 통해 등장했다. 그래픽 카드에 비해 대체로 요구 대역폭이 낮은 편이라서[17] 고대역폭 규격의 필요성이 약했기 때문. 그런 이유에서였는지, 여러 제품을 잘 살펴보면 네이티브 PCI-Express 방식이 아닌 내부에서 컨버팅을 통해 동작되는 사운드카드가 꽤 있는 편이다. PCI 컨버터 칩셋인 ASM1083을 탑재한 ASUS XONAR DSX가 있으며, 그외에도 ASM1083을 탑재하여 PCI로 컨버팅 후 구형 칩셋인 CMI8738을 물린 탑재한 싸구려 사운드카드가 매우 흔하다. 세대를 거듭하면서 메인보드에 탑재되어 있었던 레거시 PCI 슬롯이 점점 사라져가고 있기 때문.다만 전문가용 오디오 인터페이스들의 경우 PCIe를 탑재한 제품들은 여전히 출시되고 있는데, 이는 USB나 Thunderbolt 보다 훨씬 레이턴시가 작으며 대역폭도 높아 수십개의 192kHz @ 32bit PCM같은 오디오 채널 IO를 넉넉하게 받아낼 수 있는 사실상의 유일한 방법이기 때문이다.
2.6.4. PCI Express 근거리 통신 카드
10기가 인터넷, 100기가비트 이더넷 등 대역폭이 큰 유/무선 근거리 통신망( LAN) 랜카드는 데이터 버스로 PCIe를 사용한다.
구리선 UTP/ STP는 물론 WiFi 6, WiFi 7 같은 고대역폭 무선망이나 광통신에서도 사용된다.
2.6.5. PCI Express 기타 데이터버스 확장카드
USB4, USB 3.0, 썬더볼트 등 데이터 대역폭이 큰 다른 데이터 버스 확장 카드 연결에도 쓰인다. PCI Express는 이들보다 데이터 대역폭이 빠르기 때문이다.2.7. 수요 증가와 비용 및 인증 문제
키사이트의 PCIe 6.0/5.0 인증 검증 카드 및 보드
PCIe의 범용성답게 그래픽 카드 뿐만 아니라 보조 연산장치, 저장장치( NVMe 등), 이더넷 카드( 10기가비트 이더넷), USB4 등 높은 대역폭을 요구하는 주변기기들이 늘어나면서 급속도로 발전하고 있다. 그러나 대역폭이 높아지면서 PCIe 규격 역시 신호 배선의 고정밀도, 높은 수준의 차폐와 슬롯, 신호 거리 제한에 따른 클록 리드라이버 등 보조 IC를 요구하기 때문에 그만큼 제작은 물론 이를 인증 받는 절차가 까다롭고 가격도 비싸져서 개인용 시장에서 도입이 늦어지고 있다.
개인용 장비에서 PCIe 4.0의 공식 지원 관련해서 AMD 기준 데스크탑용 CPU는 라이젠 3세대 CPU(Matisse)가 최초이며, 모바일용 APU는 라이젠 5세대 APU(Rembrandt)가 최초로 지원된다.[18] 메인보드 같은 경우는 X570 메인보드가 최초이다. 인텔 기준 모바일용 CPU는 타이거 레이크가 최초이며, 데스크탑용 CPU는 로켓 레이크가 최초이다.[19] 메인보드 같은 경우는 CPU 직렬 레인을 통해서 지원하는 메인보드는 500번대 메인보드가 최초이며, 메인보드 칩셋 자체에서 지원하는 메인보드는 600번대(H610 제외) 메인보드가 최초이다.
개인용 장비에서 PCIe 5.0 공식 지원은 인텔 기준 CPU는 엘더 레이크가 최초이다. 메인보드 같은 경우는 CPU 직렬 레인을 통해서 지원하는 메인보드는 600번대 메인보드가 최초이며, 메인보드 칩셋 자체에서 지원하는 메인보드는 아직까지 전무하다. AMD 기준 데스크탑용 CPU는 라이젠 5세대 CPU(Raphael)[20]이 최초이며, 모바일용 APU는 아직까지 전무하다. 메인보드 같은 경우는 CPU 직렬 레인을 통해서 지원하는 메인보드는 600번대 메인보드가 최초이며, 메인보드 칩셋 자체에서 지원하는 메인보드는 아직까지 전무하다.
같은 시기에 서버 장비들은 이미 PCIe 5.0이 출시되고, PCIe 6.0 규격을 정하는( #) 단계에 들어간 것과 대조적이다. 또한 개인용 시장에서는 PCIe 4.0으로 바뀌면서 큰 성능 향상을 기대할 수 없지만[21] 반면에 여러 개의 딥러닝용 GPGPU를 사용해야 하는 하이엔드 서버 시장에서는 의미있는 성능 향상이 예측된다. PCIe 4.0 발표 후 IBM의 POWER 같은 대형 서버 제품군에서 바로 지원이 시작되고 PCIe 5.0도 POWER에서 먼저 적용된 것과 개인용 시장에 PCIe 5.0이 막 도입될때 인텔 제온 시리즈는 PCIe 6.0을 도입한 것도 # 비슷한 맥락이다.
GTC 2024에서 PCIe 6.0 연결 데모를 선보였다.
PCIe 7.0 0.5가 발표되었다.
3. 관련 문서
[1]
x16 슬롯 기준이다. x1 슬롯은 10W, x4 슬롯은 25W까지 공급이 가능하다.
[2]
이는 2010년대의 모든 소비자용 그래픽카드뿐만아니라 레퍼런스 모델 기준으로 RX 6900 XT까지도 충분히 가능하며 10% 전력제한을 건다면 RX 6000 시리즈의 모든 GPU들을 보조전원 없이 슬롯에서 공급받는 전원으로 구동시킬 수 있는 수준이다.
[3]
비표준
[4]
mSATA와는 형태는 같지만 슬롯 구조가 다르다. 정확히는 Key 위치가 서로 반대로 되어있다.(mPCIe는 왼쪽, mSATA는 오른쪽.)
[5]
다만
그래픽카드는 GPU의 연산 뿐만 아니라 영상과 음성(디스플레이 포트, HDMI) 같은 출력 기능도 겸한다.
[6]
정확히는 CPU 직렬 레인은 지원하나, 메인보드 칩셋에서 지원하지 않는다.
[7]
2018년에 AMD에서 그래픽 카드에 2테라 SSD를 내장한 제품인 RADEON PRO SSG를 출시하여 GPU에서 해당 스토리지에 직접 접근하는 구조를 제안한적이 있으나, ADOBE사 프로그램의 특정작업 캐시용으로만 목적에 부합한 사용이 가능했고, PC 저장장치로서는 GPU를 거쳐야 하는 과정으로 인해 오히려 지연속도를 발생시키고 대역폭에 손해를 발생시키는 문제가 있었다.
[8]
GeForce 6 시리즈 : GeForce 6800 GT DUAL, GeForce 6700 XL 등의 일부 모델을 제외한 대부분의 모델,
GeForce 7 시리즈 : 7600GT, 7600GS, 7800GS/GS+, 7950GT 계열
[9]
X700, X850, X1650, X1950XT, HD2600XT, HD 3850, HD4670 등의 일부 모델
[10]
2007~2008년(PCIe 2.0 도입), 2011~2014년(PCIe 3.0 도입), 2018~2022년(PCIe 4.0 도입), 2023~2024년 현재(PCIe 5.0 도입)
[11]
실제로 저장장치(SSD)의 경우 PCI Express 대역폭을 사용하는 NVMe 방식의 SSD는 M.2를 사용하고 있고 그래픽카드의 경우
ZOTAC 지포스 GT710 ZONE D3 1GB LP 무소음 PCIE x1와 같이 특수한 그래픽 카드를 제외한 대부분의 그래픽 카드의 경우 PCI Express x16(16배속) 슬롯을 공통적으로 사용하는 경우가 많다.
[12]
PCI Express의 경우 과거 AGP 슬롯을 사용한 시기에 비하면 상황이 나은데 AGP 슬롯 시기에는
ASRock P4i45GV, 775i45GV와 같은 일부 메인보드 중에는
845GV 칩셋 자체에서 애초에 AGP를 정식적으로 지원하지 않아 메인보드 제조사에서 AGP 그래픽카드를 사용할 목적으로 유사 AGP(AGI) 슬롯을 제공한 경우가 있었다. 하지만 문제는 AGP x8 그래픽카드를 장착해도 여러 호환 문제가 발생하여 비정상 작동하는 경우도 많은 편이라서 대표적으로 ATI(현재의 AMD) Radeon 계열(ATI Radeon 9600XT 등)의 경우 AGI에서 장착할 경우 메인보드에서 인식을 못해 장착할 경우 컴퓨터 사용이 불가능했다. 거기에 유사 AGP 슬롯의 경우 구형 PCI 슬롯의 대역폭을 활용한 관계로 AGP 슬롯에 비해 속도도 떨어졌다.
[13]
한편 VRAM이 충분한 상황에서도 4 GB 모델의 PCIe 버전에 따른 성능격차가 8 GB 모델보다 더 큰 성능격차를 보여주면서 내부적인 최적화가 잘못되어 나타난 문제라는 의심을 받고 있다.
[14]
당연하지만 SSD 4개가 서로 붙은채로 작동한다면 2.0이하의 SSD거나 P31이 아닌이상 방열판으로도 감당하기 힘들다.
[15]
순차 읽기 13,000MB/s, 순차 쓰기 12,000MB/s
[16]
순차 읽기 12,000MB/s, 순차 쓰기 11,000MB/s, 랜덤 읽기 1,500K IOPS, 랜덤 쓰기 2,000K IOPS
[17]
외장 사운드 카드도 USB 2.0을 달고 나오는 판이다.
[18]
데스크탑, 모바일 구분 없이 오직 시기상으로만 본다면
라이젠 3세대 CPU(Matisse)가 최초이다.
[19]
데스크탑, 모바일 구분 없이 오직 시기상으로만 본다면
타이거 레이크가 최초이다.
[20]
문서 제목에는 6세대라고 나와있지만, 모바일용 APU로 출시되는 젠3+때문에 젠3+가 5세대, 젠4를 6세대로 구분한것이다. 즉, 데스크탑용 CPU만 본다면 5세대가 맞다.
[21]
발표 당시 일부
NVMe 기반 SSD를 제외하면 큰 성능 향상 폭이 없었다.