최근 수정 시각 : 2024-09-11 17:49:45

NVIDIA/GPU


1. 개요2. GPU 요약 목록3. 용도별 제품군 목록
3.1. GeForce (게이밍 제품군)3.2. GeForce Laptop (게이밍 노트북용 제품군)3.3. NVIDIA RTX (워크스테이션 제품군)3.4. NVIDIA NVS (멀티모니터 출력 제품군)3.5. NVIDIA 데이터 센터 GPU (데이터 센터 제품군)3.6. NVIDIA TITAN (게이밍 및 워크스테이션 겸용 제품군)3.7. GRID (가상화 제품군)
3.7.1. GRID K13.7.2. GRID K23.7.3. GRID K33.7.4. GRID K53.7.5. GRID M
3.8. Mining 제품군
4. 마이크로아키텍처별 GPU 목록
4.1. NV4.2. NV24.3. NV34.4. NV4 (Fahrenheit)4.5. NV10 (Celsius)4.6. NV20 (Kelvin)4.7. NV30 (Rankine)4.8. NV40 (Curie)4.9. G80 (Tesla)4.10. Fermi4.11. Kepler4.12. Maxwell4.13. Pascal4.14. Volta4.15. Turing4.16. Ampere4.17. Hopper4.18. Ada Lovelace4.19. Blackwell4.20. Rubin
5. 관련 문서

[clearfix]

1. 개요

NVIDIA의 GPU 목록.

2. GPU 요약 목록

{{{#!wiki style="margin: -10px -10px;" <tablealign=center><tablewidth=100%><tablebordercolor=#76b900><tablebgcolor=#76b900> 파일:NVIDIA 틀용 로고.svg NVIDIA
GPU 목록
}}}
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1px -11px"
{{{#!wiki style="word-break:keep-all; font-size:0.9em"
<colcolor=white><colbgcolor=#004831> '''
NV
'''
NV1
'''
NV3
'''
RIVA 128
'''
TwiN Texel
(Fahrenheit)
'''
RIVA TNT
RIVA TNT2
'''
QuadPipe
(Celcius)
'''
GeForce 256 - Quadro - -
GeForce 2 - Quadro 2 - -
'''
nFiniteFX I, II
(Kelvin)
'''
GeForce 3 - Quadro DCC - -
GeForce 4 - Quadro 4 Quadro 4 NVS -
'''
CineFX 1.0, 2.0
(Rankine)
'''
GeForce FX - Quadro FX Quadro NVS -
'''
CineFX 3.0, 4.0
(Curie)
'''
GeForce 6 - -
GeForce 7 - QUADRO FX - -
'''
Unified (Shader)
(Tesla)
'''
GeForce 8 - QUADRO NVS TESLA 800
GeForce 9 - - -
GeForce 200 - QUADRO NVS TESLA 1000
GeForce 100 - - - -
GeForce 300 - - - -
'''
Fermi
'''
GeForce 400 - QUADRO - TESLA 2000
GeForce 500 - NVS
'''
Kepler
'''
GeForce 600 - QUADRO K TESLA K
GeForce 700 GTX TITAN
GeForce 800 GTX TITAN BLACK/Z
'''
Maxwell
'''
GeForce 700 - - -
GeForce 800 - - - -
GeForce 900 GTX TITAN X QUADRO M - TESLA M
'''
Pascal
'''
GeForce 10 TITAN X/Xp QUADRO P - TESLA P
'''
Volta
'''
- TITAN V QUADRO GV100 - TESLA V
'''
Turing
'''
GeForce 20 TITAN RTX QUADRO RTX - TESLA T
GeForce 16 - - - -
'''
Ampere
'''
GeForce 30 - RTX A - A
'''
Hopper
'''
- - - - H
'''
Ada Lovelace
'''
GeForce 40 - RTX - -
'''
Blackwell
'''
GeForce 50 - - - -
GeForce · GeForce Laptop · NVIDIA RTX · 데이터 센터 GPU }}}}}}}}}}}}

3. 용도별 제품군 목록

3.1. GeForce (게이밍 제품군)

파일:상세 내용 아이콘.svg   자세한 내용은 GeForce 문서
번 문단을
부분을
참고하십시오.

파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
다른 뜻에 대한 내용은 GTX 문서
번 문단을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.

3.2. GeForce Laptop (게이밍 노트북용 제품군)

파일:상세 내용 아이콘.svg   자세한 내용은 NVIDIA/모바일 GPU 문서
번 문단을
부분을
참고하십시오.

3.3. NVIDIA RTX (워크스테이션 제품군)

파일:상세 내용 아이콘.svg   자세한 내용은 NVIDIA RTX 문서
번 문단을
부분을
참고하십시오.

3.4. NVIDIA NVS (멀티모니터 출력 제품군)

파일:상세 내용 아이콘.svg   자세한 내용은 NVIDIA NVS 문서
번 문단을
부분을
참고하십시오.

3.5. NVIDIA 데이터 센터 GPU (데이터 센터 제품군)

파일:상세 내용 아이콘.svg   자세한 내용은 NVIDIA 데이터 센터 GPU 문서
번 문단을
부분을
참고하십시오.

3.6. NVIDIA TITAN (게이밍 및 워크스테이션 겸용 제품군)

파일:상세 내용 아이콘.svg   자세한 내용은 NVIDIA TITAN 문서
번 문단을
부분을
참고하십시오.

3.7. GRID (가상화 제품군)

3.7.1. GRID K1

||<|2><tablealign=center><tablebordercolor=#76b900><rowbgcolor=#76b900><rowcolor=white> 모델명 ||<-4> GPU ||<-4> 그래픽 메모리 ||<|2> TDP
(W) ||<|2> 출고
가격
($) ||
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격 클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> K1 GK107
(28㎚)
(118㎟)
192:16:16
x4
(1 x4, 1 x4)
850
(기본)
256
x4
128
x4
DDR3 891
(1782)
4
x4
130 4140
K180Q 192:16:16
(1, 1)
256 128 1 125
K160Q
K140Q
K120Q 0.5
K100 0.25 63
{{{#!folding 【이론적인 성능 계산식 펼치기 · 접기】

3.7.2. GRID K2

||<|2><tablealign=center><tablebordercolor=#76b900><rowbgcolor=#76b900><rowcolor=white> 모델명 ||<-4> GPU ||<-4> 그래픽 메모리 ||<|2> TDP
(W) ||<|2> 출고
가격
($) ||
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격 클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> K2 GK104
(28㎚)
(294㎟)
1536:128:32
x2
(4 x2, 8 x2)
745
(기본)
512
x2
256
x2
GDDR5 1250
(5000)
4
x2
225 5199
K280Q 1536:128:32
(4, 8)
512 256 4 1875
K260Q 2 937
K240Q 1 469
K220Q 0.5
K200 0.25 235
{{{#!folding 【이론적인 성능 계산식 펼치기 · 접기】

3.7.3. GRID K3

||<|2><tablealign=center><tablebordercolor=#76b900><rowbgcolor=#76b900><rowcolor=white> 모델명 ||<-4> GPU ||<-4> 그래픽 메모리 ||<|2> TDP
(W) ||<|2> 출고
가격
($) ||
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격 클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K340 GK107
(28㎚)
(118㎟)
384:32:8
x4
(1 x4, 2 x4)
950
(기본)
128
x4
64
x4
GDDR5 900
(3600)
1
x4
225 3299
{{{#!folding 【이론적인 성능 계산식 펼치기 · 접기】

3.7.4. GRID K5

||<|2><tablealign=center><tablebordercolor=#76b900><rowbgcolor=#76b900><rowcolor=white> 모델명 ||<-4> GPU ||<-4> 그래픽 메모리 ||<|2> TDP
(W) ||<|2> 출고
가격
($) ||
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격 클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> K560Q GK104
(28㎚)
(294㎟)
1536:128:32
x2
(4 x2, 8 x2)
745
(기본)
512
x2
256
x2
GDDR5 1250
(5000)
4
x2
225 3599
K540Q
K520Q
K520
K500
{{{#!folding 【이론적인 성능 계산식 펼치기 · 접기】

3.7.5. GRID M

||<|2><tablealign=center><tablebordercolor=#76b900><rowbgcolor=#76b900><rowcolor=white> 모델명 ||<-4> GPU ||<-4> 그래픽 메모리 ||<|2> TDP
(W) ||<|2> 출고
가격
($) ||
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격 클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> M60-8Q GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
930
(기본)
1180
(부스트)
2 256 GDDR5 1253
(5012)
8 225 3599
M60-4A 4 ?
M60-2Q 2 ?
M60-1Q 1 ?
M6-8Q 1536:96:64
(3, 12)
722
(기본)
8 100 ?
M10-8Q GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1033
(기본)
1306
(부스트)
128 1300
(5200)
225 ?
M3-3020 2 ? ?
M40 384:32:16
(1, 3)
930
(기본)
1000
(부스트)
1350
(5400)
4 50 ?
{{{#!folding 【이론적인 성능 계산식 펼치기 · 접기】

3.8. Mining 제품군

이름에서 보듯 채굴기이다. 그래서 모니터 연결용 단자가 없다. Linus Tech Tips는 중국에서 이걸 사와서 이걸로 게임을 돌리는 데 성공했다..

||<|2><tablealign=center><tablebordercolor=#76b900><rowbgcolor=#76b900><rowcolor=white> 모델명 ||<-4> GPU ||<-4> 그래픽 메모리 ||<|2> TDP
(W) ||<|2> 출고
가격
($) ||
<rowcolor=white> 칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격 클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
<colbgcolor=black><colcolor=#76b900> P102-101 GP102
(16㎚)
(471㎟)
3200:200:80
(5, 25)
1557
(기본)
1670
(부스트)
2.5 320 GDDR5 2002
(8008)
10 250 ?
P102-100 1481
(기본)
1582
(부스트)
GDDR5X 1251
(10008)
5 ?
P104-101 GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1607
(기본)
1733
(부스트)
2 256 8 ? ?
P104-100 1920:120:64
(3, 15)
4 ? ?
P106-100 GP106
(16㎚)
(200㎟)
1280:80:48
(2, 10)
1506
(기본)
1709
(부스트)
1.5 192 GDDR5 2002
(8008)
6 120 ?
P106-090 768:48:48
(2, 6)
1354
(기본)
1531
(부스트)
3 75 ?
{{{#!folding 【이론적인 성능 계산식 펼치기 · 접기】

4. 마이크로아키텍처별 GPU 목록

4.1. NV

파일:nvidia nv1 microarchitecture blockdiagram.jpg
NV1의 블록 다이어그램

||<-10><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> 프로세서별 최대 내부 구성 요소 ||
<rowcolor=white> 프로세서
이름
공정
(㎚)
면적
(㎟)
QDS RZ PP 픽셀
INT32
ALU
TMU ROP MC
(bit)
(채널)
NV1
NV1 500 90 1 1 1 4 1 1 32×2


||<-6><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> 프로세서별 특성 ||
<rowcolor=#373a3c,#212121> 프로세서
이름
그래픽
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
NV1
NV1 DirectX 1.0
(S/W 가속)
자체 그래픽 API
- PCI FPM DRAM
EDO DRAM
VGA
(D-Sub)

  • QDS: Quadrangle Setup
  • RZ: Rasterizer
  • PP: Pixel Pipeline
  • INT32: 32-bit Integer
  • TMU: Texture Mapping Unit
  • ROP: Raster Operation 또는 Render Output
  • MC: Memory Controller

4.2. NV2

원래 NVIDIA의 2번째 그래픽카드가 될 예정이었으나 세상에 빛을 보지 못한 물건. 세가 새턴 후속기에 장착될 예정이었지만 하위 호환 기능이 제거되면서 드림캐스트에는 PowerVR 칩이 들어가게 되었다.



파일:CC-white.svg 이 문단의 내용 중 전체 또는 일부는 문서의 r63에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문단의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r63 ( 이전 역사)
문서의 r ( 이전 역사)

4.3. NV3

파일:nvidia nv3 microarchitecture blockdiagram 1.jpg
RIVA 128에 사용된 NV3의 전체 블록 다이어그램
파일:nvidia nv3 microarchitecture blockdiagram 2.jpg
RIVA 128에 사용된 NV3의 그래픽 엔진 부분 블록 다이어그램
||<-14><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900> 프로세서별 최대 내부 구성 요소 ||
<rowcolor=#fff> 프로세서
이름
공정
(㎚)
면적
(㎟)
TRS RZ PP 픽셀
INT32
ALU
TMU 버텍스
캐시
(KB)
텍스처
캐시
(KB)
Z
캐시
(KB)
픽셀
캐시
(KB)
ROP MC
(bit)
(채널)
NV3
NV3 350 90 1 1 1 4 1 ? ? ? ? 1 32×4
프로세서별 특성
<rowcolor=#fff> 프로세서
이름
그래픽
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
NV3
NV3 DirectX 5.0
OpenGL 1.1
MPEG-2
Motion
Compensation
AGP 1×
PCI
SDR VGA
(D-Sub)
  • TRS: Triangle Setup

4.4. NV4 (Fahrenheit)

||<-14><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> 프로세서별 최대 내부 구성 요소 ||
<rowcolor=white> 프로세서
이름
공정
(㎚)
면적
(㎟)
TRS RZ PP 픽셀
INT32
ALU
TMU 버텍스
캐시
(KB)
텍스처
캐시
(KB)
Z
캐시
(KB)
픽셀
캐시
(KB)
ROP MC
(bit)
(채널)
NV4
<colbgcolor=black>NV4 350 90 1 1 2 8 2 ? ? ? ? 2 32×4
NV5 250 90 1 1 2 8 2 ? ? ? ? 2 32×4
NV6 220 90 1 1 2 8 2 ? ? ? ? 2 32×4


||<-6><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> 프로세서별 특성 ||
<rowcolor=#373a3c,#212121> 프로세서
이름
그래픽
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
NV4
<colbgcolor=#000000>NV4 DirectX 6.0
OpenGL 1.2
MPEG-2
Motion
Compensation
AGP 2×
PCI
SDR VGA
(D-Sub)
NV5 AGP 4×
AGP 2×
PCI
NV6

4.5. NV10 (Celsius)

파일:nvidia nv15 microarchitecture blockdiagram.gif
지포스 2 GTS에 사용된 NV15의 블록 다이어그램

파일:nvidia nv11 microarchitecture blockdiagram.gif
지포스 2 MX에 사용된 NV11의 블록 다이어그램

||<-16><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
T&L 버텍스
FP32
벡터
TRS NSR PP 픽셀
INT32
ALU
TMU 버텍스
캐시
(KB)
텍스처
캐시
(KB)
Z
캐시
(KB)
픽셀
캐시
(KB)
ROP MC
(bit)
(채널)
NV10
<colbgcolor=black>NV10 220 111 1 4 1 1 4 16 4 ? ? ? ? 4 32×4
NV11 180 65 1 4 1 1 2 8 4 ? ? ? ? 2 32×4
NV15 180 90 1 4 1 1 4 16 8 ? ? ? ? 4 32×4
NV16 150 81 1 4 1 1 4 16 8 ? ? ? ? 4 32×4
NV17 150 65 1 4 1 1 2 8 4 ? ? ? ? 2 32×4
NV18 150 65 1 4 1 1 2 8 4 ? ? ? ? 2 32×4
NV19 150 65 1 4 1 1 2 8 4 ? ? ? ? 2 32×4


||<-6><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> GPU별 특성 ||
<rowcolor=#373a3c,#212121> GPU
이름
그래픽
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
NV10
<colbgcolor=#000000>NV10 DirectX 7.0
OpenGL 1.2
MPEG-2
Motion
Compensation
AGP 4× SDR
DDR
VGA
(D-Sub)
DVI
NV11 HDVP AGP 4×
PCI
NV15 AGP 4×
NV16
NV17 VPE
NV18 AGP 8×
NV19 PCIe ×16

  • T&L: Transform & Lighting
  • FP32: 32-bit(Single-Precision) Floating-Point Real Number
  • NSR: NVIDIA Shading Rasterizer

GeForce라는 브랜드의 기원이 된 마이크로아키텍처의 시작이자 하드웨어 T&L을 지원하는 최초의 마이크로아키텍처.

4.6. NV20 (Kelvin)

파일:nvidia-gpu-nv20-vertexshader.gif
지포스 3 시리즈에 사용된 NV20의 버텍스 셰이더 블록 다이어그램

파일:nvidia-gpu-nv20-vertexprocess.gif
지포스 3 시리즈에 사용된 NV20의 버텍스 프로세스 블록 다이어그램

파일:nvidia-gpu-nv20-pixelshader.gif
지포스 3 시리즈에 사용된 NV20의 픽셀 셰이더 블록 다이어그램

파일:nvidia-gpu-nv25-blockdiagram.png
지포스 4 Ti 시리즈에 사용된 NV25의 블록 다이어그램

||<-17><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
T&L PVSP 버텍스
셰이더
FP32
벡터
TRS RZ PPSP 픽셀
셰이더
INT32
ALU
TMU 버텍스
캐시
(KB)
텍스처
캐시
(KB)
Z
캐시
(KB)
픽셀
캐시
(KB)
ROP MC
(bit)
(채널)
NV20
<colbgcolor=black>NV20 150 128 1 1 4 1 1 4 16 8 ? ? ? ? 4 32×4
NV25 150 142 1 2 8 1 1 4 16 8 ? ? ? ? 4 32×4
NV28 150 101 1 2 8 1 1 4 16 8 ? ? ? ? 4 32×4


||<-6><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> GPU별 특성 ||
<rowcolor=#373a3c,#212121> GPU
이름
그래픽
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
NV20
<colbgcolor=#000000>NV20 DirectX 8.0
OpenGL 1.3
HDVP AGP 4× DDR VGA
(D-Sub)
DVI
NV25 SDR
DDR
NV28 AGP 8×

  • PVSP: Programmable Vertex Shading Pipeline
  • PPSP: Programmable Pixel Shading Pipeline

4.7. NV30 (Rankine)

파일:nvidia-gpu-nv30-blockdiagram.png
지포스 FX 5800 시리즈에 사용된 NV30의 블록 다이어그램

||<-17><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
T&L PVSP 버텍스
셰이더
FP32
벡터
TRS RZ PPSP 픽셀
셰이더
FP32
ALU
픽셀
셰이더
미니
ALU
TMU 텍스처
컬러
보간기
지오메트리
텍스처
캐시
(KB)
컬러
Z-타일
캐시
(KB)
ROP MC
(bit)
(채널)
NV30
<colbgcolor=black>NV30 130 200 1 3 12 1 1 8 32 - 8 8 ? ? 8 32×4
NV31 130 135 1 1 4 1 1 4 16 - 4 4 ? ? 4 32×4
NV34 150 91 1 1 4 1 1 4 16 - 4 4 ? ? 4 32×4
NV35 130 207 1 3 12 1 1 8 32 8 8 8 ? ? 8 64×4
NV36 130 125 1 3 12 1 1 4 16 4 4 4 ? ? 4 32×4
NV37 150 91 1 1 4 1 1 4 16 - 4 4 ? ? 4 32×4
NV38 130 207 1 3 12 1 1 8 32 8 8 8 ? ? 8 64×4
NV39 130 125 1 3 12 1 1 4 16 4 4 4 ? ? 4 32×4


||<-6><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> GPU별 특성 ||
<rowcolor=#373a3c,#212121> GPU
이름
그래픽
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
NV30
<colbgcolor=#000000>NV30 DirectX 9.0a
OpenGL 1.5
(H/W 1.5, S/W 2.1)
VPE AGP 8× DDR
GDDR2
VGA
(D-Sub)
DVI
NV31 DDR
NV34
NV35
NV36 DDR
GDDR2
NV37 PCIe ×16 DDR
NV38 AGP 8× DDR
GDDR3
NV39 PCIe ×16 DDR


여러가지 의미로 NVIDIA 첫 번째 삽질의 전설로 남은 기념비적 마이크로아키텍처... 얼마가지 않아 공정이 바뀌었다.

2008년 5월 13일에 175 버전이 마지막으로서 드라이버 공식 지원이 중단되었다. (단, Windows XP 호환 드라이버) DirectX 9.0과 셰이더 모델 2.0+를 지원하여 WDDM에 대응된 가장 오래된 시리즈이지만, 정작 Windows Vista 호환 드라이버는 2006년 10월 17일에 ForceWare 95 버전에 한 번 더 지원해주었다(...).

4.8. NV40 (Curie)

파일:nvidia-nv40-quad_pipeline-big.png
지포스 6800 Ultra에 사용된 NV40의 블록 다이어그램.

파일:external/techreport.com/7800-block.gif
지포스 7800 GTX에 사용된 G70의 블록 다이어그램.

||<-17><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
T&L PVSP 버텍스
셰이더
FP32
스칼라
버텍스
셰이더
FP32
벡터
TRS RZ PPSP 픽셀
셰이더
FP32
ALU
픽셀
셰이더
미니
ALU
TMU L1
텍스처
캐시
(KB)
L2
텍스처
캐시
(KB)
ROP MC
(bit)
(채널)
NV40
<colbgcolor=black>NV40 130 287 1 6 6 24 1 1 16 64×2 4×2 16 ?×4 ? 16 64×4
NV41 130 225 1 5 5 20 1 1 12 48×2 3×2 12 ?×3 ? 12 64×4
NV42 110 225 1 5 5 20 1 1 12 48×2 3×2 12 ?×3 ? 12 64×4
NV43 110 150 1 3 3 12 1 1 8 32×2 2×2 8 ?×2 ? 4 64×2
NV44 110 110 1 3 3 12 1 1 4 16×2 1×2 4 ?×1 ? 2 32×2
NV45 130 287 1 6 6 24 1 1 16 64×2 4×2 16 ?×4 ? 16 64×4
NV48 110 287 1 6 6 24 1 1 16 64×2 4×2 16 ?×4 ? 16 64×4
G70
G70 110 333 1 8 8 32 1 1 24 96×2 6×2 24 ?×6 ? 16 64×4
G71 90 196 1 8 8 32 1 1 24 96×2 6×2 24 ?×6 ? 16 64×4
G72 90 81 1 3 3 12 1 1 4 16×2 1×2 4 ?×1 ? 2 32×2
G73 90 125 1 5 5 20 1 1 12 48×2 3×2 12 ?×3 ? 8 64×2
G73B 80 100 1 5 5 20 1 1 12 48×2 3×2 12 ?×3 ? 8 64×2


||<-6><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> GPU별 특성 ||
<rowcolor=#373a3c,#212121> GPU
이름
그래픽
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
NV40
<colbgcolor=#000000>NV40 DirectX 9.0c
OpenGL 2.1
VPE AGP 8× DDR
DDR2
GDDR3
VGA
(D-Sub)
DVI
NV41 PCIe ×16 DDR
GDDR3
NV42 AGP 8× GDDR3
NV43 PureVideo HD 1
(VDPAU 없음)
AGP 8×
PCIe ×16
DDR
DDR2
GDDR3
NV44 AGP 8×
PCIe ×16
DDR
DDR2
NV45 VPE PCIe ×16 GDDR3
NV48 AGP 8× DDR
GDDR3
G70
G70 DirectX 9.0c
OpenGL 2.1
PureVideo HD 1
(VDPAU 없음)
AGP 8×
PCIe ×16
DDR2
GDDR3
VGA
(D-Sub)
DVI
G71
G72 DDR2
G73 DDR2
GDDR3
G73B


2015년 2월 24일에 309.08 버전이 마지막으로서 NV40 마이크로아키텍처 기반 모든 모델들의 드라이버 공식 지원이 중단되었다.

4.9. G80 (Tesla)


파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
Tesla 제품군에 대한 내용은 NVIDIA 데이터 센터 GPU 문서
번 문단을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.

파일:nvidia-g80.png
파일:g80-diag-big.png
G80의 블록 다이어그램

파일:g84-diag-big.png
G84의 블록 다이어그램

파일:GT200-full-1.2-26-05-08.png
G200(GT200)의 블록 다이어그램

||<-17><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
T&L TRS RZ TPC SM CUDA
코어
(SP)
(FP32)
(INT32)
FP64 SFU TMU L1
공유
캐시
(KB)
L1
텍스처
캐시
(KB)
L2
캐시
(KB)
ROP MC
(bit)
(채널)
G80
<colbgcolor=black>G80 90 484 1 1 1 8 16 128 - 32 32 8×16 16×8 128 24 64×6
G84 80 169 1 1 1 2 4 32 - 8 16 8×4 16×2 32 8 64×2
G86 80 127 1 1 1 1 2 16 - 4 8 8×2 16×1 16 4 64×2
G92 65 324 1 1 1 8 16 128 - 32 64 8×16 16×8 64 16 64×4
G94 65 240 1 1 1 4 8 64 - 16 32 8×8 16×4 64 16 64×4
G96 65 144 1 1 1 2 4 32 - 8 16 8×4 16×2 32 8 64×2
G98 65 86 1 1 1 1 1 8 - 2 8 8×2 16×1 16 4 64×1
G92B 55 260 1 1 1 8 16 128 - 32 64 8×16 16×8 64 16 64×4
G94B 55 196 1 1 1 4 8 64 - 16 32 8×8 16×4 64 16 64×4
G96C 55 121 1 1 1 2 4 32 - 8 16 8×4 16×2 32 8 64×2
GT200
G200 65 576 1 1 1 10 30 240 30 60 80 16×30 24×10 256 32 64×8
G200B 55 470 1 1 1 10 30 240 30 60 80 16×30 24×10 256 32 64×8
GT215 40 144 1 1 1 4 12 96 - 24 32 8×12 16×4 64 8 64×2
GT216 40 100 1 1 1 2 6 48 - 12 16 8×6 16×2 64 8 64×2
GT218 40 57 1 1 1 1 2 16 - 4 8 8×2 16×1 32 4 64×1


||<-7><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> GPU별 특성 ||
<rowcolor=#373a3c,#212121> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
G80
<colbgcolor=#000000>G80 DirectX 10.0
(FEATURE_LEVEL_10_0)
OpenGL 3.3
CUDA Compute Capability 1.0
OpenCL 1.1
PureVideo HD 1
(VDPAU 없음)
PCIe 1.1 ×16 GDDR3 VGA
(D-Sub)
DVI
(Dual Link)
G84 CUDA Compute Capability 1.1
OpenCL 1.1
PureVideo HD 2
(VDPAU Feature Set A)
DDR2
GDDR3
G86
G92
G92 DirectX 10.0
(FEATURE_LEVEL_10_0)
OpenGL 3.3
CUDA Compute Capability 1.1
OpenCL 1.1
PureVideo HD 2
(VDPAU Feature Set A)
PCIe 2.0 ×16 GDDR3 VGA
(D-Sub)
DVI
(Dual Link)
G92B VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.3
G94 DDR2
GDDR3
VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.3
DisplayPort 1.1
G94B
G96 VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.3
G96C
G98 PureVideo HD 3
(VDPAU Feature Set B)
GT200
G200 DirectX 10.0
(FEATURE_LEVEL_10_0)
OpenGL 3.3
CUDA Compute Capability 1.3
OpenCL 1.1
PureVideo HD 2
(VDPAU Feature Set A)
PCIe 2.0 ×16 GDDR3 VGA
(D-Sub)
DVI
(Dual Link)
G200B VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.3
GT215 DirectX 10.1
(FEATURE_LEVEL_10_1)
OpenGL 3.3
CUDA Compute Capability 1.2
OpenCL 1.1
PureVideo HD 4
(VDPAU Feature Set C)
GDDR3
GDDR5
GT216 DDR2
GDDR3
GT218

  • TPC: Thread Processing Cluster (GPGPU 연산) 또는 Texture Processing Cluster (그래픽 연산)
  • SM: Streaming Multiprocessor
  • SP: Streaming Processor
  • CUDA: Compute Unified Device Architecture
  • FP64: 64-bit(Double-Precision) Floating-Point Real Number
  • SFU: Special Function Unit

2016년 12월 14일에 342.01 버전이 마지막으로서 G80 마이크로아키텍처 기반 모든 모델들의 드라이버 공식 지원이 중단되었다.

4.10. Fermi

파일:gf100-big.png
파일:external/www.legitreviews.com/gf100_block_diagram.jpg
GF100의 블록 다이어그램.

파일:external/sm.pcmag.com/nvidia-geforce-gtx-460-review-block-diagram_zd4g.jpg
GF100과 GF104의 블록 다이어그램 비교.

||<-16><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE SM PE CUDA
코어
(FP32)
(INT32)
FP64 SFU TMU L1
공유
캐시
(KB)
L1
텍스처
캐시
(KB)
L2
캐시
(KB)
ROP MC
(bit)
(채널)
Fermi
<colbgcolor=black>GF100 40 529 4 4 16 16 512 - 64 64 64×16 12×16 768 48 64×6
GF104 40 332 2 2 8 8 384 - 64 64 64×8 12×8 512 32 64×4
GF106 40 238 1 1 4 4 192 - 32 32 64×4 12×4 384 24 64×3
GF108 40 116 1 1 2 2 96 - 16 16 64×2 12×2 128 4 64×2
Fermi 2.0
GF110 40 520 4 4 16 16 512 - 64 64 64×16 12×16 768 48 64×6
GF114 40 332 2 2 8 8 384 - 64 64 64×8 12×8 512 32 64×4
GF116 40 238 1 1 4 4 192 - 32 32 64×4 12×4 384 24 64×3
GF117 40 116 1 1 2 2 96 - 16 16 64×2 12×2 128 4 64×2
GF119 40 79 1 1 1 1 48 - 8 8 64×1 12×1 128 4 64×1


||<-7><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> GPU별 특성 ||
<rowcolor=#373a3c,#212121> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Fermi
<colbgcolor=#000000>GF100 DirectX 12
(FEATURE_LEVEL_11_0)
OpenGL 4.6
CUDA Compute Capability 2.0
OpenCL 1.1
PureVideo HD 4
(VDPAU Feature Set C)
PCIe 2.0 ×16 GDDR5 DVI
(Dual Link)
HDMI 1.4
DisplayPort 1.1
GF104 CUDA Compute Capability 2.1
OpenCL 1.1
VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.4
DisplayPort 1.1
GF106 DDR3
GDDR5
GF108
Fermi 2.0
GF110 DirectX 12
(FEATURE_LEVEL_11_0)
OpenGL 4.6
CUDA Compute Capability 2.0
OpenCL 1.1
PureVideo HD 4
(VDPAU Feature Set C)
PCIe 2.0 ×16 GDDR5 VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.4
DisplayPort 1.1
GF114 CUDA Compute Capability 2.1
OpenCL 1.1
GF116 DDR3
GDDR5
GF117 PureVideo HD 5
(VDPAU Feature Set D)
DDR3 VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.4
GF119


여기서부터 마이크로아키텍처 이름에 과학자의 이름을 붙이며, 이전 마이크로아키텍처들도 소급 적용하게 되었지만 과거 모델을 직접 사용해본 경험이 있으면서 지식을 가지고 있는 사람이 아닌 한, 대부분 있는 줄도 모르는 정보인데다 잘 알고 있더라도 당시의 명칭에 익숙해져서 그다지 잘 알려지지 않았다. 결정적으로 너무 오래된 마이크로아키텍처들이라 잘 거론되지 않는 편. 따라서, 소급 적용된 명칭들을 괄호 내에 표시하고 당시의 명칭을 기준으로 서술한다.
배정밀도 부동소수점 연산을 맡았던 전용 유닛이 제거된 대신 GF100은 2개, GF104 이하들은 4개의 CUDA를 동원해서 수행하며, SFU는 부동소수점 곱셈을 수행하지 않으므로 이론적인 연산 성능의 계산에서 제외된다.

2018년 3월 27일에 391.35 버전이 마지막으로서 페르미 마이크로아키텍처 기반 모든 모델들의 드라이버 공식 지원이 중단되었다.

4.11. Kepler

파일:external/www.ozone3d.net/geforce-gtx680-kepler-block-diagram.jpg
GK104의 블록 다이어그램.

파일:external/cdn.wccftech.com/Kepler-GK110-635x353.jpg
GK110의 블록 다이어그램.

||<-16><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE SMX PE CUDA
코어
(FP32)
(INT32)
FP64 SFU TMU L1
공유
캐시
(KB)
L1
텍스처
캐시
(KB)
L2
캐시
(KB)
ROP MC
(bit)
(채널)
Kepler
<colbgcolor=black>GK110 28 561 5 5 15 15 2880 960 480 240 64×15 48×15 1536 48 64×6
GK104 28 294 4 4 8 8 1536 64 256 128 64×8 48×8 512 32 64×4
GK106 28 221 3 3 5 5 960 40 160 80 64×5 48×5 384 24 64×3
GK107 28 118 1 1 2 2 384 16 64 32 64×2 48×2 256 16 64×2
Kepler 2.0
GK208 28 87 1 1 2 2 384 16 64 32 64×2 48×2 512 8 64×1


||<-7><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 특성 ||
<rowcolor=white> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Kepler
<colbgcolor=#000000>GK110 DirectX 12
(FEATURE_LEVEL_11_0)
OpenGL 4.6
Vulkan 1.2
CUDA Compute Capability 3.5
OpenCL 1.2
PureVideo HD 5
(VDPAU Feature Set D)
NVDEC
NVENC
PCIe 3.0 ×16 GDDR5 DVI
(Dual Link)
HDMI 1.4a
DisplayPort 1.2
GK104 CUDA Compute Capability 3.0
OpenCL 1.2
GK106 VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.4a
DisplayPort 1.2
GK107 DDR3
GDDR5
Kepler 2.0
GK208 DirectX 12
(FEATURE_LEVEL_11_0)
OpenGL 4.6
Vulkan 1.2
CUDA Compute Capability 3.5
OpenCL 1.2
PureVideo HD 5
(VDPAU Feature Set D)
NVDEC
NVENC
PCIe 2.0 ×8 DDR3
GDDR5
VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.4a
DisplayPort 1.2


2021년 8월 31일에 케플러 마이크로아키텍처 기반 모든 모델들의 윈도우 7, 8, 8.1용 게임 레디 드라이버 공식 지원이 중단되었다. 심각한 보안 문제 해결 업데이트는 2024년 9월까지 제공한다고 발표했다.

4.12. Maxwell

파일:external/techreport.com/gm107-block.png
GM107의 블록 다이어그램.

파일:external/www.legitreviews.com/gm204-features.jpg
GM204의 블록 다이어그램.

파일:external/gearnuke.com/chiphell-1.jpg
GM200의 블록 다이어그램.

||<-16><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE SMM PE CUDA
코어
(FP32)
(INT32)
FP64 SFU TMU L1
공유
캐시
(KB)
L1
텍스처
캐시
(KB)
L2
캐시
(MB)
ROP MC
(bit)
(채널)
Maxwell
<colbgcolor=black>GM107 28 148 1 1 5 5 640 20 160 40 64×5 48×5 2 16 64×2
GM108 28 81 1 1 3 3 384 12 96 24 64×3 48×3 1 8 64×1
Maxwell 2.0
GM200 28 601 6 6 24 24 3072 96 768 192 96×24 48×24 3 96 64×6
GM204 28 398 4 4 16 16 2048 64 512 128 96×16 48×16 2 64 64×4
GM206 28 228 2 2 8 8 1024 32 256 64 96×8 48×8 1 32 64×2


||<-7><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 특성 ||
<rowcolor=white> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Maxwell
<colbgcolor=#000000>GM107 DirectX 12
(FEATURE_LEVEL_11_0)
OpenGL 4.6
Vulkan 1.2
CUDA Compute Capability 5.0
OpenCL 1.2
PureVideo HD 6
(VDPAU Feature Set E)
NVDEC
NVENC
PCIe 3.0 ×16 DDR3
GDDR5
VGA
(D-Sub)
DVI
(Dual Link)
HDMI 1.4a
DisplayPort 1.2
GM108 PureVideo HD 6
(VDPAU Feature Set E)
NVDEC
NVENC 미지원
PCIe 3.0 ×4
Maxwell 2.0
GM200 DirectX 12
(FEATURE_LEVEL_12_1)
OpenGL 4.6
Vulkan 1.2
CUDA Compute Capability 5.2
OpenCL 1.2
PureVideo HD 6
(VDPAU Feature Set E)
NVDEC 2
NVENC 5
PCIe 3.0 ×16 GDDR5 DVI
(Dual Link)
HDMI 2.0
DisplayPort 1.2
GM204
GM206 PureVideo HD 7
(VDPAU Feature Set F)
NVDEC 2
NVENC 5

4.13. Pascal

파일:external/cdn.wccftech.com/NVIDIA-Tesla-GP100-Block-Diagram.png
GP100의 블록 다이어그램.

파일:external/i0.wp.com/Pascal-GPU.jpg
GP104의 블록 다이어그램.

||<-17><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE TPC PE SM CUDA
코어
(FP32)
(INT32)
FP64 SFU TMU L1
공유
캐시
(KB)
L1
텍스처
캐시
(KB)
L2
캐시
(MB)
ROP MC
(bit)
(채널)
Pascal
<colbgcolor=black>GP100 16 610 6 6 30 30 60 3840 1920 960 240 64×60 48×60 4 128 512×8
GP102 16 471 6 6 30 30 30 3840 120 960 240 96×30 48×30 3 96 32×12
GP104 16 314 4 4 20 20 20 2560 80 640 160 96×20 48×20 2 64 32×8
GP106 16 200 2 2 10 10 10 1280 40 320 80 96×10 48×10 1.5 48 32×6
GP107 14 132 1 1 6 6 6 768 24 192 48 96×6 48×6 1 32 32×4
GP108 14 74 1 1 3 3 3 384 12 96 24 96×3 48×3 0.5 16 32×2


||<-7><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 특성 ||
<rowcolor=white> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Pascal
<colbgcolor=black>GP100 DirectX 12
(FEATURE_LEVEL_12_1)
OpenGL 4.6
Vulkan 1.2
CUDA Compute Capability 6.0
OpenCL 1.2
PureVideo HD ?
(VDPAU Feature Set ?)
NVDEC ?
NVENC ?
PCIe 3.0 ×16 HBM2 DVI
(Dual Link)
DisplayPort 1.4
GP102 CUDA Compute Capability 6.1
OpenCL 1.2
PureVideo HD 8
(VDPAU Feature Set G, H)
NVDEC 3
NVENC 6
GDDR5X DVI
(Dual Link)
HDMI 2.0b
DisplayPort 1.4
GP104 GDDR5
GDDR5X
GP106 GDDR5
GP107
GP108 PureVideo HD 8
(VDPAU Feature Set G, H)
NVDEC 3
NVENC 미지원
PCIe 3.0 ×4 DDR4
GDDR5
VGA
(D-Sub)
DVI
(Dual Link)
HDMI 2.0b
DisplayPort 1.4

4.14. Volta

파일:external/www.techrival.com/NVIDIA-Volta-GV100-GPU-Block-Diagram-768x437.png
GV100의 블록 다이어그램.

||<-18><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE TPC PE SM FP32 INT32 FP64 TC SFU TMU L1
캐시
(KB)
L2
캐시
(MB)
ROP MC
(bit)
(채널)
Volta
GV100 12 815 6 6 42 42 84 5376 5376 2688 672 1344 336 128×84 6 128 512×8


||<-7><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 특성 ||
<rowcolor=white> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Volta
GV100 DirectX 12
(FEATURE_LEVEL_12_1)
OpenGL 4.6
Vulkan 1.2
CUDA Compute Capability 7.0
OpenCL 2.0
PureVideo HD 9
(VDPAU Feature Set I)
NVDEC 3
NVENC 6
PCIe 3.0 ×16 HBM2 HDMI 2.0b
DisplayPort 1.4

4.15. Turing

파일:nvidia-tu102.png
TU102의 블록 다이어그램.

파일:nvidia-tu104.png
TU104의 블록 다이어그램.

파일:nvidia-tu106.jpg
TU106의 블록 다이어그램.

파일:nvidia-tu116.png
TU116의 블록 다이어그램.

파일:nvidia-tu117.png
TU117의 블록 다이어그램.

||<-20><tablealign=center><tablebordercolor=#76b900><color=#373a3c,#212121><bgcolor=#76b900> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE TPC PE SM RTC FP32 INT32 FP64 TC FP16 SFU TMU L1
캐시
(KB)
L2
캐시
(MB)
ROP MC
(bit)
(채널)
Turing
<colbgcolor=black>TU102 12 754 6 6 36 36 72 72 4608 4608 144 576 - 1152 288 96×72 6 96 32×12
TU104 12 545 6 6 24 24 48 48 3072 3072 96 384 - 768 192 96×48 4 64 32×8
TU106 12 445 3 3 18 18 36 36 2304 2304 72 288 - 576 144 96×36 4 64 32×8
TU116 12 284 3 3 12 12 24 - 1536 1536 48 - 3072 384 96 96×24 1.5 48 32×6
TU117 12 200 2 2 8 8 16 - 1024 1024 32 - 2048 256 64 96×16 1 32 32×4


||<-7><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=#373a3c,#212121> GPU별 특성 ||
<rowcolor=white> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Turing
<colbgcolor=black>TU102 DirectX 12
(FEATURE_LEVEL_12_2)
OpenGL 4.6
Vulkan 1.2
CUDA Compute Capability 7.5
OpenCL 1.2
PureVideo HD 10
(VDPAU Feature Set J)
NVDEC 4
NVENC 7
PCIe 3.0 ×16
NVLink 2.0
GDDR6 HDMI 2.0b
DisplayPort 1.4a
USB Type-C
TU104
TU106 PCIe 3.0 ×16 DVI
(Dual Link)
HDMI 2.0b
DisplayPort 1.4a
USB Type-C
TU116 DirectX 12
(FEATURE_LEVEL_12_1)
OpenGL 4.6
Vulkan 1.2
GDDR5
GDDR6
DVI
(Dual Link)
HDMI 2.0b
DisplayPort 1.4a
TU117 PureVideo HD 10
(VDPAU Feature Set J)
NVDEC 4
NVENC 6


2017년 GTC 유럽 NVIDIA CEO 젠슨 황의 오프닝 키노트에서 젠슨 황은 세계 최초의 로봇 택시용 AI 컴퓨터인 페가수스(Pegasus)에 차세대 마이크로아키텍처 기반 GPU가 Volta 마이크로아키텍처 기반 임베디드 GPU를 탑재한 자비에(Xavier) SoC 프로세서와 함께 결합될 예정이라고 밝혔다. 당시에는 공식 명칭을 밝혀지지 않고, 단순히 차세대 마이크로아키텍처라고 불렀는데, 나중에 엔비디아의 공식 발표를 통해, 해당 아키텍처가 튜링임이 밝혀졌다.

4.16. Ampere

파일:ga100-full-gpu-128-sms.png
GA100의 블록 다이어그램.

파일:NVIDIA GA102 Block Diagram.png
GA102의 블록 다이어그램.

파일:NVIDIA GA104 Block Diagram.png
GA104의 블록 다이어그램.

파일:NVIDIA GA106 Block Diagram.png
GA106의 블록 다이어그램.

||<-19><tablealign=center><tablebordercolor=#76b900><color=white><bgcolor=#76b900> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE TPC PME SM RTC FP32 INT32 FP64 TC SFU TMU L1
캐시
메모리
(KB)
ROP L2
캐시
메모리
(MB)
MC
(bit)
(채널)
Ampere
<colcolor=#76b900><colbgcolor=black>GA100 7 826 8 - 64 - 128 - 8192 8192 4096 512 2048 512 192×128 - 48 512×12


||<-19><tablealign=center><tablebordercolor=#76b900><color=white><bgcolor=#76b900> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE TPC PME SM RTC FP32
전용
CUDA
코어
CUDA
코어
(FP32)
(INT32)
FP64 TC SFU TMU L1
캐시
메모리
(KB)
ROP L2
캐시
메모리
(MB)
MC
(bit)
(채널)
Ampere
<colcolor=#76b900><colbgcolor=black>GA102 8 628.4 7 7 42 42 84 84 5376 5376 168 336 1344 336 128×84 112 6 32×12
GA103 8 496.0 6 6 30 30 60 60 3840 3840 120 240 960 240 128×60 96 5 32×10
GA104 8 392.5 6 6 24 24 48 48 3072 3072 96 192 768 192 128×48 96 4 32×8
GA106 8 276.0 3 3 15 15 30 30 1920 1920 60 120 480 120 128×30 48 2.25 32×6
GA107 8 ? 2 2 10 10 20 20 1280 1280 40 80 320 80 128×20 32 ? 32×4


||<-7><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=white> GPU별 특성 ||
<rowcolor=white> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Ampere
<colbgcolor=black><colcolor=#76b900>GA100 DirectX ?
(FEATURE_LEVEL_?_?)
OpenGL ?.?
Vulkan ?.?
CUDA Compute Capability 8.0
OpenCL 2.0
PureVideo HD ?
(VDPAU Feature Set ?)
NVDEC ?
NVENC 미지원
PCIe 4.0 ×16
NVLink 3.0
HBM2
HBM2E
HDMI ?.?
DisplayPort ?.?
?
GA102 DirectX 12
(FEATURE_LEVEL_12_2)
OpenGL 4.6
Vulkan 1.2
CUDA Compute Capability 8.6
OpenCL 2.0
PureVideo HD 11
(VDPAU Feature Set K)
NVDEC 5
NVENC 7
GDDR6X HDMI 2.1
DisplayPort 1.4a
GA103 PCIe 4.0 ×16 GDDR6
GDDR6X
GA104
GA106 GDDR6
GA107


2019년경의 뉴스에 따르면, 차세대 아키텍처의 명칭이 Ampere가 될 것이라고 한다. 한때, 삼성이 이 제품의 생산을 전량 수주했다는 루머가 있었으나, 젠슨 황이 이를 직접 부인하고, 이전 세대와 마찬가지로 TSMC가 기본 생산 업체이고, 물량이 부족할 때 삼성이 생산을 거들 것이라 밝혔다. (출처)

2019년 3월 31일, 모 트위터 유저가 트윗한 내용에 따르면 GA100으로 추정되는 연산 특화용 Ampere 기반 GPU가 7nm 공정으로 테이프 아웃되었다고 한다. (출처) 이전 세대와 비슷한 패턴일 경우 이변이 없다면 2020년 상반기에 출시될 가능성이 높으나, 코로나바이러스감염증-19라는 큰 이변이 발생해서 발표 일정이 지연될 확률이 높아졌다.

2020년 5월 14일, 다행히 GTC 2020이 온라인으로 진행되어서 발표 시기 자체는 크게 미루어지지 않았고, Ampere 마이크로아키텍처와 GA100이 공식 발표되었다. TSMC N7 공정이[1] 사용되었고 다이 사이즈는 826 ㎟로 815 ㎟였던 GV100보다 조금 더 커졌지만, 트랜지스터는 무려 540억여개로 211억여개였던 GV100보다 2.5배 더 많은 개수를 지니고 있다. 그런 상태에서 GA100 컷칩이 사용된 A100의 GPU 클럭이 GV100 컷칩이 사용된 V100에 비해 그다지 향상되지 않은 점을 미루어 보면 TSMC가 내놓은 N7 공정 중에 고성능(HP) 버전이 아닌 고밀도(HD) 버전일 가능성이 높다.

4.17. Hopper

파일:NVIDIA GH100 Block Diagram.png
GH100의 블록 다이어그램.

||<-19><tablealign=center><tablebordercolor=#76b900><color=white><bgcolor=#76b900> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE TPC PME SM RTC FP32 INT32 FP64 TC SFU TMU L1
캐시
메모리
(KB)
ROP L2
캐시
메모리
(MB)
MC
(bit)
(채널)
Hopper
<colcolor=#76b900><colbgcolor=black>GH100 4 814 8 - 72 - 144 - 18432 9216 9216 576 2304 576 256×144 - 60 512×12


||<-7><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=white> GPU별 특성 ||
<rowcolor=white> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Hopper
<colbgcolor=black><colcolor=#76b900>GH100 - CUDA Compute Capability 9.0
OpenCL ?.?
PureVideo HD ?
(VDPAU Feature Set ?)
NVDEC ?
NVENC 미지원
PCIe 5.0 ×16
NVLink 4.0
HBM2E
HBM3
-


2022년 3월 23일에 발표되고, 같은 해 10월에 출시된 데이터센터 전용 GPU 마이크로아키텍처. A100의 상위 등급 모델이다.

2015년부터 모바일 플랫폼의 미세 공정 노드가 데스크톱 및 워크스테이션 플랫폼의 미세 공정 노드를 추월하기 시작했고, 특히 Apple이 TSMC의 5 nm 공정 생산 용량의 거의 독점에 가까운 비중을 차지하고 있었기 때문에, Hopper의 공정 노드는 '잘해봐야 5 nm일 것'이 중론이었다. 다행히 TSMC N5 기반의 NVIDIA 커스텀 노드인 4N으로 밝혀졌다.[2]

2022년 하반기에 미중 무역 분쟁으로 인하여 초당 600GB 이상의 연산이 가능한 칩들, 상술한 A100과 더불어 중국 수출이 금지되었다. 이에 초당 400GB 수준의 H800을 생산하여 대중 수출을 대체한다고 밝혔다. 이로 인해 기존 A100과 H100을 쓰던 알리바바등의 중국 기업들은 칩 자립하는 쪽으로 방향을 수정했다.

2023년 4월, ChatGPT 언어모델 수요 증가로 인해 3만 6,000 달러 가량이었던 가격이 4만 6,000달러 수준으로 폭등했다. 즉, 현재 없어서 못파는 제품이며 현존하는 인공지능중에서 가장 좋은 성능을 내고 있다.[3] GPT-4 구축에 10,000개 가량의 모듈이 사용되었다고 한다.[4] 사실상 현재 엔비디아의 주가와 실적을 견인하고 있는 라인업이다.

2023년 5월 29일, 호퍼 칩 256개를 탑재한 GH200을 공개했다. 연말 출시 예정.

4.18. Ada Lovelace

파일:NVIDIA AD102 Block Diagram.png

||<-19><tablealign=center><tablebordercolor=#76b900><color=white><bgcolor=#76b900> GPU별 최대 내부 구성 요소 ||
<rowcolor=white> GPU
이름
공정
(㎚)
면적
(㎟)
GPC RE TPC PME SM RTC FP32
전용
CUDA
코어
CUDA
코어
(FP32)
(INT32)
FP64 TC SFU TMU L1
캐시
메모리
(KB)
ROP L2
캐시
메모리
(MB)
MC
(bit)
(채널)
Ada Lovelace
<colcolor=#76b900><colbgcolor=black>AD102 4 608.5 12 12 72 12 144 144 9216 9216 288 576 2304 576 128×144 192 96 32×12
AD103 4 378.6 7 7 40 7 80 80 5120 5120 160 320 1280 320 128×80 112 64 32×8
AD104 4 294.5 5 5 30 5 60 60 3840 3840 120 240 960 240 128×60 80 48 32×6


||<-7><tablealign=center><tablebordercolor=#76b900><bgcolor=#76b900><color=white> GPU별 특성 ||
<rowcolor=white> GPU
이름
그래픽
가속
GPGPU
가속
비디오
가속
호스트
인터페이스
메모리
규격
디스플레이
출력
Ada Lovelace
<colbgcolor=black><colcolor=#76b900>AD102 DirectX 12
(FEATURE_LEVEL_12_2)
OpenGL 4.6
Vulkan 1.3
CUDA Compute Capability 8.9
OpenCL 2.0
PureVideo HD ?
(VDPAU Feature Set ?)
NVDEC 5
NVENC 8
PCIe 4.0 ×16 GDDR6X HDMI 2.1
DisplayPort 1.4a
AD103
AD104


2022년 9월 21일에 처음 공개된 마이크로아키텍처로, 영국의 수학자이자 세계 최초의 프로그래머로 알려져 있는 에이다 러브레이스에서 따왔다. 에이다 러브레이스의 프로그래밍에 대한 지대한 공헌을 기리기 위해 이번에는 이름과 성씨를 모두 남긴 명칭을 붙였다.

Hopper 마이크로아키텍처와 마찬가지로 TSMC N5의 NVIDIA 커스텀 노드인 4N으로 생산되며, 4세대 텐서 코어는 물론이고 3세대 RT 코어가 적용되었다. 가장 먼저 공개된 AD102 기준으로 면적은 이전 세대 같은 포지션의 GA102보다 소폭 감소되었음에도 공정 미세화 덕분에 트랜지스터 수는 283억 개에서 763억 개로 약 2.7배나 증가 되었다.

특이하게도 차상위 GPU인 AD103의 전체 TPC, SM 개수가 GPC 개수의 배수가 아니다. 배수가 되려면 TPC 42개, SM 84개여야 하는데, 공식 아키텍처 백서의 'Appendix B - Ada AD103 GPU Full Specifications' 섹션에 'contains 7 GPCs, 40 TPCs, 80 SMs'라고 서술되어 있기 때문.

4.19. Blackwell

게임 이론, 확률론, 정보 이론, 통계학에 중요한 공헌을 한 미국의 수학자 데이비드 블랙웰(David Blackwell, 1919~2010)에서 이름을 따왔다.

2024년 3월 18일 첫 공개된 아키텍처로 이와 함께 HPC용 제품인 B100와 B200도 함께 공개되었다.

4.20. Rubin

암흑 물질의 증거를 발견한 미국의 천문학자 베라 루빈(Vera Rubin, 1928~2016)에서 이름을 따왔다.

2026년 양산 예정.

5. 관련 문서



[1] 1세대 7nm 공정인 N7인지, 2세대 7nm 공정인 N7P인지는 불명. TSMC가 7nm 계열 공정들을 다 똑같은 'N7' 명칭으로 취급하고 있기 때문에 정확한 공정을 확인할 수 없다. [2] 단, 진짜 4 nm인 N4와 다른 노드이므로 유의할 것. [3] 테슬라 D1, 구글 TPUv4, 인텔-하바나 GAUDI-2, 퀄컴 클라우드AI100 등 고객사들이 자사 맞춤형 칩셋을 개발하며 자립화를 시도하고 있지만, 아직까진 엔비디아의 범용 칩셋 성능에 비할 바가 못되며 AI칩 점유율 80% 이상을 차지하고 있다. [4] 약 1억 달러 규모.


파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 문서의 r56에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r56 ( 이전 역사)
문서의 r ( 이전 역사)



파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 문서의 r214에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r214 ( 이전 역사)
문서의 r ( 이전 역사)



파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 문서의 r214에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r214 ( 이전 역사)
문서의 r ( 이전 역사)

분류