||<table align=center><table bordercolor=#000000><table width=100%><bgcolor=white>
GPU 마이크로아키텍처 ||
}}}}}}}}} ||
{{{#!wiki style="margin: 0 -10px -5px;min-height:26px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1px -11px" | <rowcolor=#fff,#000> 설계 기반 | CUDA 연산 능력 | 칩셋명 | 등장 시기 | 인코더 | 디코더 | 사용 제품 | 공정 노드 |
<colcolor=black,white> Tesla | <colcolor=black,white> 1.0 | <colcolor=black,white> G80 | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | |
Fermi | 2.0 | GF100 | 2010년 | TSMC 40 nm | ||||
GF110 | 2010년 | TSMC 40 nm | ||||||
2.1 | GF104 | 2010년 | TSMC 40 nm | |||||
Kepler | 3.0 | GK104 | 2012년 3월 | GeForce 600 GeForce 700 GeForce GTX TITAN | TSMC 28 nm | |||
GK106 | 2012년 9월 | TSMC 28 nm | ||||||
GK107 | 2012년 6월 | TSMC 28 nm | ||||||
3.5 | GK110 | 2012년 11월 | TSMC 28 nm | |||||
Maxwell | 5.0 | GM107 | 2014년 2월 | GeForce GTX 750/750 Ti | TSMC 28 nm | |||
GM108 | 2014년 3월 | GeForce 800M | TSMC 28 nm | |||||
5.2 | GM200 | 2015년 3월 | GeForce GTX TITAN X GeForce GTX 980 Ti | TSMC 28 nm | ||||
GM204 | 2014년 9월 | GeForce 900 | TSMC 28 nm | |||||
GM206 | 2015년 1월 | TSMC 28 nm | ||||||
Pascal | 6.1 | GP102 | TSMC 16 nm | |||||
GP104 | 2016년 5월 | GeForce 10 | TSMC 16 nm | |||||
GP106 | 2016년 7월 | TSMC 16 nm | ||||||
GP107 | 2016년 10월 | Samsung 14 nm | ||||||
GP108 | 2017년 5월 | Samsung 14 nm | ||||||
Turing | 7.5 | TU102 | GeForce 20 | TSMC 12 nm | ||||
Ampere | 8.6 | GA102 | GeForce 30 | Samsung 8 nm | ||||
Ada Lovelace | 8.9 | AD102 | GeForce 40 | TSMC 4 nm | ||||
서버/HPC용 (배정밀도 연산 성능 특화) | ||||||||
Kepler | 3.7 | GK210 | 2014년 11월 | Tesla K80 | TSMC 28 nm | |||
Pascal | 6.0 | GP100 | 2016년 4월 | Tesla P100 Quadro GP100 | TSMC 16 nm | |||
Volta | 7.0 | GV100 | 2017년 5월 | TSMC 12 nm | ||||
Ampere | 8.0 | GA100 | TSMC 7 nm | |||||
Hopper | 9.0 | GH100 | TSMC 4 nm | |||||
저전력 |
1. 개요
2010년 출시된 NVIDIA GeForce 400 시리즈의 마이크로아키텍처.2. 공개된 정보
2.1. 주요 변경점
- 코어(SM) 레벨 (Tesla 대비)
- ISA: PTX 2.0 (← PTX 1.0 for Tesla)
- 통합 주소 공간 도입
- IEEE 754-2008 지원 (← IEEE 754-1985)
- Predication 지원
- 프론트 엔드
- 백 엔드
- 스케줄러의 수가 1 → 2로 증가
- 단정밀도 처리량이 사이클당 8 → 32로 증가
- 배정밀도 처리량이 사이클당 1 → 16으로 증가
- 정수 곱셈기가 24비트 → 32비트로 확장
- 특수 유닛의 수가 2개 → 4개로 증가
- 메모리 서브시스템
- 공유 메모리 개선
- L1 캐시 추가
- 기타
- 프로세서 레벨
- 메모리 서브시스템
- 최대 768 KB 크기의 L2 캐시 추가
- ECC 메모리 지원 추가
- C 및 C++ 포인터를 완전하게 구현 가능
- 64비트까지 확장 가능
- Fused Multiply-Add (FMA) 연산 추가
- 기존 16 KB에서 최대 48 KB로 구성 가능
- 총 64 KB의 메모리를 공유 메모리와 L1 메모리로 분할하여 사용
- 16 KB 또는 48 KB로 구성 가능
- GPGPU 작업의 성능이 크게 개선됨
GPGPU 연산에 맞추어 설계하였다.
3. 사용 제품
3.1. GeForce 400
3.2. GeForce 500
3.3. Tesla 20
의 Fermi 부분을
참고하십시오.