||<table align=center><table bordercolor=#000000><table width=100%><bgcolor=white> GPU 마이크로아키텍처 ||
}}}}}}}}} ||
{{{#!wiki style="margin: 0 -10px -5px;min-height:26px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1px -11px" | <rowcolor=#fff,#000> 설계 기반 | CUDA 연산 능력 | 칩셋명 | 등장 시기 | 인코더 | 디코더 | 사용 제품 | 공정 노드 |
<colcolor=black,white> Tesla | <colcolor=black,white> 1.0 | <colcolor=black,white> G80 | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | <colcolor=black,white> | |
Fermi | 2.0 | GF100 | 2010년 | TSMC 40 nm | ||||
GF110 | 2010년 | TSMC 40 nm | ||||||
2.1 | GF104 | 2010년 | TSMC 40 nm | |||||
Kepler | 3.0 | GK104 | 2012년 3월 | GeForce 600 GeForce 700 GeForce GTX TITAN | TSMC 28 nm | |||
GK106 | 2012년 9월 | TSMC 28 nm | ||||||
GK107 | 2012년 6월 | TSMC 28 nm | ||||||
3.5 | GK110 | 2012년 11월 | TSMC 28 nm | |||||
Maxwell | 5.0 | GM107 | 2014년 2월 | GeForce GTX 750/750 Ti | TSMC 28 nm | |||
GM108 | 2014년 3월 | GeForce 800M | TSMC 28 nm | |||||
5.2 | GM200 | 2015년 3월 | GeForce GTX TITAN X GeForce GTX 980 Ti | TSMC 28 nm | ||||
GM204 | 2014년 9월 | GeForce 900 | TSMC 28 nm | |||||
GM206 | 2015년 1월 | TSMC 28 nm | ||||||
Pascal | 6.1 | GP102 | TSMC 16 nm | |||||
GP104 | 2016년 5월 | GeForce 10 | TSMC 16 nm | |||||
GP106 | 2016년 7월 | TSMC 16 nm | ||||||
GP107 | 2016년 10월 | Samsung 14 nm | ||||||
GP108 | 2017년 5월 | Samsung 14 nm | ||||||
Turing | 7.5 | TU102 | GeForce 20 | TSMC 12 nm | ||||
Ampere | 8.6 | GA102 | GeForce 30 | Samsung 8 nm | ||||
Ada Lovelace | 8.9 | AD102 | GeForce 40 | TSMC 4 nm | ||||
서버/HPC용 (배정밀도 연산 성능 특화) | ||||||||
Kepler | 3.7 | GK210 | 2014년 11월 | Tesla K80 | TSMC 28 nm | |||
Pascal | 6.0 | GP100 | 2016년 4월 | Tesla P100 Quadro GP100 | TSMC 16 nm | |||
Volta | 7.0 | GV100 | 2017년 5월 | TSMC 12 nm | ||||
Ampere | 8.0 | GA100 | TSMC 7 nm | |||||
Hopper | 9.0 | GH100 | TSMC 4 nm | |||||
저전력 |
1. 개요
2010년 출시된 NVIDIA GeForce 400 시리즈의 마이크로아키텍처.2. 공개된 정보
2.1. 주요 변경점
- 코어(SM) 레벨 (Tesla 대비)
- ISA: PTX 2.0 (← PTX 1.0 for Tesla)
- 통합 주소 공간 도입
- IEEE 754-2008 지원 (← IEEE 754-1985)
- Predication 지원
- 프론트 엔드
- 백 엔드
- 스케줄러의 수가 1 → 2로 증가
- 단정밀도 처리량이 사이클당 8 → 32로 증가
- 배정밀도 처리량이 사이클당 1 → 16으로 증가
- 정수 곱셈기가 24비트 → 32비트로 확장
- 특수 유닛의 수가 2개 → 4개로 증가
- 메모리 서브시스템
- 공유 메모리 개선
- L1 캐시 추가
- 기타
- 프로세서 레벨
- 메모리 서브시스템
- 최대 768 KB 크기의 L2 캐시 추가
- ECC 메모리 지원 추가
- C 및 C++ 포인터를 완전하게 구현 가능
- 64비트까지 확장 가능
- Fused Multiply-Add (FMA) 연산 추가
- 기존 16 KB에서 최대 48 KB로 구성 가능
- 총 64 KB의 메모리를 공유 메모리와 L1 메모리로 분할하여 사용
- 16 KB 또는 48 KB로 구성 가능
- GPGPU 작업의 성능이 크게 개선됨
GPGPU 연산에 맞추어 설계하였다.
3. 사용 제품
3.1. GeForce 400
자세한 내용은 GeForce 400 문서 참고하십시오.3.2. GeForce 500
자세한 내용은 GeForce 500 문서 참고하십시오.3.3. Tesla 20
자세한 내용은 NVIDIA 데이터 센터 GPU 문서의 Fermi 부분을
참고하십시오.