Radeon R9 290X
AMD Radeon R9 290X 그래픽 카드의 핵심에 있는 새로운 하와이 그래픽 칩은 우리가 이미 알고 있는 GCN(Graphics Core Next) 아키텍처를 기반으로 합니다. 이전에는 Radeon R11.2 7790X의 기반이 된 Bonaire 칩(Radeon HD 7)에서 수행되었습니다. Bonaire와 Hawaii의 아키텍처 변경은 컴퓨팅 기능의 개선(더 많은 동시 실행 스레드 지원) 및 AMD PowerTune 기술의 새 버전과 관련이 있습니다. 이에 대해서는 아래에서 자세히 설명하겠습니다.

DirectX 11.2의 새로운 기능에는 하와이의 하드웨어 가상 메모리 관리 기능을 활용하는 타일형 리소스가 포함됩니다. GPU부분 상주 텍스처(PRT)라고 합니다. 가상 비디오 메모리를 사용하면 애플리케이션에서 방대한 양의 텍스처를 사용하고 이를 비디오 메모리로 스트리밍할 수 있는 알고리즘에 대한 효율적인 하드웨어 지원을 쉽게 얻을 수 있습니다. PRT를 사용하면 이러한 작업에서 비디오 메모리를 사용하여 효율성을 높일 수 있으며, 유사한 기술이 이미 일부 게임 엔진에서 사용되고 있습니다.
GCN 기능이 확장되었지만 AMD가 새로운 최고급 제품을 설계하는 주요 목표는 다음과 같습니다. GPU 타히티가 이미 너무 많은 전력을 소비하고 있었던 반면, 하와이는 더 많은 컴퓨팅 장치를 포함시켰기 때문에 칩의 에너지 효율이 개선되었습니다. AMD 엔지니어들이 경쟁력 있는 제품을 시장에 출시하기 위해 어떤 노력을 했는지 살펴보겠습니다.

새로운 그래픽 프로세서는 논리적으로 11개 부분(Shader Engine)으로 나뉘며, 각 부분에는 텍스처 모듈, 기하학적 프로세서 XNUMX개, 래스터라이저, 여러 ROP 장치를 포함한 XNUMX개의 확장된 컴퓨팅 장치(Compute Unit)가 포함되어 있습니다. 즉, 가장 현대적인 AMD 칩의 블록 다이어그램은 유사한 구성을 가진 NVIDIA 칩의 다이어그램과 훨씬 더 유사해졌습니다.
하와이 그래픽 칩에는 총 44개의 스트림 프로세서, 2816개의 ROP 블록, 64개의 TMU 블록을 포함한 176개의 컴퓨팅 유닛이 포함됩니다. 고려중 GPU 512개의 64비트 컨트롤러와 1MB의 L28 캐시로 구성된 6.2비트 메모리 버스를 갖고 있습니다. 타히티와 동일한 4.3nm 공정 기술을 사용하여 제조되었지만 XNUMX억 개의 트랜지스터가 내장되어 있습니다(타히티는 XNUMX억 개).
하와이 GPU를 구성하는 셰이더 엔진의 블록 다이어그램을 고려하십시오. 이것은 다음 엔진 중 XNUMX개를 포함하는 칩의 큰 블록 부분입니다.
각 셰이더 엔진에는 하나의 지오메트리 프로세서와 래스터라이저가 포함되어 있으며, 클록 사이클당 하나의 지오메트리 기본형을 처리할 수 있습니다. 하와이의 기하학적 성능이 향상되었을 뿐만 아니라 이전 버전과 비교했을 때 상당히 균형 잡혔을 것으로 보입니다. GPU AMD 회사.

GCN 아키텍처 셰이더 엔진은 각각 11개의 ROP 블록을 포함하는 최대 11개의 확장된 RB(Render Back-end) 블록을 포함할 수 있습니다. 셰이더 엔진의 Compute Unit 수도 다를 수 있지만, 이 경우 12개가 있습니다. 하지만 명령어 및 상수에 대한 캐시는 Compute Unit XNUMX개마다 나누어집니다. 즉, XNUMX개가 아닌 XNUMX개의 컴퓨팅 유닛을 셰이더 엔진에 포함시키는 것이 더 논리적이겠지만, 그런 숫자는 더 이상 하와이의 소비 전력 제한에 포함되지 않는 것 같습니다.
GCN 아키텍처의 컴퓨팅 유닛은 다양한 기능 유닛을 포함한다: 텍스처 페치 모듈(16개), 텍스처 필터링 모듈(16개), 분기 예측 유닛, 스케줄러, 연산 유닛(64개 벡터 및 XNUMX개 스칼라), XNUMX단계 캐시 메모리(컴퓨팅 유닛당 XNUMXKB), 벡터 및 스칼라 레지스터용 메모리, 공유 메모리(컴퓨팅 유닛당 XNUMXKB).
하와이 GPU에는 셰이더 엔진이 4개 있으므로 총 4개의 지오메트리 처리 장치와 래스터화 엔진을 갖게 됩니다. 따라서 새로운 상위 GPU AMD는 클록 사이클당 최대 4개의 기하학적 기본 요소를 처리할 수 있습니다. 또한, 하와이에서는 기하 데이터 버퍼링이 개선되었고 기하 기본 매개변수에 대한 캐시도 더 커졌습니다. 이 모든 것을 합치면 지오메트리 셰이더에서 많은 양의 계산을 수행하고 테셀레이션을 적극적으로 사용함으로써 성능이 크게 향상됩니다.
또한 그래픽이기는 하지만 여전히 프로세서인 새로운 컴퓨팅 기능이 일부 변경되었습니다. 이 칩에는 PCI Express 3.0 버스 기능을 최대한 활용하는 16개의 DMA 엔진이 포함되어 있으며 XNUMXGB/s의 양방향 대역폭이 선언되었습니다. XNUMX개(하와이 칩의 경우) ACE(Asynchronous Compute Engine)를 사용하여 수행되는 비동기 컴퓨팅의 가능성도 비교적 새로운 것입니다.

ACE 장치는 그래픽 명령 프로세서와 병렬로 작동하며 각각 2개의 명령 스트림을 관리할 수 있습니다. 이 조직은 멀티태스킹 환경에서 독립적인 스케줄링과 운영, 글로벌 메모리와 LXNUMX 캐시에 있는 데이터에 대한 액세스, 빠른 컨텍스트 전환을 제공합니다. 이것은 특히 컴퓨팅 작업과 게임 애플리케이션에서 매우 중요합니다. GPU 그래픽 컴퓨팅과 일반 컴퓨팅 모두에 적합합니다. 이러한 혁신은 이론적으로 저수준의 기능에 대한 액세스를 사용할 때에도 이점이 될 수 있습니다. GPU Mantle과 같은 API를 사용합니다.
그래픽 컴퓨팅에 적용되는 하와이의 기능으로 돌아가 보겠습니다. 확산이 예상되는 증가하는 허가 요건으로 인해 UltraHD 모니터의 경우 래스터 연산 단위(ROP)의 계산 기능을 향상시킬 필요가 있습니다. 하와이 칩에는 16개의 RBE(Render Back End) 블록이 포함되어 있으며 이는 타히티의 두 배입니다. 64개의 RBE에는 클럭당 최대 64픽셀을 처리할 수 있는 XNUMX개의 ROP가 포함되어 있으며 이는 경우에 따라 매우 유용할 수 있습니다.
메모리 하위 시스템의 경우 하와이에는 1MB의 L16 캐시가 있으며 64KB의 33개 섹션으로 나뉩니다. 캐시 메모리가 2% 증가하고 내부 처리량이 1/1로 증가한다고 주장합니다. LXNUMX/LXNUMX 캐시의 총 처리량은 XNUMXTB/s로 선언됩니다.
메모리는 함께 64비트 버스를 구성하는 512개의 9비트 컨트롤러를 통해 액세스됩니다. Radeon R290 5.0X의 메모리 칩은 320GHz로 클럭되어 Radeon HD 20GHz보다 7970% 이상 높은 20GB/s의 총 메모리 대역폭을 제공합니다. 동시에 메모리 컨트롤러가 차지하는 칩 영역은 타히티의 384비트 컨트롤러에 비해 XNUMX% 감소했습니다.
라데온 R9 290X 사양
| 이름 | Radeon R9 290X |
| 핵심 | 하와이 |
| 공정 기술(μm) | 0.028 |
| 트랜지스터(백만) | 6200 |
| 코어 주파수 | 1000 |
| 메모리 주파수(DDR) | 5000 |
| 버스 및 메모리 유형 | GDDR5 512비트 |
| 대역폭(Gb/s) | 320 |
| 통합 셰이더 블록 | 2816 |
| 통합 셰이더 단위의 빈도 | 1000 |
| 컨베이어당 TMU | 176 |
| ROP | 64 |
| 유효노출률(Mpix/s) | 64600 |
| 충전율(Mtex/s) | 176400 |
| 다이렉트 | 11.2 |
| 메모리 용량 | 4096 |
| 인터페이스 | PCI-E 3.0 x16 |
이전 Radeon HD 7970과 비교하여 하와이 성능 Radeon R9 290X에 직면하여 약 40-60% 증가합니다.




