arzh-CNenfrdejakoplptesuk
검색 찾기 4120  디스커스 소시아  tg2 f2 lin2 in2 X 아이콘 3 y2  p2 티크 steam2

지포스 GTX 960

960

NVIDIA는 GeForce GTX 960을 통해 Maxwell 아키텍처의 이점을 대중 시장에 선보입니다. 비디오 카드는 메모리 압축, DSR, MFAA, VXGI 및 DirectX 12와 같은 아키텍처 이점을 받았습니다. NVIDIA의 경우 자체 GameWorks 및 PhysX API가 점점 더 중요해지고 있으며 아직 이에 대한 뉴스는 없지만 GeForce GTX 960 구매자는 또한 그들의 지원으로부터 혜택을 받습니다.

GeForce GTX 960 그래픽 카드는 다음을 사용합니다. GPU GM206, 아마도 전체 버전은 아닐 듯 - GM206-300-A1로 표시됨. 크리스털에는 2,94억 960천만 개의 트랜지스터가 탑재돼 있으며, AMD의 "타히티"나 "통가"보다 훨씬 덜 복잡합니다. 기준이 되는 GeForce GTX 1.126 그래픽 카드가 없으므로 위 표의 기본 클럭과 부스트 정보는 실제적으로 아무런 쓸모가 없습니다. NVIDIA는 기본 클럭을 XNUMXMHz로 나열하고 클럭은 GPU 부스트 – 1.178MHz. 2.048MB의 GDDR5 메모리를 NVIDIA가 1.750MHz로 설정했으며, 이 메모리는 128비트 인터페이스를 통해 연결됩니다. 결과적으로 메모리 대역폭은 112,2GB/s로 경쟁 제품에 비해 다소 낮습니다. 하지만 NVIDIA는 메모리 압축 기술을 사용하여 이론적으로 효과적인 메모리 대역폭을 증가시키지만 NVIDIA가 약속한 148,8GB/s를 달성하는 경우는 거의 없습니다.

진단 1

GPU GM206은 1.024개의 스트림 프로세서를 사용하는데, 이는 4개의 SMM(스트리밍 멀티프로세서) 블록으로 구성되며, 각각 32x XNUMX개의 스트림 프로세서가 있습니다. XNUMX개의 SMM이 GPC 클러스터를 구성하고 우리는 그러한 클러스터 두 개를 얻습니다. GPU. 8(SMM) x 4(SMM 블록) x 32개의 스트림 프로세서는 정확히 1.024개의 스트림 프로세서를 제공합니다.

각 SMM은 960개의 텍스처 유닛을 사용합니다. 따라서 GeForce GTX 64의 64개 SMM은 32개의 텍스처 유닛을 제공합니다. XNUMX개의 XNUMX비트 메모리 컨트롤러가 XNUMX개의 ROP(래스터 작업 파이프라인)에 연결됩니다.

smm

NVIDIA는 여러 솔루션 덕분에 Maxwell의 효율성을 높일 수 있었습니다. Maxwell 아키텍처의 L2 캐시는 Kepler 아키텍처의 2.048KB에 비해 256KB로 늘어났습니다. 캐시 대역폭은 클록당 512바이트로 유지되었습니다. 96세대 Maxwell 아키텍처와 비교하여 각 SMM 다중 프로세서의 총 메모리가 약간 증가했습니다. 이제는 64KB가 아닌 3.0KB입니다. 새로운 Polymorph Engine 버전 XNUMX도 주목할 수 있습니다.

PolyMorph 3.0 엔진은 텍스처 쿼리, 테셀레이션, 속성 조정, 시야각 변환 및 스트리밍 출력을 담당합니다. 그러면 SMM 클러스터와 PolyMorph 3.0 엔진의 계산 결과가 래스터화 엔진으로 전송됩니다. 두 번째 단계에서 테셀레이터는 거리에 따라 표면의 위치 계산을 시작하고 원하는 세부 수준이 선택됩니다. 조정된 값은 도메인 및 지오메트리 셰이더가 작동하는 SMM 클러스터로 전송됩니다. 도메인 셰이더는 헐 셰이더와 테셀레이터의 데이터를 고려하여 각 삼각형의 최종 위치를 계산합니다. 이 단계에서는 변위 맵이 중첩됩니다. 그런 다음 지오메트리 셰이더는 계산된 데이터를 실제 표시되는 개체와 비교하고 최종 계산을 위해 결과를 테셀레이션 엔진으로 다시 보냅니다. 마지막 단계에서 PolyMorph 3.0 엔진은 시야 변환 및 원근 수정을 수행합니다. 마지막으로 계산된 데이터는 스트리밍 출력을 통해 출력되므로 추가 계산을 위해 메모리가 확보됩니다.

SMM 다중 프로세서의 개별 블록으로 이동해 보겠습니다. 32개의 스트림 프로세서로 구성된 각 블록에는 명령 버퍼와 워프 스케줄러가 장착되어 있습니다. 두 개의 디스패치 장치는 각각 16.384개의 32비트 레지스터로 작동합니다. Kepler 아키텍처를 살펴보면 192개의 스트림 프로세서가 65.536개의 워프 스케줄러 및 32개의 디스패치 유닛과 함께 작동하여 총 512개의 341비트 레지스터를 사용할 수 있습니다. 이론적으로 Maxwell 아키텍처의 각 스트림 프로세서에는 35개의 레지스터가 있습니다. Kepler의 경우 그 수는 약 XNUMX개입니다. 이 조치는 또한 스트림 프로세서의 성능을 최대 XNUMX% 향상시키는 데 기여했습니다.

지포스 GTX 960의 특징

 출시일  22 1월 2015 년
 시작 가격, $  199

 모델 GPU 28nm GM206-300
 코어: TMU: ROP 1024 : 64 : 32

주파수

 주파수 GPU(부스트), MHz 1127 (1178)
 메모리 주파수(유효), MHz 1753 (7012)
 성능 FP32, GFLOPS 2,308

기억

 비디오 메모리 크기, MB  2048/4096
 메모리 버스, 비트  128
 메모리 대역폭, GB/s  112

인터페이스 및 TDP

 PCI 익스프레스 인터페이스  3.0 x16
 TDP. 화요일 120

스트림 프로세서와 소위 특수 기능 장치(SFU) 간의 관계도 다소 바뀌었습니다. 케플러 아키텍처에서는 비율이 6/1이었고, 맥스웰에서는 4/1로 떨어졌습니다. 스트림 프로세서와 읽기/쓰기 블록(로드/저장, LD/ST)의 비율에도 동일하게 적용됩니다. 특별한 이중 정밀도 계산 단위는 다이어그램에 표시되지 않으며 아마도 다음으로 표현될 것입니다. GPU GM210(GK110 및 GK104와 유사). 하지만 NVIDIA에 따르면, 단일 정밀도 대 이중 정밀도 비율은 1세대 Kepler 칩(GK24)과 마찬가지로 104/XNUMX입니다.

"맥스웰" 아키텍처의 이전 구현과 비교해 비디오 처리 엔진(비디오 엔진)에는 사소한 변경 사항이 적용되었습니다. 이제 H.265의 하드웨어 인코딩뿐만 아니라 하드웨어 디코딩도 제공합니다. GeForce GTX 980 및 GeForce GTX 970도 HDMI 2.2에서 HDCP 지원이 부족했지만 GeForce GTX 960과 GPU GM206이 추가되었습니다.