Ekran kartı aileleri Nvidia GeForce Referans bilgileri. Nvidia GeForce aileleri

GPU Yükseltme 2.0

NVIDIA grafik kartı ile GeForce GTX 680, önemli bir yeni özelliğimiz var: GPU Boost. Ve yeni NVIDIA GeForce GTX Titan, bu özelliği GPU Boost 2.0'a genişleterek bir adım daha ileri gidiyor. GPU Boost 1.0'ın ilk sürümü, en zorlu modern oyunlarda elde edilen maksimum güç tüketimine odaklandı. Aynı zamanda, kritik eşiğe yaklaşması dışında, GPU sıcaklığı özel bir rol oynamadı. Maksimum saat frekansı, bağıl voltaja göre belirlendi. Dezavantajı oldukça açıktı: GPU Boost 1.0, kritik olmayan voltajlarda bile sıcaklığın aşırı arttığı durumları engelleyemedi.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

GeForce GTX Titan zaten iki parametreyi değerlendirdi: voltaj ve sıcaklık. Yani, bağıl voltaj (Vref) zaten bu iki parametre temelinde belirlenir. Tabii ki, çip üretiminde farklılıklar olduğundan, bireysel GPU'lara olan bağımlılık devam edecek ve bu nedenle her bir video kartı diğerinden farklı olacaktır. Ancak NVIDIA, teknik olarak, sıcaklık eklenmesinin ortalama yüzde 3-7 daha yüksek Hız aşırtmasına izin verdiğine dikkat çekiyor. GPU Boost 2.0 teknolojisi teorik olarak daha eski grafik kartlarına taşınabilir, ancak bunun olması pek olası değildir.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

GPU Boost 2.0'a daha yakından bakalım. EVGA Precision Tool veya MSI Afterburner gibi yardımcı programlar GPU Boost 2.0'ı zaten destekliyor. EVGA Precision Tool'u 4.0 sürümünde kullandık.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

GPU Boost 2.0, sıcaklığın farkındadır ve düşük sıcaklıklarda teknoloji performansı önemli ölçüde artırabilir. Hedef sıcaklık (Thedef) varsayılan olarak 80 °C'ye ayarlanmıştır.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

GPU Boost 2.0 teknolojisi, birinci nesil teknolojiden aşina olduğumuz tüm özellikleri içerir, ancak aynı zamanda ek olarak daha yüksek bir voltaj ve dolayısıyla daha yüksek saat frekansları ayarlamayı mümkün kılar. Hız aşırtmacılar için ayarları değiştirmek mümkündür. GPU Aşırı Voltajını etkinleştirebilirsiniz, ancak grafik kartı ömründeki olası azalmanın farkında olun.

NVIDIA GeForce GTX Titan - GPU Boost 2.0

Hız aşırtmacılar Vref ve Vmax'ı (Aşırı Voltaj) yükseltebilir. Birçok kullanıcı bunu GK104'te istedi, ancak NVIDIA böyle bir fırsatı ne kullanıcılara ne de üreticilere emanet etmedi. Ve test ettiğimiz (test ve inceleme) EVGA GTX 680 Classified video kartı sadece harika bir örnek. Bu ekran kartı ile özel bir EVGA Evbot modülü kullanıcılara voltajlar üzerinde kontrol sağlıyordu. Ancak NVIDIA acilen EVGA'nın grafik kartlarından ek donanımı kaldırmasını istedi. GPU Boost 2.0 ve Aşırı Voltaj durumunda, NVIDIA bu yönde bir adım attı. Böylece grafik kartı üreticileri, standart sürümler ve fabrikada hız aşırtmalı sürümler gibi çeşitli GeForce GTX Titan modellerini yayınlayabilir. Aşırı Voltajın etkinleştirilmesi VBIOS anahtarı aracılığıyla yapılır (yani, olası sonuçların farkında olması için açıkça kullanıcı için).

NVIDIA GeForce GTX 780 ekran kartı incelemesi | GeForce Deneyimi ve ShadowPlay

GeForce Deneyimi

Bilgisayar meraklıları olarak, oyunların performansını ve kalitesini etkileyen farklı ayarların kombinasyonunu takdir ediyoruz. Çok para harcamak daha kolay yeni video kartı ve tüm grafik ayarlarını maksimuma ayarlayın. Ancak bir parametrenin harita için çok ağır olduğu ortaya çıktığında ve azaltılması veya kapatılması gerektiğinde, hoş olmayan bir his ve oyunun çok daha iyi çalışabileceğinin farkına varılır.

Ancak, optimum ayarları yapmak o kadar kolay değil. Bazı parametreler daha iyi kalite sağlar görsel efektler diğerlerine göre performans etkisinin derecesi büyük ölçüde değişebilir. GeForce Experience programı, NVIDIA'nın CPU, GPU ve çözünürlüğü bir yapılandırma veritabanıyla karşılaştırarak oyun ayarlarını seçmeyi kolaylaştırma girişimidir. Yardımcı programın ikinci kısmı, sürücülerin güncellemeye ihtiyacı olup olmadığını belirlemenize yardımcı olur.

Meraklıların ayarları kendileri seçmeye devam etmeleri ve olumsuz algılamaları muhtemeldir. ek program. Ancak sürücüleri kontrol etmeden ve çeşitli ayarlardan geçmeden hemen oyunu yüklemek ve oynamaya başlamak isteyen çoğu oyuncu bu fırsattan kesinlikle memnun kalacaktır. Her iki durumda da NVIDIA'nın GeForce Experience, insanların oyun deneyimlerinden en iyi şekilde yararlanmalarına yardımcı olur ve bu nedenle PC oyunları için kullanışlı bir yardımcı programdır.

GeForce Experience, sistemimizde yüklü olan dokuz oyunun tümünü belirledi. Deneme sistemi. Doğal olarak, bazı ayarları test etmek için uyguladığımız için varsayılan ayarları kaydetmediler. Ancak GeForce Experience'ın seçtiğimiz seçenekleri nasıl değiştireceği hala ilginç.

Tomb Raider için GeForce Experience, TressFX teknolojisini devre dışı bırakmak istedi. NVIDIA GeForce GTX 780 işlev etkinleştirildiğinde, saniyede ortalama 40 kare gösterdi. Bazı nedenlerden dolayı program yapılandırmayı belirleyemedi. Uzak Çığlık 3, önerdiği ayarlar oldukça yüksek olmasına rağmen. Skyrim için bilinmeyen nedenlerle, yardımcı program FXAA'yı devre dışı bırakmak istedi.

Her oyun için belirli bir ayarın görüntü kalitesi üzerindeki etkisini açıklayan bir dizi ekran görüntüsü almak güzel. İncelediğimiz dokuz örnekten GeForce Experience, bize göre en uygun ayarlara yaklaştı. Bununla birlikte, yardımcı program aynı zamanda önyargılıdır, PhysX (programın Borderlands 2'de yüksek olarak belirlediği) gibi NVIDIA'ya özgü özellikleri korur ve AMD'den gelen özelliklerin (Tomb Raider'daki TressFX dahil) dahil edilmesini önler. Oyun ortalama 100 FPS olduğu için Skyrim'de FXAA'yı devre dışı bırakmak hiç mantıklı değil. Oyun Akışı özelliği NVIDIA uygulaması aracılığıyla kullanılabilir göründüğünden, NVIDIA Shield sistemi gönderildiğinde meraklıların GeForce Experience'ı yüklemek istemeleri olasıdır.

ShadowPlay: Oyun için Her Zaman Açık Video Kaydedici

WoW hayranları genellikle baskınlarını kaydeder, ancak bu oldukça güçlü bir sistem, Fraps ve çok fazla disk alanı gerektirir.

NVIDIA kısa süre önce kayıt işlemini çok daha kolay hale getirebilecek yeni bir ShadowPlay özelliğini duyurdu.

Etkinleştirildiğinde, ShadowPlay, oyunun son 20 dakikasını otomatik olarak kaydeden, Kepler GPU'da yerleşik NVEnc sabit kod çözücüyü kullanır. Veya ShadowPlay'i manuel olarak başlatabilir ve durdurabilirsiniz. Böylece teknoloji, Fraps gibi CPU'ya daha fazla yük bindiren yazılım çözümlerinin yerini alıyor.

Başvuru için: NVEnc, yalnızca 4096x4096 piksele kadar olan çözünürlüklerde H.264 kodlamasıyla çalışır. ShadowPlay henüz piyasada mevcut değil, ancak NVIDIA, bu yaz piyasaya sürüldüğünde 30 FPS'ye kadar 1080p video kaydedebileceğini söylüyor. Daha önce kodlayıcının donanımda destekleme potansiyeline sahip olduğu belirtilmiş olduğundan daha yüksek bir çözünürlük görmek istiyoruz.

NVIDIA GeForce GTX 780 ekran kartı incelemesi | GPU Boost 2.0 ve olası hız aşırtma sorunları

GPU Yükseltme 2.0

İncelemede GeForce GTX Titan 2. Nesil NVIDIA GPU Boost teknolojisini kapsamlı bir şekilde test edemedik, ancak şimdi burada NVIDIA GeForce GTX 780. İşte bu teknolojinin kısa bir açıklaması:

GPU Boost, işlenen görevin türüne bağlı olarak grafik kartlarının performansını değiştiren bir NVIDIA mekanizmasıdır. Muhtemelen bildiğiniz gibi, oyunların farklı GPU kaynak gereksinimleri vardır. Tarihsel olarak, frekans en kötü durum senaryosuna göre ayarlanmalıdır. Ancak "hafif" görevleri işlerken GPU boşuna çalıştı. GPU Boost, uygulamanın ihtiyaçlarına ve mevcut duruma bağlı olarak çeşitli parametreleri izler ve frekansları artırır veya azaltır.

GPU Boost'un ilk uygulaması belirli bir güç eşiğinin altında çalıştı (170 W GeForce GTX680). Ancak şirketin mühendisleri, GPU sıcaklığı yeterince düşükse bu seviyeyi güvenle aşabileceklerini keşfettiler. Böylece performans daha da optimize edilebilir.

Pratikte GPU Boost 2.0, yalnızca NVIDIA'nın frekansı güç sınırına değil, 80 santigrat derece olan belirli bir sıcaklığa göre hızlandırmasıyla farklılık gösteriyor. Bu da artık 80 dereceye kadar çipin sıcaklığına kadar daha yüksek frekans ve voltaj değerlerinin kullanılacağı anlamına geliyor. Sıcaklığın temel olarak fanın profiline ve ayarlarına bağlı olduğunu unutmayın: hız ne kadar yüksek olursa, sıcaklık o kadar düşük olur ve bu nedenle GPU Boost değerleri (ve ne yazık ki gürültü seviyesi de) o kadar yüksek olur. Teknoloji hala her 100 ms'de bir durumu değerlendiriyor, dolayısıyla NVIDIA'nın gelecek sürümlerde yapacak daha çok işi var.

Sıcaklığa bağlı ayarlar, GPU Boost'un ilk sürümüne kıyasla test sürecini daha da zorlaştırıyor. GK110'un sıcaklığını yükselten veya düşüren her şey çipin saatini değiştirir. Bu nedenle, koşular arasında tutarlı sonuçlar elde etmek oldukça zordur. Laboratuvar koşullarında, yalnızca sabit bir ortam sıcaklığı umut edilebilir.

Yukarıdakilere ek olarak, sıcaklık sınırını artırabileceğinizi belirtmekte fayda var. Örneğin, isterseniz NVIDIA GeForce GTX 780 frekansı ve voltajı 85 veya 90 santigrat dereceye düşürdü, bu parametrelerde yapılandırılabilir.

GK110'u seçtiğiniz sıcaklık sınırından mümkün olduğunca uzak tutmak mı istiyorsunuz? fan eğrisi NVIDIA GeForce GTX 780 tamamen ayarlanabilir, görev döngüsünü sıcaklık değerlerine göre ayarlamanıza izin verir.

Olası hız aşırtma sorunları

tanışmamız sırasında GeForce GTX Titanşirket temsilcileri bize çeşitli sensörlerin durumunu okuyabilen dahili bir yardımcı program gösterdi: bu şekilde kartın standart dışı davranışını teşhis etme sürecini basitleştirir. Hız aşırtma sırasında, hız aşırtma sırasında GK110'un sıcaklığı çok yükselirse, bu bilgi günlüğe kaydedilir.

Şimdi bu fonksiyonşirket, hız aşırtma sırasında etkin bir şekilde devam etmesini engelleyen eylemler varsa, bir uyarı "nedenleri" algoritması başlatan Precision X uygulaması aracılığıyla uygular. Bu harika bir özellik çünkü artık olası darboğazları tahmin etmenize gerek yok. GPU'nun mutlak tepe voltajına ulaşıp ulaşmadığınızı size bildirecek bir OV maksimum limit göstergesi de vardır. Bu durumda kartı yakma riski vardır. Bunu hız aşırtma parametrelerini düşürmek için bir öneri olarak düşünebilirsiniz.

NVIDIA GeForce GTX 780 ekran kartı incelemesi | Test standı ve kıyaslamalar


Test standı yapılandırması
İşlemci Intel Core i7-3770K (Ivy Bridge) 3.5GHz @ 4.0GHz (40*100MHz), LGA 1155, 8MB paylaşımlı L3 önbellek, Hyper-Threading etkin, Güç tasarrufu etkin
Anakart Gigabyte Z77X-UD5H (LGA 1155), Z77 Express yonga seti, BIOS F15q
Veri deposu G.Skill 16GB (4 x 4GB) DDR3-1600, F3-12800CL9Q2-32GBZL @ 9-9-9-24, 1.5V'de
Depolama aygıtı Önemli m4 SSD 256GB SATA 6Gb/sn
ekran kartları NVIDIA GeForce GTX780 3GB

AMD Radeon'u HD7990 6 GB

AMD Radeon HD 7970 GHz Sürümü 3 GB

Nvidia GeForce GTX 580 1.5 GB

Nvidia GeForce GTX 680 2 GB

Nvidia GeForce GTX Titan 6 GB

Nvidia GeForce GTX 690 4 GB

Güç kaynağı Soğutucu Ana UCP-1000W
Sistem yazılımı ve sürücüleri
işletim sistemi Windows 8 Professional 64 bit
DirectX DirectX 11
Grafik. sürücüler AMD Catalyst 13.5 (Beta 2)
Nvidia GeForce Sürüm 320.00
Nvidia GeForce Sürüm 320.18 (GeForce GTX 780 için)

Doğru kare hızı değerini alma

Dikkatli okuyucular, sonraki sayfalardaki rakamların incelemedekinden daha mütevazı olduğunu fark edeceklerdir. AMD Radeon HD7990, ve bunun bir nedeni var. Önceden, sentetik ve gerçek kare hızlarını sunduk ve ardından kareler arasındaki zaman dalgalanmaları ile birlikte düşen ve kısa kareler gösterdik. Gerçek şu ki, bu yöntem video kartının çalışmasının gerçek duygularını yansıtmaz ve bizim açımızdan, çerçeveler arasındaki zaman gecikmesinin sentetik göstergelerine dayanarak AMD'yi kınamak haksızlık olur.

Bu nedenle, kare hızı dalgalanmalarıyla birlikte artık daha pratik dinamik kare hızı ölçümleri sağlıyoruz. Sonuçlar o kadar yüksek değil ama aynı zamanda AMD'nin zorluk yaşadığı oyunlarda çok etkili.

Testler ve ayarlar
Savaş alanı 3 Grafik Kalitesi - Ultra, v-sync kapalı, 2560x1440, DirectX 11, Going Hunting, 90-saniye, FCAT
Uzak Çığlık 3 Grafik Kalitesi - Ultra, DirectX 11, v-sync kapalı, 2560x1440, kendi rotanızı çalıştırın, 50 saniye, FCAT
Sınır Toprakları 2 Grafik Kalitesi - En Yüksek, PhysX Düşük, 16x Anizotropik Filtreleme, 2560x1440, Kendi Rotanızı Çalıştırın, FCAT
Hitman: Absolution Grafik kalitesi - Ultra, MSAA kapalı, 2560x1440, yerleşik kıyaslama, FCAT
The Elder Scrolls V: Skyrim Grafik Kalitesi - Ultra, FXAA Etkin, 2560x1440, kendi rotanızı çalıştırın, 25 saniye, FCAT
3D İşareti Yangın Çarpma Kıyaslaması
BioShock Sonsuz Grafik kalitesi - Ultra, DirectX 11, difüzör alan derinliği, 2560x1440, yerleşik kıyaslama, FCAT
Crysis 3 Grafik kalitesi - çok yüksek, MSAA: Düşük (2x), yüksek çözünürlüklü metin, 2560x1440, kendi rotanızda çalıştırın, 60 saniye, FCAT
mezar yağmacısı Grafik Kalitesi - Ultimate, FXAA etkin, 16x anizotropik filtreleme, TressFX Hair, 2560x1440, kendi rotanızı çalıştırın, 45 saniye, FCAT
Lüks İşareti 2.0 64-bit İkili, Sürüm 2.0, Sala Sahnesi
SiSoftware Sandra 2013 Profesyonel Sandra Teknik Destek (Mühendis) 2013.SP1, Kriptografi, Finansal Analiz Performansı


İÇERİK
ParametreAnlam
çip kod adıGP104
Üretim teknolojisi16nm FinFET
transistör sayısı7,2 milyar
çekirdek alan314 mm²
Mimari
DirectX donanım desteği
bellek veriyolu
1607 (1733) MHz
Hesaplama blokları2560 IEEE 754-2008 kayan noktalı skaler ALU'lar dahil 20 Akışlı Çoklu İşlemci;
Tekstüre bloklarıDokularda FP16 ve FP32 bileşenlerini destekleyen ve tüm doku formatları için trilinear ve anizotropik filtreleme desteğine sahip 160 doku adresleme ve filtreleme birimi
Monitör desteği
GeForce GTX 1080 Referans Grafik Özellikleri
ParametreAnlam
çekirdek frekansı1607 (1733) MHz
2560
Doku bloklarının sayısı160
Karıştırma bloklarının sayısı64
Etkili bellek frekansı10000 (4×2500) MHz
Bellek türüGDDR5X
bellek veriyolu256-bit
Hafıza8 GB
320 GB/sn
yaklaşık 9 teraflop
103 gigapiksel/sn
257 gigateksel/sn
YorulmakPCI Ekspres 3.0
Konnektörler
güç kullanımı180 W'a kadar
Fazladan yemekBir adet 8 pinli konektör
2
Önerilen fiyat$599-699 (ABD), 54990 RUB (Rusya)

GeForce GTX 1080 ekran kartının yeni modeli, yeni GeForce serisinin ilk çözümü için mantıklı bir isim aldı - doğrudan selefinden yalnızca değişen bir nesil numarasında farklı. Yenilik, yalnızca şirketin mevcut hattındaki en üst düzey çözümlerin yerini almakla kalmıyor, aynı zamanda Titan X daha da güçlü bir GPU'da piyasaya sürülene kadar bir süre yeni serinin amiral gemisi oldu. Hiyerarşinin altında, aşağıda ele alacağımız GP104 yongasının soyulmuş bir versiyonuna dayanan, önceden duyurulan GeForce GTX 1070 modeli de var.

Yeni bir Nvidia ekran kartı için önerilen fiyatlar 599$ ve 699$'dır. normal sürümler ve özel bir Founders Edition (aşağıya bakınız) ve GTX 1080'nin sadece GTX 980 Ti'den değil, aynı zamanda Titan X'ten de önde olduğunu düşünürsek bu oldukça iyi bir anlaşma. önceki neslin en güçlü grafik kartlarından daha ucuz. Şimdiye kadar GeForce GTX 1080'nin AMD'den hiçbir rakibi yok, bu yüzden Nvidia onlara uygun bir fiyat belirleyebildi.

Söz konusu video kartı, 256 bit bellek veri yoluna sahip GP104 yongasını temel alıyor, ancak yeni GDDR5X bellek türü, 320 GB / s'lik yüksek bir tepe bant genişliği sağlayan 10 GHz gibi çok yüksek bir etkin frekansta çalışıyor. - 384 bit veri yolu ile GTX 980 Ti ile neredeyse aynı. Böyle bir veri yoluna sahip bir video kartına takılı bellek miktarı 4 veya 8 GB olabilir, ancak modern koşullarda böyle güçlü bir çözüm için daha küçük bir miktar ayarlamak aptalca olurdu, bu nedenle GTX 1080 8 GB belleğe sahipti ve bu miktar, birkaç yıl boyunca herhangi bir kalite ayarıyla herhangi bir 3B uygulamayı çalıştırmak için yeterlidir.

GeForce GTX 1080 PCB, anlaşılır şekilde şirketin önceki PCB'lerinden oldukça farklıdır. Yeni öğeler için tipik güç tüketiminin değeri 180 watt'tır - GTX 980'den biraz daha yüksek, ancak daha az güçlü Titan X ve GTX 980 Ti'den belirgin şekilde daha düşük. Referans kartı, görüntü çıkış cihazlarını bağlamak için olağan konektör setine sahiptir: bir Dual-Link DVI, bir HDMI ve üç DisplayPort.

Founders Edition referans tasarımı

GeForce GTX 1080'in Mayıs ayı başlarında duyurulmasıyla birlikte, şirketin ortaklarının normal ekran kartlarından daha yüksek bir fiyata sahip olan Founders Edition adlı video kartının özel bir sürümü duyuruldu. Aslında bu sürüm, kartın ve soğutma sisteminin referans tasarımıdır ve Nvidia'nın kendisi tarafından üretilmiştir. Video kartları için bu tür seçeneklere karşı farklı tutumlarınız olabilir, ancak şirketin mühendisleri tarafından geliştirilen ve kaliteli bileşenler kullanılarak üretilen referans tasarımın hayranları var.

Ancak Nvidia'nın kendisinden bir ekran kartı için birkaç bin ruble daha ödeyip ödemeyecekleri, yalnızca uygulamanın cevaplayabileceği bir sorudur. Her durumda, ilk başta Nvidia'nın referans ekran kartları daha yüksek bir fiyata satışa çıkacak ve aralarından seçim yapabileceğiniz pek bir şey yok - bu her duyuruda oluyor, ancak GeForce GTX 1080 referansı bu konuda farklı. ömrü boyunca, yeni nesil çözümlerin piyasaya sürülmesine kadar bu formda satılması planlanmaktadır.

Nvidia, bu baskının, ortakların en iyi çalışmalarından bile üstün olduğuna inanıyor. Örneğin, soğutucunun iki yuvalı tasarımı, hem nispeten küçük bir form faktörüne sahip oyun bilgisayarlarını hem de bu güçlü ekran kartına dayalı çok çipli video sistemlerini bir araya getirmeyi kolaylaştırır (üç ve dört çip modu önerilmemesine rağmen). şirket tarafından). GeForce GTX 1080 Founders Edition, buharlaşma odası ve ısıtılmış havayı kasanın dışına iten bir fan kullanan verimli bir soğutucu şeklinde bazı avantajlara sahip - bu, 250 watt'tan daha az güç tüketen Nvidia'nın ilk çözümü.

Şirketin önceki referans ürün tasarımları ile karşılaştırıldığında, güç devresi dört fazdan beş faza yükseltilmiştir. Nvidia ayrıca yeni ürünün dayandığı iyileştirilmiş bileşenlerden de bahsediyor, voltaj kararlılığını ve hız aşırtma potansiyelini iyileştirmek için elektrik gürültüsü de azaltıldı. Tüm iyileştirmeler sonucunda referans kartının güç verimliliği GeForce GTX 980'e göre %6 arttı.

Ve GeForce GTX 1080'in "sıradan" modellerinden ve dışarıdan farklı olması için Founders Edition için alışılmadık bir "kıyılmış" kasa tasarımı geliştirildi. Bununla birlikte, muhtemelen buharlaşma odasının ve radyatörün şeklinin karmaşıklığına da yol açtı (fotoğrafa bakın), bu da böyle özel bir sürüm için fazladan 100 $ ödemenin nedenlerinden biri olabilir. Satışların başlangıcında alıcıların fazla seçeneği olmayacağını tekrarlıyoruz, ancak gelecekte hem şirketin ortaklarından birinden kendi tasarımıyla bir çözüm seçmek hem de Nvidia'nın kendisi tarafından gerçekleştirilen bir çözüm seçmek mümkün olacak.

Yeni nesil Pascal grafik mimarisi

GeForce GTX 1080 ekran kartı, şirketin yeni nesil Nvidia'nın Pascal grafik mimarisine ait olan GP104 yongasını temel alan ilk çözümü. Yeni mimari, Maxwell'de geliştirilen çözümlere dayanmasına rağmen, daha sonra yazacağımız önemli işlevsel farklılıklara da sahip. Küresel bir bakış açısından ana değişiklik, yeni grafik işlemcisinin yapıldığı yeni teknolojik süreçti.

Tayvanlı şirket TSMC'nin fabrikalarında GP104 GPU'ların üretiminde 16 nm FinFET işlem teknolojisinin kullanılması, nispeten düşük bir alan ve maliyeti korurken çipin karmaşıklığını önemli ölçüde artırmayı mümkün kıldı. GP104 ve GM204 yongalarının transistör sayısını ve alanını karşılaştırın - alana yakındırlar (yenilik yongası fiziksel olarak daha küçüktür), ancak Pascal mimarisi yongası önemli ölçüde daha fazla sayıda transistöre sahiptir ve buna göre , yeni işlevsellik sağlayanlar da dahil olmak üzere yürütme birimleri.

Mimari açıdan bakıldığında, ilk oyun Pascal, bazı farklılıklar olsa da, Maxwell mimarisinin benzer çözümlerine çok benzer. Maxwell gibi, Pascal mimarisi işlemcileri, Grafik İşleme Kümeleri (GPC'ler), Akış Çok İşlemcileri (SM'ler) ve bellek denetleyicilerinin farklı yapılandırmalarına sahip olacaktır. SM çok işlemcili, çok işlemcili CUDA çekirdeklerinde ve diğer yürütme birimlerinde çarpıtma (çözgü, 32 komut akışı grupları) programlayan ve çalıştıran oldukça paralel bir çok işlemcilidir. Tüm bu blokların tasarımı hakkında detaylı bilgiyi önceki Nvidia çözümleri incelememizde bulabilirsiniz.

SM çoklu işlemcilerinin her biri, doku örnekleme, mozaikleme, dönüştürme, köşe öznitelik ayarı ve perspektif düzeltme işlemlerini gerçekleştiren PolyMorph Motoru ile eşleştirilir. Şirketin önceki çözümlerinden farklı olarak, GP104 çipindeki PolyMorph Engine, aşağıda bahsedeceğimiz yeni bir Eşzamanlı Çoklu Projeksiyon bloğunu da içeriyor. SM çoklu işlemcisinin bir Polymorph Engine ile birleşimine geleneksel olarak TPC - Nvidia için Texture Processor Cluster adı verilir.

Toplamda, GeForce GTX 1080'deki GP104 yongası, dört GPC kümesi ve 20 SM çok işlemcisinin yanı sıra 64 ROP ile birleştirilmiş sekiz bellek denetleyicisi içerir. Her GPC kümesinin özel bir rasterleştirme motoru vardır ve beş SM içerir. Her çoklu işlemci sırasıyla 128 CUDA çekirdeği, 256 KB kayıt dosyası, 96 KB paylaşılan bellek, 48 KB L1 önbellek ve sekiz TMU doku biriminden oluşur. Yani toplamda GP104, 2560 CUDA çekirdeği ve 160 TMU birimi içerir.

Ayrıca, GeForce GTX 1080'in dayandığı grafik işlemcisi, bize son bir 256-bit bellek veriyolu sağlayan sekiz adet 32-bit (önceden kullanılan 64-bit'in aksine) bellek denetleyicileri içerir. Sekiz ROP ve 256 KB L2 önbellek, bellek denetleyicilerinin her birine bağlıdır. Yani toplamda GP104 yongası 64 ROP ve 2048 KB L2 önbellek içerir.

Mimari optimizasyonlar ve yeni bir süreç teknolojisi sayesinde, ilk oyun Pascal, şimdiye kadarki en enerji verimli GPU oldu. Üstelik buna hem en gelişmiş teknolojik süreçlerden biri olan 16 nm FinFET'in hem de Maxwell'e kıyasla Pascal'da gerçekleştirilen mimari optimizasyonların katkısı var. Nvidia, yeni bir süreç teknolojisine geçerken saat hızını beklediklerinden daha da fazla artırmayı başardı. GP104, 16nm işlemi kullanılarak yapılan varsayımsal bir GM204'ten daha yüksek bir frekansta çalışır. Bunu yapmak için Nvidia mühendislerinin, belirli bir eşiğin üzerinde hız aşırtmayı önleyen önceki çözümlerin tüm darboğazlarını dikkatlice kontrol etmesi ve optimize etmesi gerekiyordu. Sonuç olarak, yeni GeForce GTX 1080, GeForce GTX 980'den %40'ın üzerinde daha hızlı çalışıyor. Ancak GPU saat değişikliklerinin hepsi bu kadar değil.

GPU Boost 3.0 Teknolojisi

Önceki Nvidia ekran kartlarından çok iyi bildiğimiz gibi, GPU'lar GPU'nun çalışma saat hızını henüz güç tüketimi ve ısı dağılımı sınırlarına ulaşmadığı modlarda artırmak için tasarlanmış GPU Boost donanım teknolojisini kullanırlar. Yıllar geçtikçe, bu algoritma birçok değişikliğe uğradı ve bu teknolojinin üçüncü nesli Pascal mimarisi video çipinde zaten kullanılıyor - ana yeniliği voltaja bağlı olarak daha iyi bir turbo frekans ayarı olan GPU Boost 3.0.

nasıl çalıştığını hatırlıyorsan önceki sürümler teknolojisi, temel frekans (en azından oyunlarda GPU'nun altına düşmediği garanti edilen minimum frekans değeri) ile turbo frekansı arasındaki fark düzeltildi. Yani turbo frekansı her zaman bazın üzerinde belirli bir megahertz sayısı olmuştur. GPU Boost 3.0, her bir voltaj için ayrı ayrı turbo frekans ofsetlerini ayarlama yeteneğini tanıttı. Bunu anlamanın en kolay yolu bir örnekle:

Solda, ikinci versiyonun GPU Boost'u, sağda - Pascal'da görünen üçüncüsü. Baz ve turbo frekansları arasındaki sabit bir fark, GPU'nun tüm yeteneklerini ortaya çıkarmaya izin vermedi, bazı durumlarda önceki nesillerin GPU'ları ayarlanan voltajda daha hızlı çalışabilir, ancak turbo frekansının sabit bir fazlalığı buna izin vermedi. GPU Boost 3.0'da bu özellik ortaya çıktı ve turbo frekansı, GPU'nun tüm suyunu tamamen sıkarak ayrı voltaj değerlerinin her biri için ayarlanabilir.

Hız aşırtmayı yönetmek ve turbo frekans eğrisini ayarlamak için kullanışlı yardımcı programlar gereklidir. Nvidia'nın kendisi bunu yapmaz, ancak ortaklarının hız aşırtmayı kolaylaştırmak için bu tür yardımcı programlar oluşturmasına yardımcı olur (elbette makul sınırlar dahilinde). Örneğin, yeni işlevsellik GPU Boost 3.0, temel frekans ile turbo frekans arasındaki doğrusal olmayan farkı otomatik olarak bulan ve ayarlayan özel bir hız aşırtma tarayıcısı içeren EVGA Precision XOC'de zaten ortaya çıktı. farklı değerler yerleşik performans ve kararlılık testini çalıştırarak voltaj. Sonuç olarak, kullanıcı, belirli bir çipin özelliklerine mükemmel şekilde uyan bir turbo frekans eğrisi elde eder. Üstelik manuel modda istediğiniz gibi değiştirilebilir.

Yardımcı programın ekran görüntüsünde görebileceğiniz gibi, GPU ve sistem hakkındaki bilgilere ek olarak, hız aşırtma ayarları da vardır: Güç Hedefi (hız aşırtma sırasında tipik güç tüketimini, standardın yüzdesi olarak tanımlar), GPU Temp Target (izin verilen maksimum çekirdek sıcaklığı), GPU Saat Ofseti (tüm voltaj değerleri için temel frekansı aşan), Bellek Ofseti (varsayılan değerin üzerindeki video belleği frekansını aşan), Aşırı Voltaj (voltajı artırmak için ek fırsat).

Precision XOC yardımcı programı üç hız aşırtma modu içerir: Temel, Doğrusal ve Manuel. Ana modda, önceki GPU'larda olduğu gibi, temel hız üzerinden tek bir hız aşırtma değeri (sabit turbo frekansı) ayarlayabilirsiniz. Doğrusal mod, GPU için minimumdan maksimum voltaj değerlerine frekans rampasını ayarlamanıza olanak tanır. Manuel modda, grafikteki her voltaj noktası için benzersiz GPU frekans değerleri ayarlayabilirsiniz.

Yardımcı program ayrıca şunları içerir: özel tarayıcı Otomatik hızlanma için. Kendi frekans seviyenizi ayarlayabilir veya Precision XOC yardımcı programının tüm voltajlarda GPU'yu taramasına ve voltaj ve frekans eğrisindeki her nokta için en kararlı frekansları tamamen otomatik olarak bulmasına izin verebilirsiniz. Tarama işlemi sırasında Precision XOC, GPU'nun frekansını aşamalı olarak artırır ve çalışmasını kararlılık veya yapaylık açısından kontrol ederek her bir çip için benzersiz olacak ideal bir frekans ve voltaj eğrisi oluşturur.

Bu tarayıcı, her bir voltaj değerini test etmek için zaman aralığını, test edilecek minimum ve maksimum frekansı ve adımını ayarlayarak kendi gereksinimlerinize göre özelleştirilebilir. İstikrarlı sonuçlar elde etmek için küçük bir adım ve uygun bir test süresi belirlemenin daha iyi olacağı açıktır. Test sırasında karşılaşabileceğiniz istikrarsız iş video sürücüsü ve sistem, ancak tarayıcı donmazsa, işlemi geri yükleyecek ve en uygun frekansları bulmaya devam edecektir.

Yeni tip video belleği GDDR5X ve geliştirilmiş sıkıştırma

Böylece, GPU'nun gücü önemli ölçüde arttı ve bellek veriyolu yalnızca 256 bit kaldı - bellek bant genişliği genel performansı sınırlayacak mı ve bu konuda ne yapılabilir? Gelecek vaat eden ikinci nesil HBM'nin üretimi hala çok pahalı görünüyor, bu nedenle başka seçeneklerin aranması gerekiyordu. 2009'da GDDR5 belleğin piyasaya sürülmesinden bu yana, Nvidia mühendisleri yeni bellek türleri kullanma olanaklarını araştırıyorlar. Sonuç olarak, bugüne kadarki en karmaşık ve gelişmiş standart olan ve 10 Gbps aktarım hızı sağlayan yeni bir bellek standardı GDDR5X'in tanıtımına yönelik gelişmeler yaşandı.

Nvidia bunun ne kadar hızlı olduğuna dair ilginç bir örnek veriyor. İletilen bitler arasında yalnızca 100 pikosaniye geçer - bu süre zarfında, bir ışık demeti yalnızca bir inç (yaklaşık 2,5 cm) mesafe kat edecektir. Ve GDDR5X belleği kullanırken, veri alan devreler, iletilen bitin değerini bir sonraki gönderilmeden önce bu sürenin yarısından daha az bir sürede seçmelidir - bu sadece modern teknolojinin ne hale geldiğini anlamanız içindir.

Bu hıza ulaşmak, bellek yongası üreticileriyle birkaç yıllık ortak geliştirme gerektiren yeni bir I/O sistem mimarisinin geliştirilmesini gerektirdi. Artan veri aktarım hızına ek olarak, enerji verimliliği de arttı - GDDR5X bellek yongaları 1,35 V'luk daha düşük bir voltaj kullanır ve aynı güç tüketimini %43 daha yüksek frekansta veren yeni teknolojiler kullanılarak üretilir.

Şirketin mühendisleri, bellekten GPU'ya ve geriye kadar tüm yol boyunca sinyal kaybını ve sinyal bozulmasını önlemeye daha fazla dikkat ederek, GPU çekirdeği ve bellek yongaları arasındaki veri iletim hatlarını yeniden işlemek zorunda kaldı. Bu nedenle, yukarıdaki çizimde, yakalanan sinyal, tüm devrenin iyi optimizasyonunu ve sinyalden veri yakalamanın göreceli kolaylığını gösteren büyük bir simetrik "göz" olarak gösterilmektedir. Ayrıca, yukarıda açıklanan değişiklikler yalnızca GDDR5X'i 10 GHz'de kullanma olasılığına yol açmadı, aynı zamanda daha tanıdık GDDR5 belleği kullanan gelecekteki ürünlerde yüksek bellek bant genişliği elde etmeye de yardımcı olmalıdır.

Yeni belleğin kullanımından bellek bant genişliğinde %40'tan fazla artış elde ettik. Ama bu yeterli değil mi? Bellek bant genişliği verimliliğini daha da artırmak için Nvidia, önceki mimarilerde sunulan gelişmiş veri sıkıştırmasını geliştirmeye devam etti. GeForce GTX 1080'deki bellek alt sistemi, bant genişliği gereksinimlerini azaltmak için tasarlanmış geliştirilmiş ve birkaç yeni kayıpsız veri sıkıştırma tekniği kullanır - zaten dördüncü nesil çip üzerinde sıkıştırma.

Bellekte veri sıkıştırma algoritmaları aynı anda birkaç olumlu yön getirir. Sıkıştırma belleğe yazılan veri miktarını azaltır, aynısı video belleğinden ikinci seviye önbelleğe aktarılan veriler için de geçerlidir, bu da sıkıştırılmış bir döşemenin (birkaç çerçeve arabelleği pikselinden oluşan bir blok) daha küçük olması nedeniyle L2 önbelleğinin kullanım verimliliğini artırır. sıkıştırılmamış bir boyuttan daha büyük. Ayrıca, TMU doku modülü ve çerçeve arabelleği gibi farklı noktalar arasında gönderilen veri miktarını da azaltır.

GPU'daki veri sıkıştırma hattı, verilerin "sıkıştırılabilirliğine" bağlı olarak belirlenen birkaç algoritma kullanır - onlar için mevcut en iyi algoritma seçilir. En önemlilerinden biri delta renk sıkıştırma algoritmasıdır. Bu sıkıştırma yöntemi, verinin kendisi yerine ardışık değerler arasındaki fark olarak veriyi kodlar. GPU, bir bloktaki (döşeme) pikseller arasındaki renk değerlerindeki farkı hesaplar ve bloğu, tüm blok için ortalama bir renk artı her piksel için değerlerdeki farkla ilgili veriler olarak depolar. Grafik verileri için, bu yöntem genellikle çok uygundur, çünkü tüm pikseller için küçük döşemelerdeki renk genellikle çok fazla farklılık göstermez.

GeForce GTX 1080'deki GP104 GPU, önceki Maxwell yongalarından daha fazla sıkıştırma algoritmasını destekler. Böylece 2:1 sıkıştırma algoritması daha verimli hale geldi ve buna ek olarak iki yeni algoritma ortaya çıktı: 4:1 sıkıştırma modu, bir bloğun piksellerinin renk değerindeki farkın çok olduğu durumlar için uygundur. 2x2 piksel blokların sabit 4:1 sıkıştırmasını bloklar arasında 2x delta sıkıştırmasıyla birleştiren 8:1 modu. Sıkıştırma hiç mümkün olmadığında kullanılmaz.

Bununla birlikte, gerçekte, ikincisi çok nadiren olur. Bu, Nvidia'nın Pascal'daki artan sıkıştırma oranını göstermek için alıntı yaptığı Project CARS oyununun örnek ekran görüntülerinden görülebilir. Çizimlerde, GPU tarafından sıkıştırılabilen çerçeve arabellek karoları macenta ile gölgelendirilmiş ve kayıpsız sıkıştırılamayanlar orijinal rengiyle kalmıştır (üst - Maxwell, alt - Pascal).

Gördüğünüz gibi, GP104'teki yeni sıkıştırma algoritmaları gerçekten Maxwell'dekinden çok daha iyi çalışıyor. Eski mimari aynı zamanda sahnedeki karoların çoğunu sıkıştırabilse de, kenarlardaki çok sayıda çimen ve ağaç ile araba parçaları eski sıkıştırma algoritmalarına tabi değildir. Ancak Pascal'a yeni tekniklerin dahil edilmesiyle, çok az sayıda görüntü alanı sıkıştırılmamış olarak kaldı - artan verimlilik açıkça görülüyor.

Veri sıkıştırmadaki iyileştirmelerin bir sonucu olarak GeForce GTX 1080, çerçeve başına gönderilen veri miktarını önemli ölçüde azaltabilir. Rakamlarla, iyileştirilmiş sıkıştırma, etkin bellek bant genişliğinden %20 oranında tasarruf sağlar. GeForce GTX 1080'nin GDDR5X bellek kullanımından kaynaklanan GTX 980'e göre bellek bant genişliğindeki %40'tan fazla artışa ek olarak, tüm bunlar, önceki nesil modele kıyasla etkin bellek bant genişliğinde yaklaşık %70'lik bir artış sağlar.

Eşzamansız Hesaplama Desteği

Çoğu modern oyun, grafiklere ek olarak karmaşık hesaplamalar kullanır. Örneğin, fiziksel cisimlerin davranışını hesaplarken hesaplamalar, grafiksel hesaplamalardan önce veya sonra değil, birbirleriyle ilişkili olmadığı ve aynı çerçeve içinde birbirine bağlı olmadığı için onlarla eşzamanlı olarak yapılabilir. Başka bir örnek, önceden oluşturulmuş çerçevelerin sonradan işlenmesi ve aynı zamanda oluşturma ile paralel olarak gerçekleştirilebilen ses verilerinin işlenmesidir.

Bu işlevselliğin bir başka açık örneği, VR sistemlerinde, oluşturulan kareyi, oluşturulmadan hemen önce oyuncunun kafasının hareketine göre değiştirmek ve bir sonrakinin oluşturulmasını kesintiye uğratmak için kullanılan Asenkron Zaman Çarpıtma tekniğidir. GPU kapasitelerinin bu tür eşzamansız yüklenmesi, yürütme birimlerini kullanma verimliliğini artırmaya olanak tanır.

Bu iş yükleri, iki yeni GPU kullanım senaryosu oluşturur. Bunlardan ilki, birçok görev türü GPU'ların yeteneklerini tam olarak kullanmadığından ve bazı kaynaklar boşta olduğundan, örtüşen yükler içerir. Bu gibi durumlarda, daha verimli kullanım elde etmek için yürütme birimlerini ayırarak aynı GPU'da iki farklı görevi çalıştırabilirsiniz - örneğin, çerçevenin 3B oluşturmasıyla birlikte çalışan PhysX efektleri.

Bu senaryonun performansını iyileştirmek için Pascal mimarisi dinamik yük dengelemeyi tanıttı. Önceki Maxwell mimarisinde, çakışan iş yükleri, grafik ve bilgi işlem arasında GPU kaynaklarının statik dağılımı olarak uygulanıyordu. Bu yaklaşım, iki iş yükü arasındaki dengenin kabaca kaynakların bölünmesine tekabül etmesi ve görevlerin zamanında eşit olarak yürütülmesi şartıyla etkilidir. Grafiksel olmayan hesaplamalar grafiksel olanlardan daha uzun sürerse ve her ikisi de ortak çalışmanın tamamlanmasını bekliyorsa, GPU'nun bir kısmı kalan süre boyunca boşta kalacak ve bu da genel performansta bir düşüşe neden olacak ve tüm faydaları geçersiz kılacaktır. Donanım dinamik yük dengeleme ise, serbest bırakılan GPU kaynaklarını kullanılabilir hale gelir gelmez kullanmanıza olanak tanır - anlamak için bir örnek vereceğiz.

Zaman açısından kritik görevler de vardır ve bu, asenkron bilgi işlem için ikinci senaryodur. Örneğin, VR'de eşzamansız zaman bozulması algoritmasının yürütülmesi, taramadan önce tamamlanmalıdır, aksi takdirde çerçeve atılır. Böyle bir durumda, GPU'nun daha az kritik bir görevi GPU üzerinde yürütmesinden alması ve kaynaklarını kritik görevler için serbest bırakması için GPU'nun çok hızlı görev kesintisini ve başka bir göreve geçişi desteklemesi gerekir - buna preemption denir.

Bir oyun motorundan gelen tek bir işleme komutu yüzlerce beraberlik çağrısı içerebilir, her bir çizim çağrısı sırayla her biri hesaplanacak ve çizilecek yüzlerce piksel içeren yüzlerce işlenmiş üçgen içerir. Geleneksel GPU yaklaşımı, yalnızca yüksek düzeyde görev kesintisi kullanır ve grafik ardışık düzeni, görevleri değiştirmeden önce tüm bu çalışmaların tamamlanmasını beklemek zorundadır, bu da çok yüksek gecikme süresine neden olur.

Bunu düzeltmek için Pascal mimarisi önce piksel düzeyinde bir görevi kesintiye uğratma özelliğini tanıttı - Piksel Düzeyi Önleme. Pascal GPU yürütme birimleri, oluşturma görevlerinin ilerlemesini sürekli olarak izleyebilir ve bir kesinti istendiğinde, yürütmeyi durdurabilir ve başka bir göreve hızla geçerek daha sonra tamamlanmak üzere bağlamı kaydedebilir.

İşleme işlemleri için iş parçacığı düzeyinde kesme ve geçiş, grafik hesaplama için piksel düzeyinde kesmeye benzer şekilde çalışır. Hesaplamalı iş yükleri, her biri birden çok iş parçacığı içeren birden çok ızgaradan oluşur. Bir kesme isteği alındığında, çok işlemcili üzerinde çalışan iş parçacıkları yürütmelerini sonlandırır. Diğer bloklar, gelecekte aynı noktadan devam etmek için kendi durumlarını kaydeder ve GPU başka bir göreve geçer. Çalışan iş parçacıkları çıktıktan sonra tüm görev değiştirme işlemi 100 mikrosaniyeden daha az sürer.

Oyun iş yükleri için, grafikler için piksel düzeyinde kesintilerin ve hesaplama görevleri için iş parçacığı düzeyinde kesintilerin birleşimi, Pascal mimarisi GPU'larına minimum zaman kaybıyla görevler arasında hızla geçiş yapma yeteneği verir. Ve CUDA'daki bilgi işlem görevleri için, talimat düzeyinde minimum ayrıntı düzeyiyle kesinti yapmak da mümkündür. Bu modda, tüm iş parçacıkları yürütmeyi bir kerede durdurur ve hemen başka bir göreve geçer. Bu yaklaşım, her bir iş parçacığının tüm kayıtlarının durumu hakkında daha fazla bilgi kaydetmeyi gerektirir, ancak bazı durumlarda grafiksel olmayan hesaplamalar oldukça haklıdır.

Grafiksel ve hesaplamalı görevlerde hızlı kesmeler ve görev değiştirme kullanımı Pascal mimarisine eklendi, böylece grafiksel ve grafiksel olmayan görevler, Maxwell ve Kepler'de olduğu gibi, tüm iş parçacıkları yerine bireysel talimatlar düzeyinde kesilebilir. . Bu teknolojiler, çeşitli GPU iş yüklerinin eşzamansız yürütülmesini iyileştirebilir ve aynı anda birden çok görevi çalıştırırken yanıt vermeyi iyileştirebilir. Nvidia etkinliğinde, fiziksel etkileri hesaplama örneğini kullanarak asenkron hesaplama çalışmalarının bir gösterimini gösterdiler. Asenkron hesaplamalar olmadan performans 77-79 FPS seviyesindeyse, bu özelliklerin eklenmesiyle kare hızı 93-94 FPS'ye yükseldi.

Bu işlevselliği oyunlarda VR'de asenkron zaman bozulması şeklinde kullanma olasılıklarından birine zaten bir örnek vermiştik. Şekil, bu teknolojinin geleneksel kesintili (preemption) ve hızlı çalışmasını göstermektedir. İlk durumda, asenkron zaman distorsiyonu işlemi mümkün olduğunca geç, ancak ekrandaki görüntünün güncellenmesine başlamadan önce gerçekleştirilmeye çalışılır. Ancak algoritmanın çalışması GPU'daki yürütmeye birkaç milisaniye önce verilmelidir, çünkü hızlı bir kesinti olmadan işi doğru zamanda doğru şekilde yürütmenin bir yolu yoktur ve GPU bir süre boşta kalır.

Piksel ve iş parçacığı düzeyinde kesin kesinti olması durumunda (sağda gösterilmektedir), bu yetenek kesinti anının belirlenmesinde daha fazla doğruluk sağlar ve asenkron zaman atlama, işin tamamlanmasından çok daha sonra güvenle başlatılabilir. ekrandaki bilgilerin güncellenmesi başlar. Ve ilk durumda bir süre boşta kalan GPU'ya bazı ek grafik çalışmaları yüklenebilir.

Eşzamanlı Çoklu Projeksiyon Teknolojisi

Yeni GP104 GPU, GPU'nun modern görüntüleme sistemlerinde verileri daha verimli bir şekilde işlemesine olanak tanıyan yeni Eşzamanlı Çoklu Projeksiyon (SMP) teknolojisi için destek ekler. SMP, video çipinin, rasterleştirme bloğundan önce geometrik ardışık düzenin sonunda PolyMorph motorunun bir parçası olarak GPU'ya yeni bir donanım bloğunun eklenmesini gerektiren çeşitli projeksiyonlarda verileri eşzamanlı olarak görüntülemesine izin verir. Bu blok, tek bir geometri akışı için birden çok projeksiyonla çalışmaktan sorumludur.

Çoklu projeksiyon motoru, projeksiyon noktasını (kameralar) birleştiren önceden yapılandırılmış 16 projeksiyon için geometrik verileri aynı anda işler, bu projeksiyonlar bağımsız olarak döndürülebilir veya eğilebilir. Her bir geometri primitifi aynı anda birden fazla projeksiyonda görünebildiğinden, SMP motoru bu işlevselliği sağlar ve uygulamanın video çipine ek işleme gerekmeden geometriyi 32 kata kadar (iki projeksiyon merkezinde 16 projeksiyon) çoğaltma talimatı vermesini sağlar.

Tüm işleme süreci donanım hızlandırmalı ve çoklu projeksiyon geometri motorundan sonra çalıştığı için, geometri işlemenin tüm aşamalarını birkaç kez tekrarlamaya gerek yok. Kaydedilen kaynaklar, her bir projeksiyon için aynı geometrik iş birkaç kez gerçekleştirildiğinde, işleme hızı mozaikleme gibi geometri işleme performansıyla sınırlı olduğunda önemlidir. Buna göre, en yüksek durumda, çoklu projeksiyon, geometri işleme ihtiyacını 32 kata kadar azaltabilir.

Ama tüm bunlar neden gerekli? Çoklu projeksiyon teknolojisinin faydalı olabileceği birkaç iyi örnek var. Örneğin, kullanıcıya yeterince yakın olacak şekilde birbirine açılı olarak monte edilmiş üç ekrandan oluşan bir çoklu monitör sistemi (surround konfigürasyon). Tipik bir durumda, sahne tek bir projeksiyonda işlenir, bu da geometrik bozulmalara ve yanlış geometri oluşturma işlemine yol açar. Doğru yol, bulundukları açıya göre monitörlerin her biri için üç farklı projeksiyondur.

Pascal mimarisine sahip bir çip üzerinde bir video kartı ile bu, her biri farklı bir monitör için üç farklı projeksiyon belirterek tek bir geometri geçişinde yapılabilir. Ve böylece kullanıcı, 3 boyutlu sahnede doğru perspektifi elde etmek için yan monitörler için projeksiyonları döndürerek, monitörlerin birbirine konumlandığı açıyı sadece fiziksel olarak değil aynı zamanda sanal olarak da değiştirebilecektir. belirgin şekilde daha geniş bir görüş açısı (FOV). Doğru, burada bir sınırlama var - bu tür bir destek için uygulama, sahneyi geniş bir FOV ile işleyebilmeli ve bunu ayarlamak için özel SMP API çağrıları kullanabilmelidir. Yani bunu her oyunda yapamazsınız, özel desteğe ihtiyacınız var.

Her durumda, tek bir düz monitörde tek bir projeksiyon günleri sona erdi, artık birçok çoklu monitör yapılandırması var ve kavisli ekranlar bu teknolojinin de uygulanabileceği yerler. Ekranlar ve kullanıcının gözleri arasında özel lensler kullanan ve 3 boyutlu bir görüntüyü 2 boyutlu bir görüntüye yansıtmak için yeni teknikler gerektiren sanal gerçeklik sistemlerinden bahsetmiyorum bile. Bu teknolojilerin ve tekniklerin çoğu hala erken geliştirme aşamasındadır, asıl mesele eski GPU'ların birden fazla düzlemsel projeksiyonu etkin bir şekilde kullanamamasıdır. Birden çok işleme geçişi, aynı geometrinin birden çok işlenmesi vb. gerektirirler.

Maxwell yongaları, verimliliği artırmaya yardımcı olmak için sınırlı Çoklu Çözünürlük desteğine sahipti, ancak Pascal'ın SMP'si çok daha fazlasını yapabilir. Maxwell, küp eşleme veya farklı projeksiyon çözünürlükleri için projeksiyonu 90 derece döndürebilir, ancak bu yalnızca VXGI gibi sınırlı bir uygulama yelpazesinde kullanışlıydı.

SMP'yi kullanmanın diğer olasılıkları arasında farklı çözünürlüklerde işleme ve tek geçişli stereo işleme yer alır. Örneğin, performansı optimize etmek için oyunlarda farklı çözünürlüklerde oluşturma (Multi-Res Shading) kullanılabilir. Uygulandığında, çerçevenin merkezinde daha yüksek bir çözünürlük kullanılır ve daha hızlı bir işleme hızı elde etmek için çevrede azaltılır.

VR'de tek geçişli stereo işleme kullanılır, VRWorks paketine zaten eklenmiştir ve VR işlemede gereken geometrik çalışma miktarını azaltmak için çoklu projeksiyon özelliğini kullanır. Bu özellik kullanılırsa, GeForce GTX 1080 GPU, sahne geometrisini yalnızca bir kez işler ve her göz için aynı anda iki projeksiyon oluşturarak GPU üzerindeki geometrik yükü yarı yarıya azaltır ve ayrıca sürücü ve işletim sisteminden kaynaklanan kayıpları azaltır.

VR işlemenin verimliliğini artırmak için daha da gelişmiş bir teknik, VR işlemede gereken geometrik bozulmaları simüle etmek için birden fazla projeksiyon kullanan Lens Eşleştirilmiş Gölgelendirme'dir. Bu yöntem, VR kulaklık çıkışı için oluşturulduğunda lens ayarlı yüzeye yaklaşan bir yüzey üzerinde bir 3B sahneyi oluşturmak için çoklu projeksiyon kullanır ve çevre üzerinde atılacak birçok fazla pikselden kaçınır. Yöntemin özünü anlamanın en kolay yolu örnek vermektir - her gözün önünde hafifçe genişletilmiş dört projeksiyon kullanılır (Pascal'da her bir göz için 16 projeksiyon kullanabilirsiniz - kavisli bir merceği daha doğru bir şekilde simüle etmek için) bir yerine:

Bu yaklaşım önemli performans tasarruflarına yol açabilir. Örneğin, göz başına tipik bir Oculus Rift görüntüsü 1,1 megapikseldir. Ancak projeksiyonlardaki farklılık nedeniyle, onu oluşturmak için orijinal görüntü 2,1 megapikseldir - gerekenden %86 daha fazla! Pascal mimarisinde uygulanan çoklu projeksiyon kullanımı, oluşturulan görüntünün çözünürlüğünün 1,4 megapiksele düşürülmesine, piksel işleme hızında 1,5 kat tasarruf sağlanmasına ve ayrıca bellek bant genişliğinden tasarruf edilmesine olanak tanır.

GeForce GTX 1080 grafik işlemcisi, tek geçişli stereo işleme sayesinde geometri işleme hızında iki kat tasarruf sağlamanın yanı sıra, geometri işleme hızından çok daha fazlasını talep eden VR işleme performansında önemli bir artış sağlayabilir. piksel işleme

Video çıkışı ve işleme bloklarındaki iyileştirmeler

3D işleme ile ilgili performans ve yeni işlevselliğe ek olarak, video kod çözme ve kodlamanın yanı sıra iyi bir görüntü çıktısı seviyesini korumak gerekir. Ve Pascal mimarisinin ilk GPU'su hayal kırıklığına uğratmadı - her şeyi destekliyor modern standartlar bu anlamda, bir PC'de 4K videoları izlemek için gereken HEVC formatındaki donanım kod çözme de dahil. Ayrıca, GeForce GTX 1080 grafik kartlarının gelecekteki sahipleri yakında sistemlerinde Netflix ve diğer sağlayıcılardan 4K video akışının keyfini çıkarabilecekler.

Ekran çıkışı açısından, GeForce GTX 1080, DisplayPort'un yanı sıra HDCP 2.2 ile HDMI 2.0b desteğine sahiptir. Şimdiye kadar, DP 1.2 sürümü onaylandı, ancak GPU, standardın daha yeni sürümleri için sertifikasyona hazır: DP 1.3 Hazır ve DP 1.4 Hazır. İkincisi, bir çift DisplayPort 1.3 kablosu kullanılarak 120Hz'de 4K ekranların ve 60Hz'de 5K ve 8K ekranların görüntülenmesine izin verir. GTX 980 için desteklenen maksimum çözünürlük 60Hz'de 5120x3200 ise, yeni GTX 1080 modeli için aynı 60Hz'de 7680x4320'ye yükseldi. Referans GeForce GTX 1080, bir HDMI 2.0b ve bir dijital Dual-Link DVI olmak üzere üç DisplayPort çıkışına sahiptir.

Nvidia video kartının yeni modeli ayrıca video verilerinin kodunu çözmek ve kodlamak için geliştirilmiş bir blok aldı. Böylece, GP104 yongası, Netflix gibi tanınmış sağlayıcılardan yüksek kaliteli içerik oynatmanın en yüksek kalitede ve enerji açısından verimli olacağından emin olmanızı sağlayan, akışlı video oynatma için PlayReady 3.0'ın (SL3000) yüksek standartlarıyla uyumludur. . Kodlama ve kod çözme sırasında çeşitli video formatlarının desteklenmesiyle ilgili ayrıntılar tabloda verilmiştir, yeni ürün daha iyisi için önceki çözümlerden açıkça farklıdır:

Ancak daha da ilginç bir yenilik, piyasada yaygınlaşmak üzere olan sözde Yüksek Dinamik Aralıklı (HDR) ekranların desteklenmesidir. TV'ler 2016'da (sadece bir yıl içinde dört milyon HDR TV'nin satılması bekleniyor) ve monitörler gelecek yıl satışa çıkıyor. HDR, iki kat renk tonu (RGB için %75 görünür spektruma karşılık %33), daha yüksek kontrast oranına (10000:1) ve zengin renklere sahip daha parlak ekranlar (1000 nit) sunarak, ekran teknolojisinde yıllardır görülen en büyük gelişmedir.

Daha büyük bir parlaklık farkı ve daha zengin ve daha doygun renkler ile içerik oynatma yeteneğinin ortaya çıkması, ekrandaki görüntüyü gerçeğe yaklaştıracak, siyah renk derinleşecek, parlak ışık tıpkı gerçek dünyada olduğu gibi göz kamaştıracak . Buna göre kullanıcılar, standart monitör ve TV'lere kıyasla görüntülerin aydınlık ve karanlık alanlarında daha fazla ayrıntı görecekler.

HDR ekranları desteklemek için GeForce GTX 1080 ihtiyacınız olan her şeye sahiptir - 12-bit renk çıkışı, BT.2020 ve SMPTE 2084 standartları desteği ve HDMI 2.0b 10/12-bit 4K HDR çıkışı. Maxwell. Buna ek olarak Pascal, HEVC formatının 60 Hz'de 4K çözünürlükte ve HDR video için kullanılan 10 veya 12 bit renkte kod çözme ve aynı formatı aynı parametrelerle, ancak yalnızca 10'da kodlama desteği ekledi. -HDR video kaydı veya akışı için bit. Ayrıca yenilik, bu konektör aracılığıyla HDR veri iletimi için DisplayPort 1.4 standardizasyonuna hazır.

Bu arada, gelecekte bu tür verileri bir ev bilgisayarından 10-bit HEVC oynatabilen bir SHIELD oyun konsoluna aktarmak için HDR video kodlamaya ihtiyaç duyulabilir. Yani kullanıcı, oyunu bir PC'den HDR formatında yayınlayabilecek. Bekle, bu tür desteğe sahip oyunları nereden alabilirim? Nvidia, bu desteği uygulamak için sürekli olarak oyun geliştiricilerle birlikte çalışıyor ve mevcut ekranlarla uyumlu HDR görüntülerini doğru bir şekilde oluşturmaları için onlara ihtiyaç duydukları her şeyi (sürücü desteği, kod örnekleri vb.) veriyor.

GeForce GTX 1080 ekran kartının çıktığı tarihte Obduction, The Witness, Lawbreakers, Rise of the Tomb Raider, Paragon, The Talos Principle ve Shadow Warrior 2 gibi oyunların HDR çıkış desteği bulunuyordu ama bu liste şöyle: yakın zamanda yenilenmesi bekleniyor.

Çok çipli SLI işlemede değişiklikler

Tescilli SLI çok çipli işleme teknolojisiyle ilgili bazı değişiklikler de vardı, ancak bunu kimse beklemiyordu. SLI, PC oyun tutkunları tarafından ya en güçlü tek çipli grafik kartlarını birlikte çalıştırarak performansı en üst düzeye çıkarmak ya da kendilerini bazen daha ucuz olan birkaç orta sınıf çözümle sınırlayarak çok yüksek kare hızları elde etmek için kullanılır. bir üst uç (tartışmalı karar, ancak yapıyorlar). 4K monitörlerde, oyuncuların birkaç video kartı takmaktan başka seçeneği yoktur, çünkü en iyi modeller bile bu gibi durumlarda maksimum ayarlarda rahat bir oyun sağlayamaz.

Nvidia SLI'nin önemli bileşenlerinden biri, video kartlarını ortak bir video alt sistemine bağlayan ve düzenlemeye hizmet eden köprülerdir. dijital kanal Aralarında veri aktarımı için. GeForce grafik kartları, geleneksel olarak, 3 Yönlü ve 4 Yönlü SLI yapılandırmalarında iki veya dört grafik kartı arasında bağlantı kurmaya yarayan çift SLI konektörüne sahiptir. Tüm GPU'lar oluşturdukları kareleri ana GPU'ya gönderdiğinden, ekran kartlarının her birinin birbirine bağlı olması gerekiyordu, bu nedenle her bir kartta iki arabirime ihtiyaç duyuldu.

GeForce GTX 1080'den başlayarak, tüm Pascal tabanlı Nvidia grafik kartları için, grafik kartları arasındaki veri aktarımı performansını artırmak için iki SLI arabirimi birbirine bağlanır ve böyle yeni bir çift ​​kanal modu SLI, çok yüksek çözünürlüklü ekranlarda veya çoklu monitör sistemlerinde görsel bilgileri görüntülerken üretkenliği ve rahatlığı artırmanıza olanak tanır.

Bu mod için SLI HB adı verilen yeni köprülere de ihtiyaç vardı. Yeni video kartları eski köprülerle de uyumlu olsa da, bir çift GeForce GTX 1080 video kartını iki SLI kanalı üzerinden aynı anda birleştiriyorlar. 60 Hz yenileme hızında 1920×1080 ve 2560×1440 piksel çözünürlükler için standart köprüler kullanılabilir, ancak daha zorlu modlarda (4K, 5K ve çoklu monitör sistemleri), yalnızca yeni köprüler daha iyi sonuçlar sağlayacaktır. pürüzsüz çerçeve değişimi, eskileri işe yarayacak, ancak biraz daha kötü.

Ayrıca, SLI HB köprülerini kullanırken, GeForce GTX 1080 veri arayüzü, eski GPU'lardaki geleneksel SLI köprüleri için 400 MHz'e kıyasla 650 MHz'de çalışır. Ayrıca, bazı zorlu eski köprüler için, Pascal mimarisinin video yongaları ile daha yüksek bir veri aktarım hızı da mevcuttur. Arttırılmış çalışma frekansı ile iki katına çıkarılmış bir SLI arabirimi aracılığıyla GPU arasındaki veri aktarım hızının artmasıyla, önceki çözümlere kıyasla ekranda karelerin daha düzgün görüntülenmesi de sağlanır:

Ayrıca DirectX 12'de çoklu çip işleme desteğinin daha önce alışılmış olandan biraz farklı olduğu da belirtilmelidir. AT En son sürüm grafik API'si, Microsoft şirketi bu tür video sistemlerinin çalışmasıyla ilgili birçok değişiklik yaptı. DX12'de yazılım geliştiricilerin kullanabileceği iki çoklu GPU seçeneği vardır: Çoklu Ekran Bağdaştırıcısı (MDA) ve Bağlantılı Ekran Bağdaştırıcısı (LDA) modları.

Ayrıca, LDA modunun iki biçimi vardır: Örtük LDA (Nvidia'nın SLI için kullandığı) ve Açık LDA (oyun geliştiricisi çok çipli işlemeyi yönetme görevini üstlendiğinde. MDA ve Açık LDA modları, DirectX 12'de yeni uygulandı. oyun geliştiricilerine çok çipli video sistemlerini kullanırken daha fazla özgürlük ve fırsat vermek için. Modlar arasındaki fark aşağıdaki tabloda açıkça görülmektedir:

LDA modunda, her bir GPU'nun belleği bir diğerinin belleğine bağlanabilir ve veriler "yabancı" bellekten alındığında tüm performans sınırlamaları ile tabii ki büyük bir toplam hacim olarak görüntülenebilir. MDA modunda, her bir GPU'nun belleği ayrı çalışır ve farklı GPU'lar, başka bir GPU'nun belleğindeki verilere doğrudan erişemez. LDA modu, benzer performansa sahip çok çipli sistemler için tasarlanmıştır, MDA modu ise daha az kısıtlayıcıdır ve ayrık ve entegre GPU'lar veya farklı üreticilerin yongaları ile ayrı çözümlerle birlikte çalışabilir. Ancak bu mod, GPU'ların birbirleriyle iletişim kurabilmesi için işbirliğini programlarken geliştiricilerin daha fazla dikkat ve çalışmasını gerektirir.

Varsayılan olarak, GeForce GTX 1080 tabanlı SLI sistemi yalnızca iki GPU'yu destekler ve modern oyunlarda üçüncü ve dördüncü bir GPU ekleyerek performans kazanımları elde etmek giderek daha zor hale geldiğinden, üç ve dört GPU yapılandırmaları resmi olarak kullanımdan kaldırılmıştır. Örneğin, birçok oyun olasılık üzerine kuruludur. İşlemci sistemler çok çipli video sistemleriyle çalışırken, ayrıca yeni oyunlarda, birkaç GPU'nun aynı anda verimli çalışmasının imkansız olduğu önceki karelerden gelen verileri kullanarak geçici (zamansal) teknikler giderek daha fazla kullanılmaktadır.

Bununla birlikte, DirectX 12'deki MDA veya LDA Açık modları veya PhysX fiziksel efektleri için özel bir üçüncü GPU'ya sahip iki çipli bir SLI sistemi gibi diğer (SLI olmayan) çok çipli sistemlerde sistemlerin çalışması mümkün olmaya devam etmektedir. Peki ya kıyaslamalardaki kayıtlar, Nvidia gerçekten onları tamamen terk mi ediyor? Hayır, elbette, ama bu tür sistemler dünyada neredeyse birkaç kullanıcı tarafından talep edildiğinden, bu tür ultra meraklılar için Nvidia web sitesinden indirilebilen ve bu özelliğin kilidini açabilen özel bir Meraklı Anahtarı icat edildi. Bunu yapmak için önce özel bir uygulama çalıştırarak benzersiz bir GPU kimliği almanız, ardından web sitesinde Meraklısı Anahtarını talep etmeniz ve indirdikten sonra anahtarı sisteme yüklemeniz, böylece 3'lü ve 4'lü yolların kilidini açmanız gerekir. SLI yapılandırmaları.

Hızlı Senkronizasyon teknolojisi

Bilgilerin ekranda gösterilmesi sırasında senkronizasyon teknolojilerinde bazı değişiklikler yapılmıştır. İleriye baktığımızda, G-Sync'te yeni bir şey yok ve Adaptive Sync teknolojisi desteklenmiyor. Ancak Nvidia, kare hızı monitörün yenileme hızından önemli ölçüde yüksek olduğunda çok yüksek performans gösteren oyunlar için çıktının düzgünlüğünü ve senkronizasyonunu iyileştirmeye karar verdi. Bu, özellikle minimum gecikme ve hızlı yanıt gerektiren ve çok oyunculu savaşlar ve yarışmalar olan oyunlar için önemlidir.

Hızlı Senkronizasyon, görüntüde yırtılma gibi görsel kusurlara sahip olmayan ve gecikmeyi artıran sabit bir yenileme hızına bağlı olmayan dikey senkronizasyona yeni bir alternatiftir. Counter-Strike gibi oyunlarda dikey senkronizasyonla ilgili sorun nedir: Küresel saldırı? Güçlü modern GPU'lardaki bu oyun saniyede birkaç yüz kare hızında çalışır ve oyuncunun v-sync'i etkinleştirip etkinleştirmeme seçeneği vardır.

Çok oyunculu oyunlarda, kullanıcılar genellikle minimum gecikmeler için kovalar ve VSync'i kapatarak, yüksek kare hızlarında bile son derece rahatsız edici olan görüntüde net bir şekilde görülen yırtılmalar elde eder. Bununla birlikte, v-sync'i açarsanız, grafik ardışık düzeni monitörün yenileme hızına yavaşladığında, oynatıcı eylemleri ile ekrandaki görüntü arasındaki gecikmelerde önemli bir artış yaşayacaktır.

Geleneksel bir boru hattı bu şekilde çalışır. Ancak Nvidia, Fast Sync teknolojisini kullanarak görüntüyü ekranda oluşturma ve görüntüleme sürecini ayırmaya karar verdi. Bu, mümkün olduğunca devam etmenizi sağlar verimli çalışma GPU'nun kareleri tam hızda işleyen kısmı için, bu kareleri özel bir geçici Son İşlenen Tamponda saklar.

Bu yöntem, görüntüleme yöntemini değiştirmenize ve VSync Açık ve VSync Kapalı modlarından en iyi şekilde yararlanmanıza, düşük gecikme süresi elde etmenize, ancak görüntü bozulmaları olmadan izin verir. Fast Sync ile kare akışı kontrolü yoktur, oyun motoru senkronizasyon modunda çalışır ve bir sonrakini çizmek için beklemesi söylenmez, bu nedenle gecikmeler neredeyse VSync Off modu kadar düşüktür. Ancak Fast Sync, ekranda görüntülemek için bağımsız olarak bir arabellek seçtiğinden ve tüm çerçeveyi görüntülediğinden, resim kesintileri de olmaz.

Fast Sync, ilk ikisi klasik bir ardışık düzende çift arabelleğe almaya benzer şekilde çalışan üç farklı arabellek kullanır. Birincil arabellek (Ön Tampon - FB), bilgileri ekranda görüntülenen, tamamen işlenmiş bir çerçeve olan bir arabellektir. Geri arabellek (Geri Tampon - BB), oluşturma sırasında bilgi alan arabellektir.

Yüksek kare hızı koşullarında dikey senkronizasyon kullanılırken, oyun, ekranda tek bir karenin görüntüsünü görüntülemek için birincil tamponu ikincil tamponla değiştirmek için yenileme aralığına ulaşılana kadar bekler. Bu, işleri yavaşlatır ve geleneksel üçlü arabelleğe alma gibi daha fazla arabellek eklemek yalnızca gecikmeyi artırır.

Hızlı Senkronizasyon ile, ikincil arabellekte henüz oluşturulmuş tüm kareleri depolamak için kullanılan üçüncü bir Son İşleme Arabelleği (LRB) eklenir. Tamponun adı kendisi için konuşur, son tam olarak oluşturulmuş çerçevenin bir kopyasını içerir. Ve birincil tamponu güncelleme zamanı geldiğinde, bu LRB tamponu, dikey senkronizasyonu devre dışı bırakılmış ikincil tampondan olduğu gibi, kısmen değil, bütünüyle birincil tampona kopyalanır. Arabelleklerden bilgi kopyalamak verimsiz olduğundan, bunlar basitçe değiştirilir (veya anlaşılması daha kolay olacağı için yeniden adlandırılırlar) ve GP104'te tanıtılan yeni arabellek değiştirme mantığı bu süreci yönetir.

Pratikte, yeni bir senkronizasyon yönteminin dahil edilmesi Hızlı Senkronizasyon, tamamen devre dışı bırakılan dikey senkronizasyona kıyasla biraz daha büyük bir gecikme sağlar - ortalama 8 ms daha fazla, ancak ekranda hoş olmayan artefaktlar olmadan, çerçeveleri bütünüyle monitörde görüntüler. görüntüyü yırtın. Yeni yöntem, dikey senkronizasyon kontrolü bölümündeki Nvidia kontrol paneli grafik ayarlarından etkinleştirilebilir. Ancak, varsayılan değer uygulama kontrolü olarak kalır ve tüm 3D uygulamalarda Hızlı Senkronizasyonu etkinleştirmek gerekli değildir, bu yöntemi özellikle yüksek FPS'li oyunlar için seçmek daha iyidir.

Sanal gerçeklik teknolojisi Nvidia VRWorks

Bu makalede VR'nin sıcak konusuna bir kereden fazla değindik, ancak bu çoğunlukla VR için çok önemli olan kare hızlarını artırmak ve düşük gecikmeyi sağlamakla ilgiliydi. Bütün bunlar çok önemli ve gerçekten de ilerleme var, ancak şimdiye kadar VR oyunları "normal" modern 3D oyunların en iyileri kadar etkileyici görünmüyor. Bu, yalnızca önde gelen oyun geliştiricilerinin henüz VR uygulamalarına özel olarak dahil olmaması nedeniyle değil, aynı zamanda VR'nin kare hızlarını daha fazla talep etmesi nedeniyle olur; bu da yüksek talepler nedeniyle bu tür oyunlarda olağan tekniklerin çoğunun kullanılmasını engeller.

VR oyunları ve normal oyunlar arasındaki kalite farkını azaltmak için Nvidia, hem kaliteyi hem de performansı önemli ölçüde artırabilecek çok sayıda API, kitaplık, motor ve teknoloji içeren ilgili VRWorks teknolojileri paketini piyasaya sürmeye karar verdi. VR uygulamaları. Bunun Pascal'daki ilk oyun çözümünün duyurulmasıyla nasıl bir ilgisi var? Çok basit - üretkenliği artırmaya ve kaliteyi artırmaya yardımcı olan bazı teknolojiler tanıtıldı ve bunlar hakkında zaten yazdık.

Ve sadece grafiklerle ilgili olmasa da, önce biraz bundan bahsedeceğiz. VRWorks Graphics teknolojileri seti, GeForce GTX 1080'de ortaya çıkan çoklu projeksiyon özelliğini kullanan Lens Matched Shading gibi daha önce bahsedilen teknolojileri içeriyor. böyle bir desteği olmayan çözümler. Çerçevenin merkezinde ve çevresinde farklı çözünürlüklerde işlemek üzere tasarlanmış MultiRes Shading gibi diğer teknolojilerden de bahsettik.

Ancak çok daha beklenmedik olan, özellikle sanal gerçeklik sistemlerinde önemli olan 3B sahnelerdeki ses verilerinin yüksek kalitede hesaplanması için tasarlanmış VRWorks Audio teknolojisinin duyurulmasıydı. Geleneksel motorlarda, ses kaynaklarının sanal bir ortamda konumlandırılması oldukça doğru bir şekilde hesaplanır, eğer düşman sağdan ateş ederse, ses sisteminin bu tarafından ses daha yüksek olur ve böyle bir hesaplama hesaplama gücü üzerinde çok fazla talep etmez. .

Ama gerçekte, sesler sadece oyuncuya doğru değil, her yöne gider ve ışık ışınlarının sıçramasına benzer şekilde çeşitli malzemelerden yansır. Ve gerçekte, doğrudan ses dalgaları kadar net olmasa da, bu yansımaları duyuyoruz. Bu dolaylı ses yansımaları genellikle özel yankı efektleriyle simüle edilir, ancak bu, göreve çok ilkel bir yaklaşımdır.

VRWorks Audio, ışık ışınlarının yolunun sanal bir sahnedeki nesnelerden gelen çoklu yansımalara kadar izlendiği, işlemede ışın izlemeye benzer ses dalgası işlemeyi kullanır. VRWorks Audio, doğrudan ve yansıyan dalgalar izlendiğinde, geliş açılarına ve yansıtıcı malzemelerin özelliklerine bağlı olarak ses dalgalarının ortamdaki yayılmasını da simüle eder. VRWorks Audio, çalışmasında, grafik görevleri için bilinen yüksek performanslı Nvidia OptiX ışın izleme motorunu kullanır. OptiX, dolaylı aydınlatma hesaplama ve ışık haritalama gibi çeşitli görevler için ve şimdi VRWorks Audio'da ses dalgası izleme için de kullanılabilir.

Nvidia, birkaç bin ışın kullanan ve nesnelerden 12'ye kadar yansımayı hesaplayan VR Funhouse demosuna doğru ses dalgası hesaplaması yerleştirdi. Ve net bir örnek kullanarak teknolojinin avantajlarını öğrenmek için, teknolojinin işleyişi hakkında Rusça bir video izlemenizi öneririz:

Nvidia'nın yaklaşımının, GPU'da özel bir blok kullanan ana rakipten donanım hızlandırmalı yöntem de dahil olmak üzere geleneksel ses motorlarından farklı olması önemlidir. Bu yöntemlerin tümü, yalnızca ses kaynaklarının doğru konumlandırılmasını sağlar, ancak yankı efektini kullanarak bunu simüle edebilmelerine rağmen, bir 3B sahnedeki nesnelerden gelen ses dalgalarının yansımalarını hesaplamaz. Ancak, ışın izleme teknolojisinin kullanımı çok daha gerçekçi olabilir, çünkü yalnızca böyle bir yaklaşım, sahnedeki nesnelerin boyutu, şekli ve malzemeleri dikkate alınarak çeşitli seslerin doğru bir şekilde taklit edilmesini sağlayacaktır. Tipik bir oyuncu için böyle bir hesaplama doğruluğunun gerekli olup olmadığını söylemek zor, ancak kesin olarak söyleyebiliriz: VR'de, kullanıcılara hala geleneksel oyunlarda eksik olan gerçekçiliği ekleyebilir.

Pekala, bize sadece hem OpenGL hem de DirectX'te çalışan VR SLI teknolojisinden bahsetmek kalıyor. İlkesi son derece basittir: Bir VR uygulamasındaki iki GPU'lu bir video sistemi, SLI konfigürasyonlarına aşina olan AFR işlemenin aksine, her bir göze ayrı bir GPU tahsis edilecek şekilde çalışacaktır. Bu, sanal gerçeklik sistemleri için çok önemli olan genel performansı büyük ölçüde artırır. Teorik olarak daha fazla GPU kullanılabilir, ancak sayıları çift olmalıdır.

Bu yaklaşım gerekliydi çünkü AFR VR için pek uygun değil, çünkü onun yardımıyla ilk GPU her iki göz için eşit bir çerçeve çizecek ve ikincisi sanal için kritik olan gecikmeleri azaltmayacak şekilde tek bir çerçeve oluşturacak. gerçeklik sistemleri. Kare hızı oldukça yüksek olmasına rağmen. Böylece, VR SLI'nin yardımıyla, her kare üzerindeki çalışma iki GPU'ya bölünür - biri sol göz için çerçevenin bir kısmı üzerinde, ikincisi sağ için çalışır ve ardından çerçevenin bu yarımları bir bütün halinde birleştirilir.

Çalışmayı bir çift GPU arasında bu şekilde bölmek, performansta 2 kat artış sağlayarak, tek bir grafik kartına dayalı sistemlere kıyasla daha yüksek kare hızları ve daha düşük gecikme süresi sağlar. Doğru, VR SLI kullanımı, bu ölçekleme yöntemini kullanmak için uygulamadan özel destek gerektirir. Ancak VR SLI teknolojisi, Valve's The Lab ve ILMxLAB's Trials on Tatooine gibi VR demo uygulamalarında zaten yerleşik durumda ve bu sadece başlangıç ​​- Nvidia, teknolojiyi Unreal Engine 4, Unity ve Max'e getirmenin yanı sıra yakında diğer uygulamaların da geleceğini vaat ediyor. Oyna.

Ansel Oyun Ekran Görüntüsü Platformu

Yazılımla ilgili en ilginç duyurulardan biri, adını ünlü bir fotoğrafçı olan Ansel'den alan oyun uygulamalarında yüksek kaliteli ekran görüntüleri yakalamak için bir teknolojinin piyasaya sürülmesiydi. Oyunlar uzun zamandır sadece oyun değil, aynı zamanda çeşitli yaratıcı kişilikler için oyuncu ellerin kullanıldığı bir yer olmuştur. Birisi oyunlar için komut dosyalarını değiştirir, biri oyunlar için yüksek kaliteli doku setleri yayınlar ve birileri güzel ekran görüntüleri yapar.

Nvidia, oyunlardan yüksek kaliteli çekimler oluşturmak (yani, bu o kadar kolay bir süreç olmadığı için oluşturmak) için yeni bir platform sunarak ikincisine yardım etmeye karar verdi. Ansel'in yeni bir tür çağdaş sanat yaratmaya yardımcı olabileceğine inanıyorlar. Sonuçta, hayatlarının çoğunu PC'de geçiren, oyunlardan güzel ekran görüntüleri yaratan epeyce sanatçı var ve hala bunun için uygun bir araca sahip değillerdi.

Ansel, oyunda yalnızca bir görüntü yakalamanıza değil, aynı zamanda yaratıcının ihtiyaç duyduğu şekilde değiştirmenize de olanak tanır. Bu teknolojiyi kullanarak, istediğiniz çerçeve kompozisyonunu elde etmek için kamerayı sahnede hareket ettirebilir, döndürebilir ve herhangi bir yönde eğebilirsiniz. Örneğin, birinci şahıs nişancı oyunları gibi oyunlarda, yalnızca oyuncuyu hareket ettirebilirsiniz, başka hiçbir şeyi değiştiremezsiniz, bu nedenle tüm ekran görüntüleri oldukça monotondur. Ansel'deki ücretsiz bir kamerayla, iyi bir resim için ihtiyacınız olan açıyı seçerek oyun kamerasının çok ötesine geçebilir, hatta gerekli noktadan tam 360 derecelik bir stereo görüntü ve daha sonra izlemek üzere yüksek çözünürlükte yakalayabilirsiniz. VR kaskı.

Ansel oldukça basit çalışır - Nvidia'nın özel kitaplığının yardımıyla bu platform oyun koduna yerleştirilmiştir. Bunu yapmak için geliştiricisinin, Nvidia video sürücüsünün arabellek ve gölgelendirici verilerini engellemesine izin vermek için projesine yalnızca küçük bir kod parçası eklemesi yeterlidir. Yapılması gereken çok az iş var, Ansel'i oyuna dahil etmek bir günden az sürüyor. Böylece, bu özelliğin dahil edilmesi Oyun Tanık yaklaşık 40 satır kod alırken, The Witcher 3 yaklaşık 150 satır kod aldı.

Ansel, açık bir geliştirme paketi olan SDK ile birlikte gelir. Ana şey, kullanıcının kameranın konumunu ve açısını değiştirmesine, efektler eklemesine vb. izin veren standart bir ayar seti almasıdır. Ansel platformu şu şekilde çalışır: oyunu duraklatır, ücretsiz kamerayı açar ve sonucu normal bir ekran görüntüsü, 360 derecelik bir görüntü, bir stereo çifti veya yalnızca yüksek çözünürlüklü bir panorama biçiminde kaydederek çerçeveyi istediğiniz görünüme değiştirmenize olanak tanır.

Tek uyarı, tüm oyunların oluşturma platformunun tüm özellikleri için destek almayacağıdır. oyun ekran görüntüleri Ansel. Bazı oyun geliştiricileri, şu veya bu nedenle, oyunlarına tamamen ücretsiz bir kamera eklemek istemiyorlar - örneğin, hilecilerin bu işlevi kullanma olasılığı nedeniyle. Veya aynı nedenle görüş açısındaki değişikliği sınırlamak istiyorlar - böylece hiç kimse haksız bir avantaj elde etmesin. Eh, ya da böylece kullanıcılar arka planda sefil sprite görmezler. Bütün bunlar, oyun yaratıcılarının oldukça normal arzularıdır.

Ansel'in en ilginç özelliklerinden biri, çok büyük çözünürlükte ekran görüntüleri oluşturmasıdır. Oyunun örneğin 4K'ya kadar çözünürlükleri desteklemesi önemli değil ve kullanıcının monitörünün Full HD olması. Ekran görüntüsü platformunu kullanarak, sürücünün boyutu ve performansı ile sınırlı olan çok daha yüksek kaliteli bir görüntü yakalayabilirsiniz. Platform, 3600 parçadan bir araya getirilmiş 4,5 gigapiksele kadar ekran görüntülerini kolaylıkla yakalar!

Oyunda prensipte böyle bir ayrıntı düzeyi sağlanmışsa, bu tür resimlerde uzakta duran gazetelerdeki metne kadar tüm ayrıntıları görebileceğiniz açıktır - Ansel ayrıca ayrıntı düzeyini, ayarı kontrol edebilir. en iyi görüntü kalitesini elde etmek için maksimum seviye. Ancak yine de süper örneklemeyi etkinleştirebilirsiniz. Tüm bunlar, büyük afişlere güvenle yazdırabileceğiniz ve kaliteleri konusunda sakin olabileceğiniz oyunlardan görüntüler oluşturmanıza olanak tanır.

İlginç bir şekilde, büyük görüntüleri birleştirmek için CUDA'ya dayalı özel bir donanım hızlandırmalı kod kullanılır. Sonuçta, hiçbir video kartı bir multi-gigapiksel görüntüyü bütünüyle oluşturamaz, ancak bunu, aydınlatma, renk vb. olası farkları hesaba katarak daha sonra birleştirmeniz gereken parçalar halinde yapabilir.

Bu tür panoramaları diktikten sonra, tüm çerçeve için GPU'da da hızlandırılmış özel bir son işlem kullanılır. Daha yüksek bir dinamik aralıktaki görüntüleri yakalamak için, her kanaldaki renk değerleri 16 bit kayan nokta biçiminde kaydedilen Industrial Light and Magic'ten açık bir standart olan EXR özel bir görüntü formatı kullanabilirsiniz. (FP16).

Bu format, son işlemede görüntünün parlaklığını ve dinamik aralığını değiştirmenize, kameralardan RAW formatlarında olduğu gibi her belirli ekran için istenen hale getirmenize olanak tanır. Ve görüntü işleme programlarında sonradan işleme filtrelerinin sonraki kullanımı için, bu biçim, normal görüntü biçimlerinden çok daha fazla veri içerdiğinden çok kullanışlıdır.

Ancak Ansel platformunun kendisi, yalnızca son görüntüye değil, aynı zamanda oyun tarafından oluşturma sırasında kullanılan ve çok ilginç efektler için kullanılabilecek tüm arabelleklere erişimi olduğu için özellikle önemli olan birçok işlem sonrası filtre içerir. , alan derinliği gibi. Bunu yapmak için Ansel'in özel bir işlem sonrası API'si vardır ve efektlerden herhangi biri bu platformu destekleyen bir oyuna dahil edilebilir.

Ansel son filtreleri şunları içerir: renk eğrileri, renk uzayı, dönüşüm, desatürasyon, parlaklık/kontrast, film greni, çiçeklenme, mercek parlaması, anamorfik parlama, bozulma, sıcak pus, balık gözü, renk sapması, ton eşleme, mercek kirliliği, ışık milleri , vinyet, gama düzeltme , evrişim, keskinleştirme, kenar algılama, bulanıklık, sepya, gürültü giderme, FXAA ve diğerleri.

Oyunlarda Ansel desteğinin görünümüne gelince, geliştiriciler uygulayıp test edene kadar biraz beklememiz gerekecek. Ancak Nvidia, bu desteğin yakında The Division, The Witness, Lawbreakers, The Witcher 3, Paragon, Fortnite, Obduction, No Man's Sky, Unreal Tournament ve diğerleri gibi tanınmış oyunlarda görüneceğini vaat ediyor.

Yeni 16nm FinFET işlem teknolojisi ve mimari optimizasyonları, GP104 GPU'ya dayalı GeForce GTX 1080 grafik kartının referans formunda bile 1,6-1,7 GHz gibi yüksek bir saat hızına ulaşmasını sağladı ve yeni nesil, oyunlarda mümkün olan en yüksek frekansları garanti ediyor. GPU Boost teknolojileri. Artan sayıda yürütme birimiyle birlikte bu iyileştirmeler, onu yalnızca tüm zamanların en yüksek performanslı tek çipli grafik kartı değil, aynı zamanda piyasadaki en enerji verimli çözüm haline getiriyor.

GeForce GTX 1080, çok yüksek veri hızlarına ulaşan yeni nesil yüksek hızlı yongalar olan yeni GDDR5X grafik belleğine sahip ilk grafik kartıdır. Değiştirilmiş bir GeForce GTX 1080 durumunda, bu tür bellek 10 GHz'lik etkin bir frekansta çalışır. Çerçeve arabelleğindeki bilgileri sıkıştırmak için geliştirilmiş algoritmalarla birlikte, bu, etkin değerde bir artışa yol açmıştır. Bant genişliği Bu GPU için bellek, doğrudan öncülü GeForce GTX 980'e kıyasla 1,7 kat arttı.

Nvidia, geliştirme ve üretim sırasında gereksiz sorunlarla karşılaşmamak için ihtiyatlı bir şekilde, tamamen yeni bir süreç teknolojisi üzerine kökten yeni bir mimari yayınlamamaya karar verdi. Bunun yerine, bazı özellikler ekleyerek zaten iyi ve çok verimli olan Maxwell mimarisini ciddi şekilde geliştirdiler. Sonuç olarak, yeni GPU'ların üretiminde her şey yolunda ve GeForce GTX 1080 modelinde mühendisler çok yüksek bir frekans potansiyeli elde ettiler - ortakların hız aşırtmalı sürümlerinde GPU frekansının 2 GHz'e kadar çıkması bekleniyor! Böyle etkileyici bir frekans, Nvidia mühendislerinin Pascal GPU'nun geliştirilmesinde kusursuz teknik süreç ve özenli çalışmaları sayesinde gerçeğe dönüştü.

Pascal, Maxwell'in doğrudan takipçisi olmasına ve bu grafik mimarilerinin temelde birbirinden çok farklı olmamasına rağmen, Nvidia, görüntüleme yetenekleri, video kodlama ve kod çözme motoru, üzerinde çeşitli hesaplama türlerinin gelişmiş asenkron yürütülmesi dahil olmak üzere birçok değişiklik ve iyileştirme yaptı. GPU, çoklu çip işlemede değişiklikler yaptı ve yeni bir senkronizasyon yöntemi olan Fast Sync'i tanıttı.

Sanal gerçeklik sistemlerinde performansın artırılmasına, çoklu monitör sistemlerinde sahnelerin daha doğru görüntülenmesine ve yeni performans optimizasyon teknikleri getirilmesine yardımcı olan Eşzamanlı Çoklu Projeksiyon teknolojisini öne çıkarmamak mümkün değil. Ancak VR uygulamaları en yüksek hız artışını, geometrik verileri işlerken GPU kaynaklarından yarı yarıya ve piksel başına hesaplamalarda bir buçuk kat tasarruf etmeye yardımcı olan çoklu projeksiyon teknolojisini desteklediklerinde görecekler.

Tamamen yazılım değişiklikleri arasında, Ansel adlı oyunlarda ekran görüntüleri oluşturma platformu öne çıkıyor - sadece çok oynayanlar için değil, aynı zamanda yüksek kaliteli 3D grafiklerle ilgilenenler için pratikte denemek ilginç olacak. . Yenilik, ekran görüntüleri oluşturma ve rötuşlama sanatını yeni bir düzeye taşımanıza olanak tanır. Eh, GameWorks ve VRWorks gibi oyun geliştiricileri için bu tür paketler, Nvidia adım adım gelişmeye devam ediyor - bu nedenle, ikincisinde, donanım ışını kullanarak ses dalgalarının sayısız yansımasını dikkate alarak ilginç bir yüksek kaliteli ses hesaplama olasılığı ortaya çıktı. izleme.

Genel olarak, Nvidia GeForce GTX 1080 ekran kartı şeklinde, bunun için gerekli tüm niteliklere sahip olan gerçek bir lider pazara girdi: yüksek performans ve geniş işlevsellik ile yeni özellikler ve algoritmalar için destek. Bu ekran kartının ilk alıcıları bahsedilen birçok avantajı hemen değerlendirebilecekler ve çözümün diğer olasılıkları da biraz sonra, dışarıdan geniş bir destek olduğunda ortaya çıkacak. yazılım. Ana şey, GeForce GTX 1080'nin çok hızlı ve verimli olduğu ortaya çıktı ve gerçekten umduğumuz gibi, Nvidia mühendisleri bazı sorunlu alanları düzeltmeyi başardı (aynı eşzamansız hesaplamalar).

Grafik hızlandırıcı GeForce GTX 1070

ParametreAnlam
çip kod adıGP104
Üretim teknolojisi16nm FinFET
transistör sayısı7,2 milyar
çekirdek alan314 mm²
MimariÇok sayıda veri türünün akış işlemesi için bir dizi ortak işlemciyle birleştirilmiş: tepe noktaları, pikseller vb.
DirectX donanım desteğiDirectX 12, Özellik Düzeyi 12_1 desteği ile
bellek veriyolu256 bit: GDDR5 ve GDDR5X belleği destekleyen sekiz bağımsız 32 bit bellek denetleyicisi
GPU frekansı1506 (1683) MHz
Hesaplama bloklarıIEEE 754-2008 standardı çerçevesinde kayan nokta hesaplamaları için 1920 (2560 üzerinden) skaler ALU dahil 15 aktif (çipte 20'den) akışlı çoklu işlemci;
Tekstüre bloklarıDokularda FP16 ve FP32 bileşenleri desteği ve tüm doku biçimleri için trilinear ve anizotropik filtreleme desteği ile 120 aktif (çipte 160'tan) doku adresleme ve filtreleme birimi
Raster İşlem Birimleri (ROP'ler)Programlanabilir ve FP16 veya FP32 çerçeve tampon formatı dahil olmak üzere çeşitli kenar yumuşatma modlarını destekleyen 8 geniş ROP (64 piksel). Bloklar, bir dizi yapılandırılabilir ALU'dan oluşur ve derinlik oluşturma ve karşılaştırma, çoklu örnekleme ve harmanlamadan sorumludur.
Monitör desteğiDual Link DVI, HDMI 2.0b ve DisplayPort 1.2 (1.3/1.4 Hazır) aracılığıyla bağlanan dört adede kadar monitör için entegre destek

GeForce GTX 1070 Referans Grafik Özellikleri
ParametreAnlam
çekirdek frekansı1506 (1683) MHz
Evrensel işlemci sayısı1920
Doku bloklarının sayısı120
Karıştırma bloklarının sayısı64
Etkili bellek frekansı8000 (4×2000) MHz
Bellek türüGDDR5
bellek veriyolu256-bit
Hafıza8 GB
Bellek Bant Genişliği256 GB/sn
Bilgi işlem performansı (FP32)yaklaşık 6.5 teraflop
Teorik maksimum doluluk oranı96 gigapiksel/sn
Teorik doku örnekleme oranı181 gigateksel/sn
YorulmakPCI Ekspres 3.0
KonnektörlerBir Dual Link DVI, bir HDMI ve üç DisplayPort
güç kullanımı150 W'a kadar
Fazladan yemekBir adet 8 pinli konektör
Sistem kasasında kullanılan yuva sayısı2
Önerilen fiyat379-449 ABD Doları (ABD), 34.990 ABD Doları (Rusya)

GeForce GTX 1070 ekran kartı da önceki GeForce serisinden aynı çözüme benzer bir mantıksal isim aldı. Doğrudan selefi GeForce GTX 970'ten yalnızca değişen bir nesil numarasında farklıdır. Yenilik, daha da güçlü GPU çözümlerinin piyasaya sürülmesine kadar yeni serinin geçici amiral gemisi haline gelen şirketin mevcut hattındaki mevcut en iyi çözüm GeForce GTX 1080'nin bir adım altında oldu.

Nvidia'nın yeni en iyi ekran kartı için önerilen fiyatlar, normal Nvidia Partners ve Founders Edition için sırasıyla 379 $ ve 449 $'dır. Üst modelle karşılaştırıldığında, bu çok iyi fiyat GTX 1070'in en kötü durumda yaklaşık %25 geride olduğu göz önüne alındığında. Ve duyuru ve piyasaya sürüldüğü sırada GTX 1070, sınıfındaki en iyi performans çözümü haline geliyor. GeForce GTX 1080 gibi, GTX 1070'in de AMD'den doğrudan rakibi yoktur ve yalnızca Radeon R9 390X ve Fury ile karşılaştırılabilir.

GeForce GTX 1070 modifikasyonundaki GP104 GPU, yeni bir GDDR5X bellek türü kullanmasalar da, 8 GHz'lik yüksek etkili bir frekansta çalışan çok hızlı bir GDDR5 kullanmalarına rağmen, tam 256 bit bellek veriyolu bırakmaya karar verdi. Böyle bir veri yoluna sahip bir video kartına takılan bellek miktarı 4 veya 8 GB olabilir ve yeni çözümün yüksek ayarlar ve işleme çözünürlükleri koşullarında maksimum performansını sağlamak için GeForce GTX 1070 ekran kartı modeli de donatılmıştır. ablası gibi 8 GB video belleği ile. Bu hacim, herhangi bir 3B uygulamayı birkaç yıl boyunca maksimum kalite ayarlarıyla çalıştırmak için yeterlidir.

GeForce GTX 1070 Kurucular Sürümü

GeForce GTX 1080'in Mayıs ayı başlarında duyurulmasıyla birlikte, şirketin ortaklarının normal ekran kartlarından daha yüksek bir fiyata sahip olan Founders Edition adlı video kartının özel bir sürümü duyuruldu. Aynı şey yenilik için de geçerlidir. Bu yazımızda yine GeForce GTX 1070 ekran kartının Founders Edition isimli özel versiyonundan bahsedeceğiz. Nvidia, eski modelde olduğu gibi, üreticinin referans ekran kartının bu sürümünü daha yüksek bir fiyata piyasaya sürmeye karar verdi. Pahalı üst düzey grafik kartları satın alan birçok oyuncunun ve meraklının, uygun "premium" görünüm ve hisse sahip bir ürün istediğini iddia ediyorlar.

Buna göre, Nvidia mühendisleri tarafından, GeForce GTX 1070 Founders Edition alüminyum kapağı gibi birinci sınıf malzeme ve bileşenlerden tasarlanıp üretilen GeForce GTX 1070 Founders Edition ekran kartı da bu tür kullanıcılar için piyasaya sürülecek. PCB'nin arkasını kaplayan ve meraklılar arasında oldukça popüler olan düşük profilli bir arka plaka olarak.

Anakartın fotoğraflarından da görebileceğiniz gibi, GeForce GTX 1070 Founders Edition, GeForce GTX 1080 Founders Edition'ın referans sürümünden tamamen aynı endüstriyel tasarımı devraldı. Her iki model de, hem küçük durumlarda hem de sınırlı fiziksel alana sahip çok çipli SLI konfigürasyonlarında çok kullanışlı olan, ısıtılmış havayı dışarı üfleyen bir radyal fan kullanır. Isıtılmış havayı kasanın içinde dolaştırmak yerine dışarı üfleyerek termal stresi azaltabilir, hız aşırtma sonuçlarını iyileştirebilir ve sistem bileşenlerinin ömrünü uzatabilirsiniz.

Referans soğutma sisteminin kapağının altında GeForce GTX 1070, ısıyı GPU'nun kendisinden uzaklaştıran üç dahili bakır ısı borusuna sahip özel olarak şekillendirilmiş bir alüminyum radyatör gizler. Isı boruları tarafından dağıtılan ısı daha sonra bir alüminyum soğutucu tarafından dağıtılır. Kartın arkasındaki düşük profilli metal plaka da daha iyi termal performans sağlamak için tasarlanmıştır. Ayrıca, SLI konfigürasyonlarında birden fazla grafik kartı arasında daha iyi hava akışı için geri çekilebilir bir bölüme sahiptir.

Kartın güç sistemine gelince, GeForce GTX 1070 Founders Edition, istikrarlı bir güç kaynağı için optimize edilmiş dört fazlı bir güç sistemine sahiptir. Nvidia, GTX 1070 Founders Edition'da özel bileşenlerin kullanılmasının GeForce GTX 970'e göre güç verimliliğini, kararlılığı ve güvenilirliği artırdığını ve daha iyi hız aşırtma performansı sağladığını iddia ediyor. Şirketin kendi testlerinde GeForce GTX 1070 GPU'ları, eski GTX 1080 modelinin sonuçlarına yakın olan 1.9 GHz'i kolayca geçti.

Nvidia GeForce GTX 1070 grafik kartı, 10 Haziran'dan itibaren perakende mağazalarında satışa sunulacak. GeForce GTX 1070 Founders Edition ve ortak çözümleri için önerilen fiyatlar farklıdır ve bu özel sürüm için ana soru budur. Nvidia ortakları GeForce GTX 1070 grafik kartlarını 379 dolardan (ABD pazarında) satarsa, Nvidia'nın referans tasarımı Founders Edition 449 dolara kadar mal olacak. Referans sürümünün şüpheli avantajları için fazla ödeme yapmaya hazır birçok meraklı var mı? Zaman gösterecek, ancak satışların en başında satın alınabilecek bir seçenek olarak referans ücretinin daha ilginç olduğuna ve daha sonra satın alma noktasının (ve hatta yüksek bir fiyata bile!) sıfıra indirildiğine inanıyoruz.

Bunu eklemek için kalır baskılı devre kartı Referans GeForce GTX 1070, eski ekran kartına benzer ve her ikisi de şirketin önceki anakartlarının cihazından farklıdır. Yeni ürün için tipik güç tüketimi değeri 150 W, bu da GTX 1080 değerinden neredeyse %20 daha az ve önceki nesil GeForce GTX 970 ekran kartının güç tüketimine yakın.Nvidia referans kartının tanıdık bir seti var. görüntü çıkış cihazlarını bağlamak için konektör sayısı: bir Dual-Link DVI , bir HDMI ve üç DisplayPort. Üstelik, GTX 1080 modelinin incelemesinde yukarıda yazdığımız HDMI ve DisplayPort'un yeni sürümleri için destek var.

Mimari değişiklikler

GeForce GTX 1070, Nvidia'nın Pascal grafik mimarisinin yeni neslinin ilki olan GP104 yongasını temel alıyor. Bu mimari, Maxwell'de geliştirilen çözümlere dayanmaktadır, ancak aynı zamanda, yukarıda ayrıntılı olarak yazdığımız bazı işlevsel farklılıklara sahiptir - en iyi GeForce GTX 1080 ekran kartına ayrılmış kısımda.

Yeni mimarideki ana değişiklik, tüm yeni GPU'ların yürütüleceği teknolojik süreçti. GP104'ün üretiminde 16 nm FinFET üretim sürecinin kullanılması, nispeten düşük bir alan ve maliyeti korurken çipin karmaşıklığını önemli ölçüde artırmayı mümkün kıldı ve Pascal mimarisinin ilk çipi, önemli ölçüde daha fazla yürütme sayısına sahip benzer konumlandırmaya sahip Maxwell yongalarına kıyasla yeni işlevsellik sağlayanlar da dahil olmak üzere birimler.

GP104 video çipi, tasarımında benzer Maxwell mimarisi çözümlerine benzer ve modern GPU'ların tasarımı hakkında ayrıntılı bilgiyi önceki Nvidia çözümlerine yönelik incelemelerimizde bulabilirsiniz. Önceki GPU'lar gibi, yeni mimarinin yongaları farklı bir Grafik İşleme Kümesi (GPC), Akış Çok İşlemcili (SM) ve bellek denetleyicileri yapılandırmasına sahip olacak ve GeForce GTX 1070'de bazı değişiklikler zaten meydana geldi - çipin bir kısmı kilitlendi ve etkin değil (gri renkle vurgulanmıştır):

GP104 GPU, dört GPC kümesi ve 20 SM çoklu işlemci içermesine rağmen, GeForce GTX 1070 sürümünde donanım tarafından devre dışı bırakılan bir GPC kümesiyle sadeleştirilmiş bir değişiklik aldı. Her GPC kümesi özel bir rasterleştirme motoruna sahip olduğundan ve beş SM içerdiğinden ve her çok işlemcili 128 CUDA çekirdeği ve sekiz doku TMU'dan oluştuğundan, GP104'ün bu sürümünde 1920 CUDA çekirdeği ve 120 TMU 2560 akış işlemcisi aktif ve 160 fiziksel doku birimi.

GeForce GTX 1070'in temel aldığı grafik işlemcisi, sekiz adet 32-bit bellek denetleyicisi içerir ve bu, toplam 256-bit bellek veriyolu ile sonuçlanır - tıpkı eski GTX 1080 modelinde olduğu gibi.Bellek alt sistemi sırayla kesilmemiştir. GeForce GTX 1070'te GDDR5 bellek kullanılması koşuluyla yeterince yüksek bant genişliğine sahip bir bellek sağlamak. Bellek denetleyicilerinin her biri sekiz ROP ve 256 KB L2 önbelleğe sahiptir, bu nedenle bu modifikasyondaki GP104 yongası ayrıca 64 ROP ve 2048 KB L2 önbellek seviyesi.

Mimari optimizasyonlar ve yeni bir süreç teknolojisi sayesinde GP104 GPU, bugüne kadarki en enerji verimli GPU haline geldi. Nvidia mühendisleri, çok çalışmak zorunda oldukları yeni bir sürece geçerken, önceki çözümlerin daha yüksek bir frekansta çalışmasına izin vermeyen tüm darboğazlarını dikkatlice kontrol edip optimize ederek saat hızını beklediklerinden daha fazla artırmayı başardılar. Buna göre GeForce GTX 1070, GeForce GTX 970'in referans değerinden %40 daha yüksek, çok yüksek bir frekansta da çalışır.

GeForce GTX 1070, özünde, GDDR5 belleğe sahip, yalnızca biraz daha az üretken bir GTX 1080 olduğundan, önceki bölümde tanımladığımız tüm teknolojileri kesinlikle destekler. Gelişmiş çıktı ve video işleme birimleri, Async Hesaplama desteği, Eşzamanlı Çoklu Projeksiyon teknolojisi, SLI çoklu yonga oluşturmadaki değişiklikler ve yeni Hızlı Senkronizasyon senkronizasyon türü gibi Pascal mimarisi ve desteklediği teknolojiler hakkında daha fazla ayrıntı için , GTX 1080 ile ilgili bir bölümle okumaya değer.

Yüksek performanslı GDDR5 bellek ve verimli kullanımı

Yukarıda, GeForce GTX 1080 ve GTX 1070 modellerinin dayandığı GP104 GPU'nun bellek alt sistemindeki değişiklikler hakkında yazdık - bu GPU'ya dahil edilen bellek denetleyicileri, ayrıntılı olarak açıklanan yeni GDDR5X video belleği türünü destekler. GTX 1080 incelemesi ve birkaç yıldır bildiğimiz eski GDDR5 belleği.

Eski GTX 1080'ye kıyasla daha genç GTX 1070'de bellek bant genişliğinde çok fazla kayıp olmaması için, sekiz 32-bit bellek denetleyicisinin tümü içinde etkin bırakılarak tam bir 256-bit ortak video bellek arabirimi elde edildi. Ayrıca, video kartı, 8 GHz etkin çalışma frekansıyla, piyasada mevcut olan en hızlı GDDR5 bellekle donatıldı. Tüm bunlar, eski çözüm için 320 GB / s'nin aksine 256 GB / s'lik bir bellek bant genişliği sağladı - bilgi işlem yetenekleri, dengenin korunması için yaklaşık aynı miktarda kesildi.

En yüksek teorik bant genişliği GPU performansı için önemli olsa da verimliliğine de dikkat etmeniz gerektiğini unutmayın. Oluşturma işlemi sırasında, birçok farklı darboğaz genel performansı sınırlayabilir ve mevcut tüm bellek bant genişliğinin kullanılmasını engelleyebilir. Bu darboğazları en aza indirmek için GPU'lar, veri okuma ve yazma verimliliğini artırmak için özel kayıpsız sıkıştırma kullanır.

Arabellek bilgilerinin dördüncü nesil delta sıkıştırması, GPU'nun mevcut video belleği veri yolu özelliklerini daha verimli kullanmasına olanak tanıyan Pascal mimarisinde zaten tanıtıldı. GeForce GTX 1070 ve GTX 1080'deki bellek alt sistemi, bant genişliği gereksinimlerini azaltmak için tasarlanmış, geliştirilmiş eski ve birkaç yeni kayıpsız veri sıkıştırma tekniği kullanır. Bu, belleğe yazılan veri miktarını azaltır, L2 önbellek verimliliğini artırır ve GPU üzerindeki TMU ve çerçeve arabelleği gibi farklı noktalar arasında gönderilen veri miktarını azaltır.

GPU Boost 3.0 ve hız aşırtma özellikleri

Nvidia'nın ortaklarının çoğu, GeForce GTX 1080 ve GTX 1070 tabanlı fabrikada hız aşırtmalı çözümleri zaten duyurdular. Ayrıca video kartı üreticilerinin çoğu, GPU Boost 3.0 teknolojisinin yeni işlevselliğini kullanmanıza izin veren özel hız aşırtma araçları da yaratıyor. Bu tür yardımcı programlara bir örnek, voltaj-frekans eğrisini belirlemek için otomatik bir tarayıcı içeren EVGA Precision XOC'dir - bu modda, her voltaj için bir kararlılık testi yaparak, GPU'nun sağladığı sabit bir frekans bulunur. performans artışı. Ancak bu eğri manuel olarak da değiştirilebilir.

GPU Boost teknolojisini önceki Nvidia grafik kartlarından iyi biliyoruz. GPU'larında, güç tüketimi ve ısı dağılımı konusunda henüz sınırlara ulaşmadığı modlarda GPU'nun çalışma saat hızını artırmak için tasarlanmış bu donanım özelliğini kullanıyorlar. Pascal GPU'larda, bu algoritma, ana voltaja bağlı olarak daha ince bir turbo frekans ayarı olan birkaç değişiklik geçirdi.

Daha önce temel frekans ve turbo frekansı arasındaki fark düzeltildiyse, GPU Boost 3.0'da turbo frekans ofsetlerini her voltaj için ayrı ayrı ayarlamak mümkün hale geldi. Artık turbo frekansı, ayrı voltaj değerlerinin her biri için ayarlanabilir, bu da tüm hız aşırtma özelliklerini GPU'dan tamamen sıkıştırmanıza olanak tanır. Bu olasılık hakkında ayrıntılı olarak yazdık GeForce incelemesi GTX 1080 ve bunun için EVGA Precision XOC ve MSI Afterburner yardımcı programlarını kullanabilirsiniz.

GPU Boost 3.0 destekli video kartlarının piyasaya sürülmesiyle hız aşırtma metodolojisinde bazı detaylar değiştiği için Nvidia, yeni ürünlerin hız aşırtma talimatlarında ek açıklamalar yapmak zorunda kaldı. Nihai sonucu etkileyen farklı değişken özelliklere sahip farklı hız aşırtma teknikleri vardır. Her belirli sistem için, bazı belirli yöntem, ancak temel her zaman aynıdır.

Çoğu hız aşırtmacı, GPU'yu iyi yükleyen, esnek ayarlara sahip olan ve EVGA Precision veya MSI Afterburner gibi yakındaki bir hız aşırtma ve izleme yardımcı programı penceresiyle birlikte pencereli modda çalıştırılabilen sistem kararlılığını kontrol etmek için Unigine Heaven 4.0 karşılaştırmasını kullanır. Bununla birlikte, böyle bir kontrol yalnızca ilk tahminler için yeterlidir ve hız aşırtmanın kararlılığını kesin olarak doğrulamak için, birkaç oyun uygulamasında kontrol edilmelidir, çünkü farklı oyunlar GPU'nun farklı işlevsel birimlerinde farklı yükler gerektirir: matematiksel, doku, geometrik. Heaven 4.0 kıyaslaması hız aşırtma için de uygundur, çünkü hız aşırtma ayarlarını değiştirmenin uygun olduğu döngülü bir çalışma moduna sahiptir ve hız artışını değerlendirmek için bir kıyaslama vardır.

Nvidia, yeni GeForce GTX 1080 ve GTX 1070 grafik kartlarını overclock ederken Heaven 4.0 ve EVGA Precision XOC pencerelerinin birlikte çalıştırılmasını tavsiye ediyor. İlk başta, fan hızının hemen arttırılması arzu edilir. Ve ciddi hız aşırtma için, hız değerini hemen %100'e ayarlayabilirsiniz; bu, video kartını çok gürültülü yapar, ancak sıcaklığı mümkün olan en düşük seviyeye düşürerek GPU'yu ve video kartının diğer bileşenlerini mümkün olduğunca soğutur. seviye, kısma önleme (GPU sıcaklığının belirli bir değerin üzerine çıkması nedeniyle frekanslarda azalma).

Ardından, hedef güç değerini (Güç Hedefi) de maksimuma ayarlamanız gerekir. Bu ayar, GPU'nun güç tüketimi seviyesini ve hedef sıcaklığını (GPU Temp Hedefi) artırarak GPU'ya mümkün olan maksimum güç miktarını sağlayacaktır. Bazı amaçlar için, ikinci değer Güç Hedefi değişikliğinden ayrılabilir ve ardından bu ayarlar, örneğin video çipinin daha az ısınmasını sağlamak için ayrı ayrı ayarlanabilir.

Sonraki adım GPU Saat Ofseti değerini artırmaktır - bu, çalışma sırasında turbo frekansının ne kadar yüksek olacağı anlamına gelir. Bu değer, tüm voltajlar için frekansı yükseltir ve daha iyi performans sağlar. Her zamanki gibi, hız aşırtma yaparken, GPU frekansını küçük adımlarla artırırken kararlılığı kontrol etmeniz gerekir - bir askıda kalma, sürücü veya uygulama hatası ve hatta görsel kusurlar fark etmeden önce adım başına 10 MHz'den 50 MHz'e. Bu sınıra ulaşıldığında, frekans değerini bir adım aşağı düşürmeli ve hız aşırtma sırasında kararlılığı ve performansı bir kez daha kontrol etmelisiniz.

GPU frekansına ek olarak, genellikle iyi hız aşırtma yapan GDDR5 bellekle donatılmış GeForce GTX 1070 durumunda özellikle önemli olan video bellek frekansını (Bellek Saati Ofseti) de artırabilirsiniz. Bellek frekansı durumunda işlem, sabit bir GPU frekansı bulunurken yapılanları tam olarak tekrar eder, tek fark, adımların daha büyük hale getirilebilmesidir - bir kerede temel frekansa 50-100 MHz ekleyin.

Yukarıdaki adımlara ek olarak, Aşırı Voltaj sınırını da artırabilirsiniz, çünkü GPU'nun kararsız kısımları ek güç aldığında artan voltajda genellikle daha yüksek bir GPU frekansı elde edilir. Doğru, bu değeri artırmanın olası bir dezavantajı, video çipine zarar verme ve hızlandırılmış arıza olasılığıdır, bu nedenle voltaj artışını çok dikkatli kullanmanız gerekir.

Hız aşırtma meraklıları, parametreleri farklı bir sırayla değiştirerek biraz farklı teknikler kullanır. Örneğin, bazı hız aşırtmacılar, birbirleriyle karışmamaları için kararlı bir GPU ve bellek frekansı bulma deneylerini paylaşırlar ve ardından hem video yongasının hem de bellek yongalarının birleşik hız aşırtmasını test ederler, ancak bunlar zaten bireysel bir yaklaşımın önemsiz ayrıntılarıdır. .

Forumlardaki görüşlere ve makaleler hakkındaki yorumlara bakılırsa, bazı kullanıcılar GPU frekansı ilk önce çok yüksek, genellikle turbo frekansından daha yüksek, ancak daha sonra bir artışın etkisi altındayken yeni GPU Boost 3.0 işlem algoritmasını beğenmedi. GPU sıcaklığında veya belirlenen sınırın üzerinde artan güç tüketiminde çok daha düşük değerlere düşebilir. Bu sadece güncellenmiş algoritmanın özellikleridir, dinamik olarak değişen GPU frekansının yeni davranışına alışmanız gerekir, ancak bunun herhangi bir olumsuz sonucu yoktur.

GeForce GTX 1070, Nvidia'nın Pascal ailesini temel alan yeni grafik işlemci serisinde GTX 1080'den sonraki ikinci model. Yeni 16nm FinFET üretim süreci ve mimari optimizasyonları, bu grafik kartının yeni nesil GPU Boost teknolojisi tarafından desteklenen yüksek saat hızlarına ulaşmasını sağladı. Akış işlemcileri ve doku modülleri biçimindeki işlevsel blokların sayısı azaltılmış olsa da, sayıları GTX 1070'in en karlı ve enerji açısından verimli çözüm olması için yeterli olmaya devam ediyor.

GDDR5 belleği, GTX 1080'yi ayıran yeni GDDR5X türünün aksine, bir GP104 yongasında piyasaya sürülen bir çift Nvidia ekran kartı modelinin en küçüğüne takmak, yüksek performans göstergeleri elde etmesini engellemez. İlk olarak Nvidia, GeForce GTX 1070 modelinin bellek yolunu kesmemeye karar verdi ve ikinci olarak, GDDR5X için kullanılan GDDR5X için 10 GHz'den sadece biraz daha düşük olan 8 GHz efektif frekansı ile en hızlı GDDR5 belleğini üzerine yerleştirdiler. eski model. Geliştirilmiş delta sıkıştırma algoritmaları göz önüne alındığında, önceki nesil GeForce GTX 970'in aynı modelinde GPU'nun efektif bellek bant genişliği aynı parametreden daha yüksek hale geldi.

GeForce GTX 1070, biraz önce duyurulan eski modele kıyasla çok daha düşük bir fiyata yeni özellikler ve algoritmalar için çok yüksek performans ve destek sunması bakımından iyidir. Birkaç meraklı, 55.000'e bir GTX 1080 satın alabilirse, çok daha büyük bir potansiyel alıcı çemberi, tamamen aynı yeteneklere sahip daha az üretken bir çözümün yalnızca dörtte biri için 35.000 ödeyebilecektir. GeForce GTX 1070'i piyasaya çıktığı tarihte belki de en karlı satın alma yapan şey, nispeten düşük fiyat ve yüksek performansın birleşimiydi.

Grafik hızlandırıcı GeForce GTX 1060

ParametreAnlam
çip kod adıGP106
Üretim teknolojisi16nm FinFET
transistör sayısı4,4 milyar
çekirdek alan200 mm²
MimariÇok sayıda veri türünün akış işlemesi için bir dizi ortak işlemciyle birleştirilmiş: tepe noktaları, pikseller vb.
DirectX donanım desteğiDirectX 12, Özellik Düzeyi 12_1 desteği ile
bellek veriyolu192 bit: GDDR5 belleği destekleyen altı bağımsız 32 bit bellek denetleyicisi
GPU frekansı1506 (1708) MHz
Hesaplama bloklarıIEEE 754-2008 standardında kayan nokta hesaplamaları için 1280 skaler ALU dahil 10 akışlı çoklu işlemci;
Tekstüre bloklarıDokularda FP16 ve FP32 bileşenlerini destekleyen ve tüm doku formatları için trilinear ve anizotropik filtreleme desteğine sahip 80 doku adresleme ve filtreleme birimi
Raster İşlem Birimleri (ROP'ler)Programlanabilir ve FP16 veya FP32 çerçeve tampon formatı dahil olmak üzere çeşitli kenar yumuşatma modlarını destekleyen 6 geniş ROP (48 piksel). Bloklar, bir dizi yapılandırılabilir ALU'dan oluşur ve derinlik oluşturma ve karşılaştırma, çoklu örnekleme ve harmanlamadan sorumludur.
Monitör desteğiDual Link DVI, HDMI 2.0b ve DisplayPort 1.2 (1.3/1.4 Hazır) aracılığıyla bağlanan dört adede kadar monitör için entegre destek

GeForce GTX 1060 Referans Grafik Özellikleri
ParametreAnlam
çekirdek frekansı1506 (1708) MHz
Evrensel işlemci sayısı1280
Doku bloklarının sayısı80
Karıştırma bloklarının sayısı48
Etkili bellek frekansı8000 (4×2000) MHz
Bellek türüGDDR5
bellek veriyolu192 bit
Hafıza6 GB
Bellek Bant Genişliği192 GB/sn
Bilgi işlem performansı (FP32)yaklaşık 4 teraflop
Teorik maksimum doluluk oranı72 gigapiksel/sn
Teorik doku örnekleme oranı121 gigateksel/sn
YorulmakPCI Ekspres 3.0
KonnektörlerBir Dual Link DVI, bir HDMI ve üç DisplayPort
Tipik Güç Tüketimi120W
Fazladan yemekBir adet 6 pinli konektör
Sistem kasasında kullanılan yuva sayısı2
Önerilen fiyatABD'de 249 $ (299 $ ve Rusya'da 18.990 $)

GeForce GTX 1060 ekran kartı, önceki GeForce serisinden aynı çözüme benzer bir isim aldı ve doğrudan selefi GeForce GTX 960'ın adından yalnızca neslin değiştirilen ilk basamağı ile ayrıldı. Yenilik, şirketin mevcut hattında, yeni serideki hız açısından ortalama olan daha önce piyasaya sürülen GeForce GTX 1070 çözümünden bir adım daha düşük hale geldi.

Nvidia'nın yeni ekran kartı için önerilen fiyatlar, şirket ortaklarının normal sürümleri için 249$ ve özel Founder's Edition için 299$'dır. İki eski modelle karşılaştırıldığında, bu çok uygun bir fiyat çünkü yeni GTX 1060 modeli, üst düzey anakartlardan daha düşük olmasına rağmen, daha ucuz olduğu kadar hiçbir yerde yok. Duyuru sırasında, yeni ürün kesinlikle sınıfının en iyi performans çözümü ve en iyilerinden biri haline geldi. avantajlı teklifler bu fiyat aralığında.

Nvidia'nın Pascal ailesi ekran kartının bu modeli, Radeon RX 480'i biraz daha erken piyasaya süren rakip firma AMD'nin yeni kararına karşı çıkmak için çıktı. hala fiyat açısından oldukça farklıdırlar. GeForce GTX 1060 daha pahalıdır (199-229$'a karşı 249-299$), ancak aynı zamanda rakibinden açıkça daha hızlıdır.

GP106 grafik işlemcisinin 192 bit bellek veri yolu vardır, bu nedenle böyle bir veri yoluna sahip bir video kartına takılı bellek miktarı 3 veya 6 GB olabilir. Modern koşullarda daha küçük bir değer açıkçası yeterli değildir ve birçok oyun projesi, Full HD çözünürlükte bile olsa, video belleği eksikliğiyle karşılaşacak ve bu da işlemenin düzgünlüğünü ciddi şekilde etkileyecektir. Yeni çözümün yüksek ayarlarda maksimum performans göstermesini sağlamak için GeForce GTX 1060 modeli, herhangi bir 3D uygulamayı herhangi bir kalite ayarıyla çalıştırmak için yeterli olan 6 GB video belleği ile donatılmıştır. Üstelik bugün 6 ve 8 GB arasında hiçbir fark yok ve böyle bir çözüm biraz para kazandıracak.

Yeni ürünün tipik güç tüketimi değeri 120 W olup, GTX 1070'in değerinden %20 daha düşüktür ve çok daha düşük performans ve yeteneklere sahip olan önceki nesil GeForce GTX 960 grafik kartının güç tüketimine eşittir. Referans kartı, görüntü çıkış cihazlarını bağlamak için olağan konektör setine sahiptir: bir Dual-Link DVI, bir HDMI ve üç DisplayPort. Üstelik GTX 1080 modelinin incelemesinde hakkında yazdığımız HDMI ve DisplayPort'un yeni sürümleri için destek vardı.

GeForce GTX 1060 referans kartının uzunluğu 9,8 inçtir (25 cm) ve eski seçeneklerden farklı olarak, GeForce GTX 1060'ın SLI çoklu çip oluşturma yapılandırmasını desteklemediğini ve Bunun için özel konektör. Kart, eski modellere göre daha az güç tükettiğinden, ek güç için karta bir adet 6 pinli PCI-E harici güç konektörü takıldı.

GeForce GTX 1060 ekran kartları, duyuru gününden bu yana şirketin ortaklarından Asus, EVGA, Gainward, Gigabyte, Innovision 3D, MSI, Palit, Zotac ürünleri şeklinde piyasaya çıktı. Nvidia'nın kendisi tarafından üretilen GeForce GTX 1060 Founder's Edition'ın özel bir sürümü sınırlı sayıda piyasaya sürülecek ve 299 $ fiyatla yalnızca Nvidia web sitesinde satılacak ve Rusya'da resmi olarak sunulmayacak. Founder's Edition, alüminyum kasa da dahil olmak üzere yüksek kaliteli malzemelerden ve bileşenlerden yapılmış olması ve verimli bir soğutma sisteminin yanı sıra düşük dirençli güç devreleri ve özel olarak tasarlanmış voltaj regülatörleri kullanması ile ayırt edilir.

Mimari değişiklikler

GeForce GTX 1060 video kartı, üzerinde GeForce GTX 1080 ve GTX 1070 modellerinin tanımlandığı GP104 yongası biçiminde Pascal mimarisinin ilk doğuşundan işlevsel olarak farklı olmayan tamamen yeni bir grafik işlemci modeli GP106'ya dayanmaktadır. Bu mimari Maxwell'de geliştirilmiş çözümlere dayanmaktadır, ancak daha önce ayrıntılı olarak yazdığımız bazı işlevsel farklılıkları da vardır.

GP106 video çipi, tasarımında Maxwell mimarisinin üst düzey Pascal çipi ve benzer çözümlerine benzer ve modern GPU'ların tasarımı hakkında ayrıntılı bilgiyi önceki Nvidia çözümlerine yönelik incelemelerimizde bulabilirsiniz. Önceki GPU'lar gibi, yeni mimarinin yongaları farklı bir Grafik İşleme Kümesi (GPC), Akış Çok İşlemcisi (SM) ve bellek denetleyicileri yapılandırmasına sahiptir:

GP106 grafik işlemcisi, 10 akışlı çoklu işlemciden (Streaming Multiprocessor - SM), yani GP104'ün tam olarak yarısından oluşan iki GPC kümesi içerir. Eski GPU'da olduğu gibi, çoklu işlemcilerin her biri 128 çekirdek, 8 TMU doku birimi, her biri 256 KB içerir kayıt hafızası, 96 KB paylaşılan bellek ve 48 KB L1 önbellek. Sonuç olarak, GeForce GTX 1060, GTX 1080'nin yarısı olan toplam 1.280 işlem çekirdeği ve 80 doku birimi içerir.

Ancak GeForce GTX 1060'ın bellek alt sistemi, üst çözüme göre yarıya inmedi, altı adet 32 ​​bit bellek denetleyicisi içeriyor ve son 192 bit bellek veri yolunu veriyor. GeForce GTX 1060 için 8 GHz'e eşit etkin bir GDDR5 video belleği frekansı ile bant genişliği 192 GB / s'ye ulaşıyor, bu da özellikle Pascal'da kullanımının yüksek verimliliği göz önüne alındığında, bu fiyat segmentinde bir çözüm için oldukça iyi. Bellek denetleyicilerinin her birinde sekiz ROP ve onunla ilişkili 256 KB L2 önbellek bulunur, yani toplamda tam versiyon GP106 GPU, 48 ROP ve 1536 KB L2 önbellek içerir.

Bellek bant genişliği gereksinimlerini azaltmak ve mevcut Pascal mimarisini daha verimli kullanmak için, veriyi arabelleklerde sıkıştırabilen, verimlilik ve performans kazanımları elde eden kayıpsız çip üzerinde veri sıkıştırması daha da geliştirildi. Özellikle, yeni ailenin yongalarına 4:1 ve 8:1 oranlarına sahip yeni delta sıkıştırma yöntemleri eklenerek, Maxwell ailesinin önceki çözümlerine kıyasla bellek bant genişliğinin verimliliğinde %20 ek bir artış sağlanmıştır.

Yeni GPU'nun temel frekansı 1506 MHz'dir - frekans prensipte bu işaretin altına düşmemelidir. Tipik Boost Saati, GeForce GTX 1060 grafik yongasının çok çeşitli oyunlarda ve 3D uygulamalarda çalıştığı gerçek frekansın ortalaması olan 1708 MHz'de çok daha yüksektir. Gerçek Boost frekansı oyuna ve testin yapıldığı koşullara bağlıdır.

Pascal ailesinin diğer çözümleri gibi GeForce GTX 1060 modeli de sadece yüksek saat frekansında çalışmakla kalmıyor, yüksek performans sağlıyor, aynı zamanda hız aşırtma için de iyi bir marjı var. İlk deneyler, 2 GHz düzeyindeki frekanslara ulaşma olasılığını göstermektedir. Şirketin ortaklarının GTX 1060 ekran kartının fabrikada hız aşırtmalı versiyonlarını da hazırlaması şaşırtıcı değil.

Bu nedenle, yeni mimarideki ana değişiklik, GP106'nın üretiminde kullanımı, nispeten düşük bir 200 mm² alanını korurken çipin karmaşıklığını önemli ölçüde artırmayı mümkün kılan 16 nm FinFET süreciydi, dolayısıyla bu Pascal mimarisi yongası, 28 nm işlem teknolojisi kullanılarak üretilen benzer konumlandırmaya sahip bir Maxwell yongasına kıyasla önemli ölçüde daha fazla sayıda yürütme birimine sahiptir.

227 mm² alana sahip GM206 (GTX 960), 3 milyar transistöre ve 1024 ALU'ya, 64 TMU'ya, 32 ROP'a ve 128 bit veri yoluna sahipse, yeni GPU'da 4,4 milyar transistör, 1280 ALU bulunuyordu. 192-bit veri yolu ile 200 mm², 80 TMU ve 48 ROP. Ayrıca, neredeyse bir buçuk kat daha yüksek frekansta: 1506 (1708) ve 1126 (1178) MHz. Ve bu 120 watt'lık aynı güç tüketimi ile! Sonuç olarak, GP106 GPU, GP104 ile birlikte en enerji verimli GPU'lardan biri haline geldi.

Yeni Nvidia Teknolojileri

GeForce GTX 1060 ve Pascal ailesinin diğer çözümleri ile desteklenen şirketin en ilginç teknolojilerinden biri de teknoloji. Nvidia Eşzamanlı Çoklu Projeksiyon. Bu teknoloji hakkında GeForce GTX 1080 incelemesinde zaten yazdık, oluşturmayı optimize etmek için birkaç yeni teknik kullanmanıza izin veriyor. Özellikle - aynı anda iki göz için bir VR görüntüsünü aynı anda yansıtmak, GPU'yu sanal gerçeklikte kullanma verimliliğini önemli ölçüde artırmak.

SMP'yi desteklemek için Pascal ailesinin tüm GPU'ları, rasterleştiriciden önce geometrik boru hattının sonunda PolyMorph Motorunda bulunan özel bir motora sahiptir. Bununla, GPU aynı anda bir noktadan birkaç projeksiyona geometrik bir ilkel yansıtabilirken, bu projeksiyonlar stereo olabilir (yani, aynı anda 16 veya 32 projeksiyona kadar desteklenir). Bu yetenek, Pascal GPU'ların VR işleme için kavisli bir yüzeyi doğru bir şekilde yeniden oluşturmasına ve ayrıca çoklu monitör sistemlerinde doğru şekilde görüntülenmesine olanak tanır.

Simultaneous Multi-Projection teknolojisinin halihazırda popüler oyun motorlarına (Unreal Engine ve Unity) ve oyunlara entegre edilmiş olması önemlidir ve bugüne kadar, bu tür iyi bilinenler de dahil olmak üzere, geliştirilmekte olan 30'dan fazla oyun için teknoloji desteği duyuruldu. Unreal Tournament , Poolnation VR, Everest VR, Obduction, Adr1ft ve Raw Data gibi projeler. İlginç bir şekilde, Unreal Tournament bir VR oyunu olmasa da daha iyi görseller ve performans elde etmek için SMP kullanıyor.

Uzun zamandır beklenen başka bir teknoloji, oyunlarda ekran görüntüleri oluşturmak için güçlü bir araçtır. Nvidia Ansel. Bu araç, daha önce bulunmayan özelliklere sahip oyunlardan alışılmadık ve çok yüksek kaliteli ekran görüntüleri oluşturmanıza, bunları çok yüksek çözünürlükte kaydetmenize ve çeşitli efektlerle tamamlamanıza ve yarattıklarınızı paylaşmanıza olanak tanır. Ansel, kelimenin tam anlamıyla sanatçının istediği şekilde bir ekran görüntüsü oluşturmanıza, sahnenin herhangi bir yerinde herhangi bir parametreye sahip bir kamera kurmanıza, görüntüye güçlü post filtreler uygulamanıza ve hatta bir ortamda izlemek için 360 derecelik bir çekim yapmanıza olanak tanır. sanal gerçeklik kaskı.

Nvidia standartlaştırılmış entegrasyona sahiptir Kullanıcı arayüzü Ansel'i oyunlara dahil edin ve bunu yapmak çok kolay - sadece birkaç satır kod ekleyin. Artık bu özelliğin oyunlarda görünmesini beklemek gerekmiyor, Ansel'in yeteneklerini şu anda Mirror's Edge: Catalyst'te değerlendirebilirsiniz ve biraz sonra Witcher 3: Wild Hunt'ta kullanılabilir hale gelecektir. Buna ek olarak, Fortnite, Paragon ve Unreal Tournament, Obduction, The Witness, Lawbreakers, Tom Clancy's The Division, No Man's Sky gibi oyunlar da dahil olmak üzere Ansel'in etkin olduğu birçok oyun projesi geliştirilmektedir.

Yeni GeForce GTX 1060 GPU da araç setini destekliyor Nvidia VRWorks geliştiricilerin sanal gerçeklik için etkileyici projeler oluşturmasına yardımcı olur. Bu paket, GPU ışın izleme kullanarak sahne nesnelerinden ses dalgalarının yansımalarının çok hassas bir şekilde hesaplanmasını sağlayan VRWorks Audio dahil olmak üzere geliştiriciler için birçok yardımcı program ve araç içerir. Paket ayrıca, sahnedeki nesnelerin fiziksel olarak doğru davranışını sağlamak için VR ve PhysX fizik efektlerine entegrasyon içerir.

VRWorks'ten yararlanabileceğiniz en heyecan verici VR oyunlarından biri, Nvidia'nın kendi VR oyunu olan VR Funhouse'dur ve Valve'in Steam hizmetinde ücretsiz olarak mevcuttur. Bu oyun Unreal Engine 4 (Epic Games) tarafından desteklenmektedir ve HTC Vive VR kulaklıkları ile birlikte GeForce GTX 1080, 1070 ve 1060 grafik kartlarında çalışır. Biraz, kaynak Bu oyunun bir kısmı herkese açık olacak ve diğer geliştiricilerin VR cazibe merkezlerinde hazır fikirleri ve kodları kullanmalarına izin verecek. Bunun için sözümüze güvenin, bu sanal gerçekliğin olanaklarının en etkileyici gösterilerinden biridir.

SMP ve VRWorks teknolojileri sayesinde GeForce GTX 1060 GPU'nun VR uygulamalarında kullanılması, giriş seviyesi sanal gerçeklik için oldukça yeterli bir performans sağlamakta ve söz konusu GPU, SteamVR dahil olmak üzere gerekli minimum donanım seviyesini karşılamaktadır. resmi VR desteğine sahip sistemlerde kullanım için en başarılı satın almalardan biri.

GeForce GTX 1060 modeli, eski değişikliklerin temeli haline gelen GP104 grafik işlemcisinden hiçbir şekilde daha düşük olmayan GP106 yongasına dayandığından, yukarıda açıklanan tüm teknolojileri kesinlikle destekler.

GeForce GTX 1060, Nvidia'nın Pascal ailesini temel alan yeni grafik işlemci serisindeki üçüncü modeldir. Yeni 16nm FinFET işlem teknolojisi ve mimari optimizasyonları, tüm yeni grafik kartlarının yüksek saat hızlarına ulaşmasına ve önceki nesil video çiplerine kıyasla akış işlemcileri, doku modülleri ve diğerleri biçiminde GPU'ya daha işlevsel bloklar yerleştirmesine olanak sağladı. Bu nedenle GTX 1060, kendi sınıfında ve genel olarak en karlı ve enerji açısından verimli çözüm haline geldi.

GeForce GTX 1060'ın, GP104 tabanlı eski çözümlere kıyasla çok daha düşük bir fiyata yeni özellikler ve algoritmalar için yeterince yüksek performans ve destek sunması özellikle önemlidir. Yeni modelde kullanılan GP106 grafik yongası, sınıfının en iyisi performans ve güç verimliliği sunar. GeForce GTX 1060, yüksek ve maksimum düzeyde tüm modern oyunlar için amaca yönelik olarak üretilmiştir ve mükemmeldir. grafik ayarları 1920x1080 çözünürlükte ve hatta çeşitli yöntemlerle (FXAA, MFAA veya MSAA) etkinleştirilen tam ekran kenar yumuşatma ile.

Ultra yüksek çözünürlüklü ekranlarla daha da fazla performans isteyenler için Nvidia, performans ve güç verimliliği açısından da oldukça iyi olan birinci sınıf GeForce GTX 1070 ve GTX 1080 grafik kartlarına sahip. Yine de, düşük fiyat ve yeterli performansın birleşimi, GeForce GTX 1060'ı eski çözümlerin arka planından oldukça olumlu bir şekilde ayırıyor. Rakip Radeon RX 480 ile karşılaştırıldığında, Nvidia'nın çözümü daha az karmaşıklık ve GPU ayak izi ile biraz daha hızlı ve önemli ölçüde daha iyi güç verimliliğine sahip. Doğru, biraz daha pahalı satılıyor, bu nedenle her video kartının kendi nişi var.