Kartat video familjare NVIDIA GeForce sfond informacion. Familjet Kartat Video Nvidia Geforce Sfondi Informacioni Ndryshimet në SLI Rendering shumëfish

GPU Boost 2.0

Me kartën video nvidia GeForce GTX. 680 Ne kemi marrë një tipar të ri të rëndësishëm: rritja e GPU. Dhe Nvidia Geforce GTX Titan shkoi një hap më tej duke zgjeruar këtë veçori në versionin GPU Boost 2.0. Versioni i parë i GPU Boost 1.0 u fokusua në konsumin maksimal të energjisë të arritur në lojërat më të kërkuara moderne. Në të njëjtën kohë, temperatura e GPU nuk luajti një rol të veçantë, përveç nëse do të ishte afër pragut kritik. Frekuenca maksimale e orës është përcaktuar në bazë të tensionit relativ. Disavantazhi ishte mjaft i qartë: GPU Boost 1.0 nuk mund të parandalonte situatat kur edhe me tension jo kritik, temperatura u rrit tepër.

NVIDIA GEFORCE GTX TITAN - GPU-Boost 2.0

GeForce GTX Titan ka vlerësuar tashmë dy parametra: tension dhe temperaturë. Kjo është, tensioni relativ (Vref) është përcaktuar tashmë në bazë të dy të dhënave të parametrave. Natyrisht, varësia nga instancat individuale të GPU do të vazhdojë, pasi përhapja në prodhimin e patate të skuqura ekziston, kështu që çdo kartë video do të ndryshojë nga ndonjë tjetër. Por NVIDIA tregon se temperatura teknike shtesë lejohet të japë një mesatare prej 3-7 për qind rritje më të lartë overclocking. Teknologjia GPU Boost 2.0 mund të transferohet teorikisht në kartat e vjetra video, por nuk ka gjasa të ndodhë.

NVIDIA GEFORCE GTX TITAN - GPU-Boost 2.0

Më lejoni të konsideroj rritjen e GPU 2.0 në më shumë detaje. Shërbimet e ngjashme me mjetin e saktësisë EVGA ose MSI pas dore janë mbështetur tashmë nga GPU Boost 2.0. Ne përdorëm EVGA Precision Tool Wipity në versionin 4.0.

NVIDIA GEFORCE GTX TITAN - GPU-Boost 2.0

GPU Boost 2.0 merr parasysh temperaturën, dhe në temperatura të ulëta, teknologjia mund të rrisë më shumë produktivitetin. Temperaturat e synuara (ttarget) janë vendosur në 80 ° C.

NVIDIA GEFORCE GTX TITAN - GPU-Boost 2.0

Teknologjia GPU Boost 2.0 përmban të gjitha funksionet e njohura për ne në gjeneratën e parë të teknologjisë, por në të njëjtën kohë gjithashtu bën të mundur krijimin e tensionit më të lartë, prandaj, dhe frekuencat më të larta të orës. Për overclockers, është e mundur për të ndryshuar cilësimet. Ju mund të aktivizoni overvoltage GPU, por duhet të mbahet mend për një reduktim të mundshëm në jetën e kartës video.

NVIDIA GEFORCE GTX TITAN - GPU-Boost 2.0

Overclockers mund të ngrejë Vref dhe Vmax (overvoltaging). Kjo donte shumë përdorues në GK104, por NVIDIA nuk i besonte një mundësi të tillë për asnjë përdorues apo prodhues. Dhe karta video e klasifikuar e Evga GTX 680 testuar nga ne është vetëm një shembull i shkëlqyer. Kjo kartë video ka një modul të veçantë Evga Evbot që u ofron kontrollit të kontrollit mbi tensione. Por Nvidia kërkoi urgjentisht që Evga të heqë pajisje shtesë nga kartat e tyre video. Në rastin e GPU Boost 2.0 dhe overvoltaging nvidia, vetë bëri një hap në këtë drejtim. Pra, prodhuesit e kartave video mund të prodhojnë disa modele GeForce GTX Titan, të tilla si versionet standarde dhe opsionet me overclocking fabrikë. Aktivizimi i overvolimit kryhet përmes kaloni VBIOS (që është, në mënyrë eksplicite për përdoruesit në mënyrë që të jetë në dijeni të pasojave të mundshme).

NVIDIA GEFORCE GTX 780 VIDEO KARTELA RISHIKIMI | Përvojën e GeForce dhe shadowplay

Përvojën e GeForce.

Si entuziastë kompjuteri, ne e vlerësojmë kombinimin e cilësimeve të ndryshme që ndikojnë në performancën dhe cilësinë e lojrave. Mënyra më e lehtë për të kaluar një bandë parash kartë të re video Dhe vendosni të gjitha cilësimet e grafikut në maksimum. Por kur një parametër rezulton të jetë shumë e rëndë për kartën dhe duhet të reduktohet ose të çaktivizohet, mbetet një ndjenjë e pakëndshme dhe vetëdija se loja mund të funksionojë shumë më mirë.

Megjithatë, vendosni cilësimet optimale nuk është aq e lehtë. Disa parametra japin efekte më të mira vizuale se të tjerët, ndërsa shkalla e ndikimit në performancën mund të ndryshojë shumë. Programi i përvojës GeForce është NVIDIA përpjekje për të lehtësuar përzgjedhjen e cilësimeve të lojës duke krahasuar CPU tuaj, GPU dhe lejet me bazën e të dhënave të konfigurimit. Pjesa e dytë e shërbimeve ndihmon në përcaktimin nëse nevojiten përditësimet e shoferit.

Ndoshta, entuziastët do të vazhdojnë të zgjedhin cilësimet e tyre dhe do të perceptojnë negativisht program shtesë. Megjithatë, shumica e lojtarëve që dëshirojnë të instalojnë lojën dhe menjëherë të fillojnë gameplay pa kontrolluar shoferët dhe kërkimin për mjedise të ndryshme, natyrisht, kjo mundësi do të riparohet. Sidoqoftë, përvoja e GeForce nga Nvidia ndihmon njerëzit të gëzojnë lojën sa më shumë që të jetë e mundur, dhe për këtë arsye është një dobi e dobishme për lojrat e PC.

Përvoja e GeForce ka identifikuar të gjitha nëntë lojëra të instaluara në sistemin tonë të testimit. Natyrisht, ata nuk shpëtuan cilësimet e parazgjedhura kur kemi aplikuar cilësime të caktuara në interes të testimit. Por ende është interesante se si përvoja e Geforcës do të ndryshonte opsionet që kemi zgjedhur.

Për sulmuesin e varrit, shërbimi i përvojës së GeForce donte të çaktivizonte teknologjinë e tressfx, edhe pse NVIDIA GEFORCE GTX 780 Me funksionin e aktivizuar mesatarisht, u treguan 40 korniza për sekondë. Për disa arsye, programi nuk mund të përcaktojë konfigurimin Far Cry 3. Megjithëse cilësimet e propozuara nga ajo doli të jetë mjaft e lartë. Për arsye të panjohura për Skyrim, utility donte të çaktivizonte FXAA.

Është mirë të marrësh një sërë screenshots për çdo lojë me një përshkrim të ndikimit të një vendosjeje specifike në cilësinë e imazhit. Nga nëntë shembuj të shembujve të përvojës së Geforce iu afruan optimale, sipas mendimit tonë, cilësimet. Megjithatë, shërbimi dallon gjithashtu nga paragjykimi, patronizimi i karakteristikave të funksioneve NVIDIA, të tilla si Physx (të cilën programi ka ekspozuar në një nivel të lartë në kufijtë 2) dhe parandalimin e përfshirjes së funksioneve AMD (duke përfshirë TRESSFX në Tomb Raider). Fxaa paaftësi në skyrim nuk ka kuptim fare, pasi ndeshja mesatarisht jep 100 fps. Është e mundur që entuziastët të duan të instalojnë përvojën e GeForce pas dorëzimit të sistemit të mburojës NVIDIA do të fillojë, pasi që funksioni i lojës streaming duket të zbatohet përmes aplikacionit NVIDIA.

Shadowplay: Gjithmonë regjistrues aktiv për lojëra

Dashuruesit e WoW shpesh shkruajnë bastisjet e tyre, por kjo kërkon një sistem mjaft të fuqishëm, fraget dhe shumë hapësirë \u200b\u200bnë disk.

Kohët e fundit, Nvidia njoftoi një funksion të ri Shadowplay, i cili mund të lehtësojë ndjeshëm procesin e regjistrimit.

Kur shadowplay është aktivizuar, përdor një dekoder fiks NVenc ndërtuar në GPU Kepler, i cili automatikisht regjistron 20 minutat e fundit të gameplay. Ose ju mund të filloni manualisht dhe të ndaloni shadowplay. Kështu, teknologjia zëvendëson zgjidhjet e softuerit si Fraps, të cilat japin një ngarkesë më të lartë në procesorin qendror.

Për referencë: NVenc punon vetëm me kodimin H.264 në një rezolutë në 4096x4096 piksele. Shadowplay nuk është ende në dispozicion në treg, por NVIDIA deklaron se deri në kohën e paraqitjes së tij këtë verë programi do të jetë në gjendje të regjistrojë video në 1080p me frekuencë kornizë deri në 30 fps. Ne do të donim të shihnim një leje më të lartë, sepse më parë deklaroi se encoder është potencialisht i aftë ta mbajë atë në nivelin e harduerit.

NVIDIA GEFORCE GTX 780 VIDEO KARTELA RISHIKIMI | GPU Boost 2.0 dhe problemet e mundshme me përshpejtimin

GPU Boost 2.0

Në shqyrtim GeForce GTX Titan. Ne nuk kemi punuar testimin e plotë të gjeneratës së dytë Nvidia GPU Boost, por tani ajo mori NVIDIA GEFORCE GTX 780 . Këtu është një përshkrim i vogël i kësaj teknologjie:

GPU Boost është mekanizmi NVIDIA që ndryshon performancën e kartave video në varësi të llojit të detyrës së përpunuar. Siç e dini, lojrat kanë kërkesa të ndryshme për burimet e GPU. Historikisht, frekuenca duhet të personalizohet duke marrë parasysh skenarin më të keq. Por kur përpunon detyrat e "mushkërive", GPU punoi të tretur. GPU Rritja e parametrave të ndryshëm dhe rrit ose ul frekuencat në varësi të nevojave të aplikacionit dhe situatës aktuale.

Zbatimi i parë i rritjes së GPU ka punuar nën një prag të caktuar të energjisë (170 W në rast GeForce GTX 680.). Megjithatë, inxhinierët e kompanisë zbuluan se ata mund të tejkalojnë në mënyrë të sigurtë këtë nivel nëse temperatura e procesorit grafik është mjaft e ulët. Kështu, produktiviteti mund të optimizohet edhe më shumë.

Në praktikë, GPU Boost 2.0 ndryshon vetëm nga fakti se tani NVIDIA përshpejton frekuencën, bazuar në një tregues të konsumit ekstrem të energjisë, por në një temperaturë të caktuar, që është 80 gradë Celsius. Kjo do të thotë se frekuenca më e lartë dhe vlerat e tensionit do të përdoren derisa ngrohja e çipit të jetë deri në 80 gradë. Mos harroni se temperatura kryesisht varet nga profili dhe cilësimet e tifozëve: aq më e lartë është shpejtësia e saj, më e ulët e temperaturës dhe, prandaj, mbi rritjen e GPU (dhe niveli i zhurmës, për fat të keq). Teknologjia ende bën një vlerësim të situatës një herë në 100 ms, kështu që nvidia është ende e gjatë për të punuar në versionet e ardhshme.

Cilësimet e varura nga temperatura komplikojnë procesin e testimit krahasuar me versionin e parë të rritjes së GPU. Të gjitha ato që rriten ose ul temperaturën e GK110, ndryshon frekuencën e çipit. Rrjedhimisht, është mjaft e vështirë për të arritur rezultate të qëndrueshme midis drejtimeve. Në kushtet laboratorike, është e mundur të shpresojmë vetëm për temperaturë të qëndrueshme të ambientit.

Përveç shkrimit të mësipërm, vlen të përmendet se mund të rrisni vlerën e temperaturës së kufi. Për shembull, nëse dëshironi NVIDIA GEFORCE GTX 780 Ulur frekuenca dhe tension në 85 ose 90 gradë Celsius, mund të konfigurohet në parametra.

A doni GK110 sa më shumë të jetë e mundur nga kufiri i temperaturës që keni zgjedhur? Kurbë e tifozëve NVIDIA GEFORCE GTX 780 Plotësisht të rregullueshme, duke ju lejuar të konfiguroni ciklin e punës sipas vlerave të temperaturës.

Problemet e mundshme me përshpejtimin

Gjatë njohjes sonë me të GeForce GTX Titan. Përfaqësuesit e kompanisë na treguan një ndërmarrje të brendshme të aftë për të lexuar gjendjen e sensorëve të ndryshëm: kështu që thjeshton procesin e diagnostikimit të sjelljes së kartës jo standarde. Nëse kur overclocking temperaturën e GK110 do të rritet shumë e lartë, edhe me trottling ky informacion do të regjistrohet në log.

Tani kjo veçori Kompania zbaton përmes aplikacionit të saktësisë X, e cila fillon algoritmin paralajmërues parandalues \u200b\u200b"arsyet" nëse veprimet që ndërhyjnë me vazhdimin efektiv të saj ndodhën gjatë përshpejtimit. Ky është një funksion i mrekullueshëm, sepse nuk keni më nevojë për të ndërtuar supozime për "vendet e ngushta" të mundshme. Ekziston edhe një tregues i kufirit të OV Max, i cili do të dijë nëse keni arritur kulmin absolut të tensionit të GPU. Në këtë rast, ekziston rreziku i djegies së hartës. Ju mund ta shihni atë si një ofertë për të ulur parametrat overclocking.

NVIDIA GEFORCE GTX 780 VIDEO KARTELA RISHIKIMI | Booth dhe pikë referimi


Konfigurimi i qëndrimit test
CPU Intel Core i7-3770k (Ura Ivy) 3.5 GHz @ 4.0 GHz (40 * 100 MHz), LGA 1155, 8 MB cache të përgjithshme L3, Hyper-Threading On, Power-kursime në.
Motherboard Gigabyte z77x-ud5h (LGA 1155), chipset z77 Express, bios f15Q
Ram G.skill 16 GB (4 x 4 GB) DDR3-1600, F3-12800CL9Q2-32GBZL @ 9-9-9-24 nga 1.5 v
Pajisje ruajtëse Krijo M4 SSD 256 GB SATA 6 GB / s
Kartë video NVIDIA GEFORCE GTX 780 3 GB

AMD Radeon. HD 7990 6 GB

AMD Radeon HD 7970 GHz Edition 3 GB

NVIDIA GEFORCE GTX 580 1.5 GB

NVIDIA GEFORCE GTX 680 2 GB

Nvidia geforce gtx titan 6 gb

NVIDIA GEFORCE GTX 690 4 GB

Furnizim me energji elektrike Master Cooler UCP-1000 W
Software System dhe shoferët
OS. Windows 8 Professional 64-bit
Direksi DirectX 11.
Grafik. Shoferët AMD CATALYST 13.5 (BETA 2)
Nvidia GeForce Release 320.00
Nvidia GeForce Release 320.18 (për GEFORCE GTX 780)

Ne marrim vlerën e saktë të frekuencës së ndryshimit të kornizës

Lexuesit e vëzhgimit do të vërejnë se treguesit në faqet në vijim janë më modeste se në shqyrtim AMD Radeon HD 7990 Dhe ka një arsye për të. Më parë, ne përfaqësuam normën sintetike dhe të vërtetë kornizë, dhe më pas treguam luhatje të kohës midis kornizave së bashku me korniza të humbura dhe të shkurtra. Fakti është se një metodë e tillë nuk pasqyron ndjesitë reale nga puna e kartës video, dhe nga ana jonë do të jetë e padrejtë për të dënuar AMD, bazuar në normat sintetike të vonesës kohore midis kornizave.

Kjo është arsyeja pse së bashku me luhatjet e frekuencës kornizë, tani japim më shumë tregues të kornizës praktike në dinamikën. Rezultatet nuk janë aq të tepërta, por në të njëjtën kohë ata janë shumë elokuent në lojëra ku AMD ka vështirësi.

Testet dhe Settings
Fushebeteja 3. Cilësi grafike - ultra, v-sync, 2560x1440, DirectX 11, duke shkuar në gjueti, 90, fcat
Far Cry 3. Cilësia Grafike - Ultra, DirectX 11, V-Sync Off, 2560x1440, vrapim në rrugën tuaj, 50 sekonda, fcat
Borderlands 2. Cilësia Grafike - më e larta, Physx ulët., 16x filtrim anisotropik, 2560x1440, duke vrapuar në rrugën tuaj, fcat
Hitman: Absolution Cilësia e Grafikut - Ultra, MSAA Off, 2560x1440, Benchmark i integruar, FCAT
Scrolls Plaku V: Skyrim Cilësi grafike - Ultra, FXAA aktivizuar, 2560x1440, vrapim në rrugën tuaj, 25 sekonda, fcat
3Dmark. Fire Strike Benchmark.
BIOSHOCK INFINITE. Grafikë Cilësia - Ultra, DirectX 11, Diffuzimi në terren, 2560x1440, Benchmark i integruar, FCAT
Crysis 3. Cilësi grafike - shumë e lartë, MSAA: ulët (2x), tekste me rezolucion të lartë, 2560x1440, duke ecur në rrugën tuaj, 60 sekonda, fcat
Sulmuesja e varrit. Cilësi grafike - Ultimate, FXAA në, 16x filtrim anisotropik, flokët tressfx, 2560x1440, vrapim në rrugën tuaj, 45 sekonda, fcat
Luxark 2.0. 64-bit binar, version 2.0, skenë Sala
SISOFTWARE SANDRA 2013 Professional Sandra Tech Mbështetje (Inxhinier) 2013.Sp1, Kriptografi, Performanca e Analizës Financiare


Përmbajtje
ParametërVlerë
Emri i kodit CHIP.GP104.
Teknologjia e Prodhimit16 nm finfet.
Numri i transistorëve7.2 miliardë
Bërthama katrore314 mm²
Arkitekturë
Mbështetja e harduerit DirectX
Autobusi i kujtesës.
1607 (1733) MHz
Blloqe informatike20 multirocesors streaming që përbëjnë 2560 alus skalar për pikëpresje lundrues brenda kuadrit të standardit IEEE 754-2008;
Blloqe texturing160 Adresimi i strukturës dhe blloqeve të filtrimit me mbështetjen e komponentit FP16 dhe FP32 në tekstet dhe mbështetjen për filtrimin e trilinear dhe anisotropik për të gjitha formatet tekstuale
Mbështetja e monitoruar
GeForce GTX 1080 specifikimet e kartës së referencës
ParametërVlerë
Shpeshtësia e bërthamës1607 (1733) MHz
2560
Numri i blloqeve tekstuale160
Numri i blloqeve të gabuara64
Frekuenca efektive e kujtesës10,000 (4 × 2500) MHz
Lloji i kujtesësGddr5x.
Autobusi i kujtesës.256-bit
Kujtesë8 gb
320 GB / s
rreth 9 Teraflops
103 gigapixels / me
257 GABATEXELS / me
GomëPCI Express 3.0
Lidhëse
Konsumim i energjisederi në 180 W.
Ushqim shtesëNjë lidhje 8 pin
2
Çmimi i rekomanduar$ 599-699 (SHBA), 54990 rubla (Rusi)

Modeli i ri i GeForce GTX 1080 ka qenë logjik për zgjidhjen e parë të serisë së re të GeForce - ajo ndryshon nga paraardhësi i tij i drejtpërdrejtë vetëm një brez i modifikuar. Risi nuk thjesht zëvendëson zgjidhjet më të mira në linjën aktuale të kompanisë, por për disa kohë u bë anije e serisë së re deri në Titan X lëshuar në GPU edhe më të madhe. Modeli i shpallur tashmë GeForce GTX 1070 është gjithashtu më poshtë në hierarki, bazuar në versionin e shkurorëzuar të çipit GP104, të cilin ne do të shqyrtojmë më poshtë.

Çmimet e rekomanduara për një festë të re video Nvidia janë $ 599 dhe $ 699 për versionet konvencionale dhe botimet e veçanta të edicionit të themeluesve (shih më poshtë), respektivisht, dhe kjo është një dënim mjaft i mirë, duke marrë parasysh faktin se GTX 1080 është përpara Jo vetëm GTX 980 TI, por edhe Titan X. Sot, risi është më e mira në performancën nga zgjidhja në tregun e kartave video me një çip pa ndonjë pyetje, dhe në të njëjtën kohë kushton më të lirë se kartat më produktive të videove e gjeneratës së mëparshme. Ndërsa një konkurrent nga AMD nga GeForce GTX 1080 është në të vërtetë, prandaj, NVIDIA ishte në gjendje të krijonte një çmim të tillë që i përshtatet atyre.

Kartela e videove në konsideratë bazohet në CHIP GP104, e cila ka një autobus memorie 256-bit, por një lloj i ri i kujtesës GDDR5X punon në një frekuencë shumë të lartë efikase prej 10 GHz, e cila jep bandwidth të lartë të pikut në 320 GB / C - e cila është pothuajse në nivelin GTX 980 TI nga autobusi 384. Sasia e kujtesës montuar në një kartë video me një autobus të tillë mund të jetë e barabartë me 4 ose 8 GB, por do të ishte budallallëk për një zgjidhje të tillë të fuqishme në kushtet moderne, kështu që GTX 1080 plotësisht të marrë 8 GB memorie, dhe këtë vëllim është e mjaftueshme për të filluar çdo aplikacion 3D me ndonjë cilësim të cilësisë për disa vite përpara.

Bordi i GeForce GTX 1080 i shtypur për arsye të dukshme është ndryshe nga PCB e mëparshme e kompanisë. Vlera e inovacionit tipik për risi është 180 W - është pak më e lartë se ajo e GTX 980, por dukshëm më e ulët se ajo e Titan X dhe GTX më pak produktiv 980 TI. Bordi i referencës ka një grup të njohur të lidhjeve për bashkëngjitjen e pajisjeve të prodhimit të imazhit: një dual-link DVI, një HDMI dhe tre displaport.

Edicioni i Themeluesve të Dizajnit të Referencës

Njoftimi i GEFORCE GTX 1080 Në fillim të majit, është shpallur një edicion i veçantë i kartelës video të quajtur themelues themelues, i cili ka një çmim më të lartë në krahasim me kartat video konvencionale të partnerëve të kompanisë. Në thelb, ky publikim është një kartë referimi dhe sistemi i ftohjes, dhe është bërë nga Nvidia. Ju mund të lidhen ndryshe ndaj varianteve të tilla të kartave video, por të zhvilluara nga inxhinierët e dizajnit të referencës së kompanisë dhe dizajni i prodhuar duke përdorur komponentët me cilësi të lartë ka tifozët e vet.

Por nëse ata do të japin disa mijë rubla më shumë për kartën video nga vetë Nvidia - kjo është një pyetje, përgjigja për të cilën mund të japë vetëm praktika. Në çdo rast, është në fillim të shesësh se kartat e referencës nga NVIDIA me një çmim në rritje do të shfaqen, dhe nuk është veçanërisht e ndryshme nga asgjë - ndodh me çdo njoftim, por referenca GeForce GTX 1080 karakterizohet në atë Është planifikuar të shitet gjatë gjithë jetës së saj, deri në lirimin e zgjidhjeve të gjeneratës së ardhshme.

Nvidia beson se ky botim ka avantazhet e tij edhe para veprave më të mira të partnerëve. Për shembull, një dizajn me dy fletë të një frigorifer ju lejon të mbledhni lehtësisht në bazë të kësaj karte video të fuqishme si një kompjuter lojrash me një faktor relativisht të vogël të formës, si dhe sistemet video multimeephy (edhe pavarësisht nga operacioni pa punë në modalitetin tre dhe katër orësh). GeForce GTX 1080 themeluesit e themeluesve ka disa avantazhe në formën e një pije freskuese efikase duke përdorur një dhomë avulluese dhe një tifoz që lëshon ajër të nxehtë nga rasti - ky është zgjidhja e parë e tillë e nvidia që konsumon më pak se 250 W Energji.

Krahasuar me hartimet e mëparshme të referencës së produkteve të kompanisë, qarku i energjisë u përmirësua me një fazë katërfazore në pesë fazore. NVIDIA gjithashtu flet për komponentët e përmirësuar në të cilin bazohet risi, ndërhyrja elektrike është reduktuar gjithashtu për të përmirësuar stabilitetin e potencialit të tensionit dhe overclocking. Si rezultat i të gjitha përmirësimeve, efikasiteti i energjisë i tarifës referuese u rrit me 6% krahasuar me GEFORCE GTX 980.

Dhe për të ndryshuar nga modelet e "zakonshme" të GeForce GTX 1080 dhe jashtë, për edicionin e themeluesve zhvilluan një dizajn të pazakontë "copëtuar". Kjo, megjithatë, ndoshta çoi në komplikimin e formës së dhomës së avullimit dhe radiatorit (shih foton), e cila është e mundur dhe shërbehet si një nga arsyet për shtesë në 100 dollarë për një botim të tillë të veçantë. Ne do të përsërisim se në fillim të shitjes së një zgjedhjeje të veçantë për blerësit nuk do të jetë, por në të ardhmen ju mund të zgjidhni të dyja një zgjidhje me dizajnin tuaj nga një prej partnerëve të kompanisë dhe të kryer nga NVIDIA vetë.

Gjenerata e re e arkitekturës grafike Pascal

Karta GEFORCE GTX 1080 është bërë zgjidhja e parë për CHIP GP104 bazuar në gjeneratën e re të arkitekturës grafike NVIDIA - Pascal. Megjithëse arkitektura e re ishte e bazuar në vendimin, ka punuar në Maxwell, ka dallime të rëndësishme funksionale që ne do të shkruajmë. Ndryshimi kryesor nga këndvështrimi global ishte procesi i ri teknologjik për të cilin u krye një procesor i ri grafik.

Përdorimi i procesit teknik prej 16 nm finfet në prodhimin e procesorëve grafik të GP104 në fabrikat e TSMC TSMC bëri të mundur rritjen e ndjeshme të kompleksitetit të çipit duke ruajtur zonën dhe koston relativisht të ulët. Krahasoni numrin e transistorëve dhe zonën e patate të skuqura GP104 dhe GM204 - ato janë të afërta në zonë (kristali i risive është edhe pak më pak fizikisht), por çipi i arkitekturës Pascal ka një transistorë të dukshëm më shumë, dhe, në përputhje me rrethanat, blloqe ekzekutive, duke përfshirë sigurimin e funksionalitetit të ri.

Nga një këndvështrim arkitektonik, Pascal i parë i lojrave është shumë i ngjashëm me zgjidhjet e ngjashme të arkitekturës Maxwell, edhe pse ka disa dallime. Ashtu si Maxwell, procesorët e arkitekturës Pascal do të kenë një konfigurim të grumbullimit të grupeve të përpunimit të grafikut (GPC), duke transmetuar multiprocessors që transmetojnë shumë multiprocessor (SM) dhe kontrollorët e kujtesës. Multibrocessor SM është një shumëprocesor paralel i lartë që planifikon dhe shkon Warp (Warp, grupe prej 32 rryma komanduese) në cuda-bërthamore dhe blloqe të tjera ekzekutive në një multiprocessor. Të dhëna të detajuara në pajisjen e të gjitha këtyre blloqeve mund të gjeni në rishikimet tona të zgjidhjeve të mëparshme NVIDIA.

Secila nga MultiRocessors SM është mbuluar me një motor motor polimorph, i cili përpunon mostrat e strukturës, tessellation, transformimin, instalimin e atributeve të vertex dhe një korrigjim perspektivë. Ndryshe nga zgjidhjet e mëparshme të kompanisë, motor polimorph në CHIP GP104 përmban gjithashtu një njësi të re të njëkohshme multi-projektim multi-projektim, të cilin ne ende do të flasim. Kombinimi i multirocessor SM me një motor motor polimorfi është tradicional për Nvidia të quajtur TPC - Cluster Processor Texture.

I gjithë CHIP GP104 në GEFORCE GTX 1080 përmban katër grupe GPC dhe 20 multirocessors SM, si dhe tetë kontrollues të kujtesës, të kombinuara me blloqe ROP në shumën prej 64 copë. Çdo grup GPC ka një motor të dedikuar të rutimit dhe përfshin pesë multiprocessors SM. Çdo multiprocessor, nga ana tjetër, përbëhet nga 128 cuda-cores, 256 Kb të skedarit të regjistrit, 96 CB memorie të përbashkët, 48 KB të cache të nivelit të parë dhe tetë blloqe TMU Texture. Kjo është, në total GP104 përmban 2560 cuda-cores dhe 160 blloqe TMU.

Gjithashtu, procesori i grafikut, i cili bazohet në kartën video GEFORCE GTX 1080, përmban tetë 32-bit (ndryshe nga kontrollorët memorie të përdorura më parë 64-të, të cilat na japin një autobus të memories prej 256 bit. Secila nga kontrollorët e kujtesës është e lidhur me tetë ROP dhe 256 KB të cache të nivelit të dytë. Kjo është, e gjithë Chip GP104 përmban 64 blloqe ROP dhe 2048 KB të cache të nivelit të dytë.

Falë optimizimeve arkitektonike dhe një procesi të ri teknik, Pascal i parë i lojrave është bërë procesori më i efektshëm i grafikës për të gjithë kohën. Për më tepër, kontributi në të është nga një nga proceset më të avancuara teknologjike prej 16 nm finfet dhe nga optimizimet e arkitekturës në Pascal, krahasuar me Maxwell. NVIDIA ishte në gjendje të rriste frekuencën e orës edhe më shumë se sa u llogaritën kur kalonin në një proces të ri teknik. GP104 vepron në një frekuencë më të lartë se sa do të punojë GM204 hipotetike, lëshuar duke përdorur një proces 17 NM. Për këtë, inxhinierët NVIDIA duhej të kontrollonin dhe optimizonin tërësisht të gjitha pengesat e zgjidhjeve të mëparshme, duke mos lejuar të përshpejtoheshin mbi një prag të caktuar. Si rezultat, modeli i ri GEFORCE GTX 1080 operon me më shumë se 40% rritje frekuencë, krahasuar me GEFORCE GTX 980. Por kjo nuk është e gjitha ndryshimet që lidhen me frekuencën e funksionimit të GPU.

GPU Boost 3.0 Teknologjia

Siç e dimë mirë sipas kartave video NVIDIA, në procesorët e tyre grafik, ata përdorin teknologjinë hardware të rritjes së GPU, me qëllim të rritjes së frekuencës së orës së GPU në mënyrat kur ende nuk ka arritur kufijtë për konsumin e energjisë dhe gjenerimin e nxehtësisë. Gjatë viteve të fundit, ky algoritëm ka pësuar shumë ndryshime, dhe gjenerata e tretë e kësaj teknologjie është përdorur tashmë në arkitekturën Pascal Video Chip - GPU Boost 3.0, inovacioni kryesor i të cilave është bërë një instalim më delikate i turbo-frekuencave, në varësi të në tension.

Nëse ju kujtohet parimi i funksionimit të versioneve të mëparshme të teknologjisë, atëherë diferenca midis frekuencës bazë (vlera minimale e garantuar e frekuencës është nën të cilën GPU nuk bie të paktën në lojëra) dhe frekuenca turbo ishte fikse. Kjo është, frekuenca turbo ka qenë gjithmonë në një numër të caktuar të megaherz mbi bazën themelore. GPU Boost 3.0 ka aftësinë për të instaluar zhvendosjen e frekuencës turbo për çdo tension veç e veç. Mënyra më e lehtë për të kuptuar është ilustruar nga:

Në të majtë është rritja e GPU e versionit të dytë, në të djathtë - e treta, e cila u shfaq në Pascal. Dallimi fiks midis frekuencave bazë dhe turbo nuk lejoi të zbulojë plotësisht aftësitë e GPU-së, në disa raste përpunuesit grafikë të gjeneratave të mëparshme mund të punojnë më shpejt në tensionin e instaluar, por tejkalimi i frekuencës turbo nuk e lejoi këtë . Në GPU Boost 3.0, kjo veçori u shfaq, dhe frekuenca turbo mund të instalohet për secilën nga vlerat e tensionit individual, duke shtypur plotësisht të gjitha lëngjet nga GPU.

Për të kontrolluar përshpejtimin dhe për të krijuar një kurbë turbo-frekuente, kërkohet shërbime të përshtatshme. Nvidia vetë nuk e bën këtë, por ndihmon partnerët e saj për të krijuar shërbime të ngjashme për lehtësimin e overclocking (brenda kufijve të arsyeshëm, natyrisht). Për shembull, funksionaliteti i ri i rritjes së GPU-së është zbuluar tashmë në EVGA Precision XOC, i cili përfshin një skaner të posaçëm të përshpejtimit, duke gjetur automatikisht dhe duke instaluar një dallim jolinear midis frekuencës bazë dhe frekuencës turbo për vlerat e ndryshme të tensionit duke përdorur fillimin Performanca dhe testimi i stabilitetit. Si rezultat, përdoruesi rezulton një kurbë të frekuencës turbo, në mënyrë ideale korrespondon me aftësitë e një çipi të veçantë. E cila, përveç kësaj, ju mund të modifikoni disi në modalitetin manual.

Siç mund ta shihni në screenshot të shërbimeve, përveç informacionit në lidhje me GPU dhe sistemit, ka edhe cilësime për overclocking: objektivi i energjisë (përcakton konsumin tipik të energjisë gjatë përshpejtimit, si përqindje e standardit), objektivi i GPU TEMP (temperatura maksimale e lejueshme e kernelit), Ora e GPU-së kompensuar (tejkalon frekuencën bazë për të gjitha vlerat e tensionit), kompensimi i kujtesës (frekuenca e kujtesës video që tejkalon vlerën e parazgjedhur), overvoltage (fuqi shtesë për të rritur tensionin).

Utility Precision XOC përfshin tre mënyra të përshpejtimit: manualin bazë linear dhe manual linear dhe manual. Në mënyrën kryesore, ju mund të vendosni një frekuencë të vetme që tejkalon vlerën (frekuenca fikse turbo) mbi bazën, ashtu siç ishte për GPU-të e mëparshme. Modaliteti linear ju lejon të vendosni një ndryshim linear në frekuencën nga minimumi në vlerat maksimale të tensionit për GPU. E pra, në modalitetin manual, ju mund të vendosni vlerat unike të frekuencës GPU për çdo pikë të tensionit në grafik.

Si pjesë e shërbimeve ka edhe një skaner të posaçëm për overclocking automatike. Ju ose mund të instaloni nivelet tuaja të frekuencës ose të lejoni përdorimin e saktësisë XOC për të skanuar GPU në të gjitha streset dhe për të gjetur frekuencat më të qëndrueshme për çdo pikë në kurbën dhe frekuencën e tensionit janë plotësisht automatikisht. Në procesin e skanimit, precision XOC gradualisht shton frekuencën e GPU dhe kontrollon punën e saj në stabilitetin ose pamjen e objekteve, duke ndërtuar kurbën e përsosur të frekuencave dhe streseve, të cilat do të jenë unike për çdo çip specifik.

Ky skaner mund të konfigurohet sipas kërkesave tuaja, vendosjen e segmentit të kohës së testit të secilës vlerë të tensionit, të kontrolluar nga frekuenca minimale dhe maksimale dhe hapi i tij. Është e qartë se për të arritur rezultate të qëndrueshme do të jetë më mirë për të vendosur një hap të vogël dhe një kohëzgjatje të mirë të testimit. Në procesin e testimit, mund të ndodhë një pajisje dhe sistem i paqëndrueshëm, por nëse skaneri nuk varet, do të rivendosë punën dhe do të vazhdojë të gjejë frekuencat optimale.

Lloji i ri i kujtesës video GDDR5X dhe kompresim i përmirësuar

Pra, fuqia e procesorit të grafikës është rritur ndjeshëm, dhe autobusi i kujtesës mbeti vetëm 256-bit - nuk do të ketë bandwidth kujtesës për të kufizuar performancën e përgjithshme dhe çfarë mund të bëhet me të? Duket se kujtesa premtuese HBM e gjeneratës së dytë është ende shumë në prodhim, kështu që unë kam për të kërkuar opsione të tjera. Që nga momenti i ardhjes së GDDR5-Memory në vitin 2009, inxhinierët NVIDIA hetuan mundësitë e përdorimit të llojeve të reja të kujtesës. Si rezultat, zhvillimi erdhi në futjen e një standardi të ri të memories GDDR5X - standardi më kompleks dhe i avancuar, i cili jep shkallën e transferimit prej 10 GBPS.

NVIDIA sjell një shembull interesant se sa shpejt është. Ka vetëm 100 picoseconds midis bit të transmetuara - gjatë një kohe të tillë, rreze e lehtë do të kalojë distancën vetëm një inç (rreth 2.5 cm). Dhe kur përdorni kujtesën GDDR5X, zinxhiri pritës i transmetimit të të dhënave duhet të jetë më pak se gjysma e kësaj kohe, zgjidhni vlerën e bit të transmetuar, para se të dërgohet një tjetër, është vetëm që ju të kuptoni se cilat teknologji moderne kanë arritur.

Për të arritur këtë shpejtësi të punës, ishte e nevojshme të zhvillohej një arkitekturë e re e sistemit I / O të të dhënave që kërkonin disa vjet të zhvillimit të përbashkët me prodhuesit e çipave të kujtesës. Përveç rritjes së normës së transmetimit të të dhënave, efikasiteti i energjisë është rritur - Patate të skuqura standarde të standardeve GDDR5X përdorin një tension të reduktuar në 1.35 v dhe prodhohen sipas teknologjive të reja, të cilat i japin të njëjtat konsum të energjisë në 43% më shumë frekuencë.

Inxhinierët e kompanisë kishin për të ricikluar linjat e transmetimit të të dhënave në mes të core dhe memorie të GPU, paguajnë më shumë vëmendje për të parandaluar humbjen dhe degradimin e sinjalit gjatë gjithë kujtesës nga kujtesa në GPU dhe mbrapa. Kështu, ilustrimi i mësipërm tregon një sinjal të kapur në formën e një "sy" të madh simetrik, i cili tregon optimizimin e mirë të të gjithë zinxhirit dhe lehtësinë relative të kapjes së të dhënave nga sinjali. Për më tepër, ndryshimet e përshkruara më sipër kanë çuar jo vetëm për mundësinë e përdorimit të GDDR5X nga 10 GHz, por gjithashtu duhet të ndihmojnë në marrjen e një PSP të lartë për produktet e ardhshme duke përdorur më shumë kujtesën më të njohur të GDDR5.

Epo, më shumë se 40% e rritjes së PSP-së nga aplikimi i kujtesës së re që kemi marrë. Por a nuk është e mjaftueshme? Për të rritur më tej efikasitetin e përdorimit të bandwidthit të kujtesës në NVIDIA, vazhdoi të përmirësojë të dhënat e avancuara të mbyllura në arkitekturat e mëparshme. Nënsistemi i kujtesës në GeForce GTX 1080 përdor përmirësim dhe disa teknika të reja për ngjeshjen e të dhënave pa humbje, të dizajnuara për të zvogëluar kërkesat për PSP - gjeneratën e katërt të compression intracepik.

Algoritme për të dhënat e kompresuar në kujtesë menjëherë sjellin disa momente pozitive. Kompresimi zvogëlon numrin e të dhënave të regjistruara në kujtesë, e njëjta vlen edhe për të dhënat e dërguara nga kujtesa e videove në memorien e cache të nivelit të dytë, e cila përmirëson efikasitetin e përdorimit të cache L2, që nga tjegulla e kompresuar (blloku i disa pikselëve kuadër) ka një madhësi më të vogël se jo të pakompressuar. Gjithashtu zvogëlon sasinë e të dhënave të dërguara në mes të pikave të ndryshme, të tilla si moduli TMU Texture dhe FrameBuffer.

Transportuesi i kompresionit të të dhënave në GPU përdor disa algoritme, të cilat përcaktohen në varësi të "kompresimit" të të dhënave - për ta përzgjedhur më të mirët e algoritmeve në dispozicion. Një nga më të rëndësishmet është algoritmi i kodimit të deltës së të dhënave të ngjyrave të pixel (compression me ngjyra delta). Kjo metodë e compression i kodon të dhënat në formën e një diference midis vlerave vijuese në vend të vetë të dhënave. GPU llogarit ndryshimin në vlerat e ngjyrave midis pixels në bllok (tjegull) dhe kursen bllokun si një ngjyrë të caktuar mesatarisht për të gjithë bllokun plus të dhënat për ndryshimin në vlerat për secilin piksel. Për të dhënat grafike, kjo metodë zakonisht është e përshtatshme, pasi ngjyra brenda pllakave të vogla për të gjitha pikselët shpesh nuk është ndryshe.

Procesori i GP104 i GP104 si pjesë e GEFORCE GTX 1080 mbështet më shumë algoritme të compression në krahasim me patate të skuqura të mëparshme Maxwell arkitekt. Kështu, algoritmi i ngjeshjes 2: 1 u bë më efikas, dhe përveç tij u shfaq dy algoritme të reja: modaliteti i ngjeshjes 4: 1, i përshtatshëm për rastet, kur ndryshimi në ngjyrën e block pixel është shumë i vogël dhe mënyra e 8: 1, duke kombinuar compression konstant algoritmi me një raport prej 4: 1 blloqe prej 2 × 2 piksele me një compression të dyfishtë të një delta midis blloqeve. Kur compression nuk është plotësisht e pamundur, nuk është përdorur.

Megjithatë, në të vërtetë, kjo e fundit është shumë e rrallë. Kjo mund të shihet nga shembuj të screenshots nga loja e makinave të projektit, e cila çoi Nvidia për të ilustruar raportin e rritjes së compression në Pascal. Në ilustrimet e purpurta, ato pllaka të tamponëve të personelit janë pikturuar, të cilat mund të shtrydhin një procesor grafik, dhe compression jo-humbje mbeti me ngjyrën origjinale (nga lart - Maxwell, më poshtë - Pascal).

Siç mund ta shihni, algoritme të reja compression në GP104 me të vërtetë punojnë shumë më mirë se në Maxwell. Megjithëse arkitektura e vjetër gjithashtu mund të compress shumica e pllakave në skenë, një numër i madh i barit dhe pemëve në skajet, si dhe pjesët e makinës nuk janë të ekspozuara ndaj algoritmeve të vjetruara të ngjeshjes. Por kur ju mundësoni teknika të reja në Pascal, një numër shumë i vogël i imazheve të imazhit mbetet i pakompressuar - efikasiteti i përmirësuar është i qartë.

Si rezultat i përmirësimit të kompresimit të të dhënave, GeForce GTX 1080 është në gjendje të zvogëlojë ndjeshëm numrin e të dhënave të dërguara në secilën kornizë. Nëse flasim për numra, atëherë kompresimi i përmirësuar kursen një shtesë prej rreth 20% të bandwidthit efektiv të kujtesës. Përveç më shumë se 40% të rritjes së PSP në GEFORCE GTX 1080 në krahasim me GTX 980 nga përdorimi i kujtesës GDDR5X, të gjitha jep rreth 70% të rritjes së PSP-së efektive, krahasuar me modelin e gjeneratës së kaluar .

ANYNC llogarit mbështetjen e kompjuterit asinkron

Shumica e lojrave moderne përdorin llogaritjet komplekse përveç grafikut. Për shembull, llogaritjet në llogaritjen e sjelljes së organeve fizike nuk mund të kryhen jo para ose pas llogaritjeve grafike, por njëkohësisht me ta, pasi ato nuk janë të lidhura me njëri-tjetrin dhe nuk varen nga njëri-tjetri brenda një kuadri. Gjithashtu, një shembull mund t'u jepet një post-përpunim i personelit tashmë të dhënë dhe të dhënave të përpunimit të audios, të cilat gjithashtu mund të ekzekutohen paralelisht me dhënien.

Një shembull tjetër i gjallë i përdorimit të funksionalitetit është një shtrembërim i kohës asinkron (ASYNCRONOUS Time Warp) i përdorur në sistemet e realitetit virtual në mënyrë që të ndryshojë kornizën e prodhimit në përputhje me lëvizjen e kokës së lojtarit direkt para prodhimit të saj, duke ndërprerë paraqitjen e ardhshme. Ngarkesa e tillë asinkronike e kapaciteteve të GPU bën të mundur rritjen e efikasitetit të përdorimit të blloqeve të saj ekzekutive.

Ngarkesa të tilla krijojnë dy skenare të reja të përdorimit të GPU. E para nga këto përfshin shkarkime të mbivendosura, pasi shumë lloje të detyrave nuk përdorin plotësisht aftësitë e përpunuesve grafikë, dhe një pjesë e burimeve është e papunë. Në raste të tilla, thjesht mund të ekzekutoni dy detyra të ndryshme në një GPU, duke ndarë blloqet e saj ekzekutive për të marrë përdorim më efikas - për shembull, efektet e Physx që po kandidojnë së bashku me paraqitjen 3D të kornizës.

Për të përmirësuar punën e këtij skenari, balancimi i ngarkesës dinamike u shfaq në arkitekturën Pascal (balancimi i ngarkesës dinamike). Në arkitekturën e mëparshme Maxwell, ngarkesat e mbivendosjes u kryen si një shpërndarje statike e burimeve të GPU në grafik dhe llogaritjen. Kjo qasje është efektive, me kusht që balanca midis dy ngarkesave të përputhet me ndarjen e burimeve dhe detyrat kryhen në mënyrë të barabartë në kohë. Nëse llogaritjet iljstabike kryhen më gjatë se grafik, dhe të dyja po presin për përfundimin e punës së përgjithshme, atëherë një pjesë e kohës së mbetur të GPU-së do të ngrihet, e cila do të shkaktojë një reduktim në produktivitetin e përgjithshëm dhe do të zvogëlojë të gjitha përfitimet. Balancimi i ngarkesës dinamike hardware gjithashtu ju lejon të përdorni burimet e lëshuara të GPU menjëherë kur ato bëhen të disponueshme - për të kuptuar ilustrimin.

Ka edhe detyra kritike nga koha e ekzekutimit, dhe ky është skenari i dytë i informatikës asinkron. Për shembull, ekzekutimi i një algoritmi të shtrembërimit të kohës asinkron në VR duhet të përfundojë para se skanimi (skanimi) ose korniza do të fshihet. Në këtë rast, GPU duhet të mbështesë një ndërprerje shumë të shpejtë të detyrës dhe të kalojë në një tjetër për të hequr detyrën më pak kritike nga ekzekutimi në GPU, duke liruar burimet e saj për detyra kritike - kjo quhet premtimi.

Një ekip i rëndësishëm nga motori i lojës mund të përmbajë qindra thirrje për funksione të vizatimit, çdo telefonatë tërheqje, nga ana tjetër, përmban qindra trekëndësha të përpunuara, secila prej të cilave përmban qindra piksele që duhet të llogariten dhe të mohohen. Në qasjen tradicionale, GPU përdor ndërprerjen e detyrave vetëm në një nivel të lartë dhe transportuesi grafik është i detyruar të presë për përfundimin e të gjithë kësaj pune para se të kalojë detyrën, gjë që rezulton në vonesa shumë të mëdha.

Për ta rregulluar atë, arkitektura Pascal fillimisht prezantoi aftësinë për të ndërprerë detyrën në nivelin e nivelit të pikselit - piksel. Blloqet ekzekutive të procesorit grafikë Pascal mund të monitorojnë vazhdimisht ecurinë e kryerjes së detyrave të dhënies dhe kur të kërkohet ndërprerja, ata mund të ndalojnë ekzekutimin duke kursyer kontekstin për përfundimin e mëtejshëm, të kaluara shpejt në një detyrë tjetër.

Ndërprerja dhe kalimi në nivelin e rrjedhës për llogaritjen e operacioneve është e ngjashme me ndërprerjen e nivelit të pikselit për llogaritjet grafike. Loads informatikë përbëhet nga disa rrjeta, secila prej të cilave përmban shumë temat. Kur u pranua kërkesa për ndërprerje, rrjedhat e kryera në shumëtrocesor përfundojnë ekzekutimin. Blloqe të tjera mbajnë shtetin e tyre për të vazhduar nga i njëjti moment në të ardhmen, dhe GPU ndizet në një detyrë tjetër. E gjithë procesi i kalimit të detyrës merr më pak se 100 mikrosekondë pasi të kryhen rrjedhat e përfunduara.

Për ngarkesat e lojrave, një kombinim i ndërprerjeve në një nivel pixel për grafikë dhe ndërprerje në nivelin e transmetimit për detyrat e llogaritjes i jep procesorëve grafik të arkitekturës Pascal me aftësinë për të kaluar shpejt në mes të detyrave me humbje minimale të kohës. Dhe për llogaritjen e detyrave në CUDA, është gjithashtu e mundur të ndërpritet me granularitet minimal - në nivelin e udhëzimeve. Në këtë mënyrë, të gjitha rrjedhat ndalojnë ekzekutimin menjëherë, menjëherë kalojnë në një detyrë tjetër. Kjo qasje kërkon ruajtjen e më shumë informacioneve mbi gjendjen e të gjitha regjistrave të çdo rrjedhe, por në disa raste të llogaritjes së mos-hidhërimit është plotësisht e justifikuar.

Përdorimi i detyrave të ndërprerjes së shpejtë dhe të kalimit në detyra grafike dhe informatike u shtua në arkitekturën Pascal në mënyrë që detyrat grafike dhe analfabete të ndërpriten në nivelin e udhëzimeve individuale, dhe jo të gjitha rrjedhat, siç ishte në Maxwell dhe Kepler. Këto teknologji janë në gjendje të përmirësojnë ekzekutimin asinkron të ngarkesave të ndryshme në procesorin e grafikës dhe të përmirësojnë reagimin gjatë njëkohësisht kryerjen e disa detyrave. Veprimtaria NVIDIA tregoi një demonstrim të punës së llogaritjeve asinkron në shembullin e llogaritjes së efekteve fizike. Nëse pa llogaritjet asinkronike, performanca ishte në 77-79 fps, pastaj me përfshirjen e këtyre aftësive, norma e kuadrove u rrit në 93-94 fps.

Ne kemi dhënë tashmë një shembull të një prej mundësive për përdorimin e kësaj funksionaliteti në lojëra në formën e shtrembërimit të kohës asinkron në VR. Ilustrimi tregon punën e kësaj teknologjie me një ndërprerje tradicionale (premtuese) dhe me një të shpejtë. Në rastin e parë, procesi i shtrembërimit të kohës asinkron po përpiqet të kryejë sa më vonë të jetë e mundur, por para se të përditësohet imazhi në ekran. Por puna e algoritmit duhet të bëhet në ekzekutimin e disa milisekondave në GPU më parë, pasi pa ndërprerje të shpejtë nuk është e mundur të kryhet me saktësi punën në momentin e duhur dhe GPU është i papunë për disa kohë.

Në rastin e ndërprerjes së saktë në nivelin e pikselëve dhe rrjedhave (në ilustrim në të djathtë), një mundësi e tillë jep saktësi më të madhe në përcaktimin e momentit të ndërprerjes, dhe shtrembërimi i kohës asinkron mund të lansohet dukshëm më vonë me besim në mbyllje më parë përditësimin e informacionit në ekran. Dhe GPU që qëndron për disa kohë në rastin e parë mund të shkarkohet disa punë grafike shtesë.

Teknologji multiprocessing multi-projektim i njëkohshëm

Procesori i ri GP104 GP104 u shfaq mbështetjen për teknologjinë e re të multiprocessing (njëkohësisht multi-projektim - SMP), i cili lejon GPU të nxjerrë të dhëna për sistemet moderne të prodhimit të imazhit në mënyrë më efikase. SMP lejon deklaratën video për të shfaqur njëkohësisht të dhëna në disa parashikime, për të cilat ishte e nevojshme për të hyrë në një bllok të ri hardware në GPU në motor polimorfi në fund të transportuesit gjeometrik para njësisë së rasterizimit. Kjo njësi është përgjegjëse për të punuar me disa parashikime për një rrymë të vetme gjeometrike.

Proceset e motorëve të shumëpritur të të dhënave gjeometrike në të njëjtën kohë për 16 parashikime të paracaktuara që kombinojnë pikën e parashikimit (kamerat), këto parashikime mund të rrotullohen në mënyrë të pavarur ose të përkulur. Meqenëse çdo primitiv gjeometrik mund të shfaqet njëkohësisht në disa projeksione, motori SMP siguron funksionalitet të tillë, duke lejuar aplikimin të japë udhëzimet e deklaratës video për të përsëritur gjeometrinë në 32 herë (16 parashikime në dy qendra të projektimit) pa përpunim shtesë.

I gjithë procesi i përpunimit përshpejtohet në mënyrë të shpejtë, dhe që nga puna shumëprokimuese pas një motori gjeometrik, nuk ka nevojë të përsëritet disa herë të gjitha fazat e gjeometrisë së përpunimit. Burimet e ruajtura janë të rëndësishme në kushtet e kufizimit të shpejtësisë së dhënies me performancën e përpunimit të gjeometrisë, siç është tessellimi, kur puna e njëjtë gjeometrike kryhet disa herë për çdo projeksion. Prandaj, në rastin e pikut, shumëprisja mund të zvogëlojë nevojën për përpunim gjeometrinë deri në 32 herë.

Por pse është e nevojshme? Ka disa shembuj të mirë ku teknologjia multiprocessing mund të jetë e dobishme. Për shembull, një sistem shumë-domuclear i tre ekraneve montuar në një kënd të njëri-tjetrit në afërsi të përdoruesit (konfigurimi rrethues). Në një situatë tipike, skena është tërhequr në një projeksion, i cili çon në shtrembërime gjeometrike dhe refunksionale të pasakta të gjeometrisë. Mënyra e saktë është tre parashikime të ndryshme për secilën prej monitorëve, në përputhje me këndin nën të cilin ato janë të vendosura.

Me ndihmën e një karte video në një arkitekturë Pascal, kjo mund të bëhet në një kalim të gjeometrisë, duke treguar tre parashikime të ndryshme, secila për monitorin e saj. Dhe përdoruesi do të jetë në gjendje të ndryshojë këndin sipas të cilit vëzhguesit janë të vendosur për njëri-tjetrin jo vetëm fizikisht, por edhe praktikat që kthehen për vëzhguesit anësorë për të marrë perspektivën e saktë në skenën 3D me një kënd të mrekullueshëm shikues (FOV) . Vërtetë, ka një kufizim - për një mbështetje të tillë, aplikacioni duhet të jetë në gjendje të tërheqë një skenë me fov të gjerë dhe të përdorë thirrje SMP SMP për instalim. Kjo është, në çdo lojë ju nuk do ta bëni këtë, keni nevojë për mbështetje të veçantë.

Në çdo rast, kohët e një projekti në monitorin e vetëm të sheshtë kaluan, tani shumë konfigurime shumë-komponente dhe shfaqje të lakuara, të cilat gjithashtu mund të përdoren këtë teknologji. Jo për të përmendur sistemet e realitetit virtual që përdorin lente të veçanta midis ekraneve dhe syve të përdoruesit, i cili kërkon teknika të reja për projektimin e imazheve 3D në një imazh 2D. Shumë prej këtyre teknologjive dhe teknikave janë ende në fillim të zhvillimit, gjëja kryesore është se GPU-të e vjetra nuk mund të përdorë në mënyrë efektive më shumë se një projeksion të sheshtë. Këto kërkojnë disa kalime të renditjes, trajtim të përsëritur të të njëjtës gjeometrinë etj.

Arkitekti Maxwell patate të skuqura kishin mbështetje të kufizuar shumë rezolucione që ndihmon në rritjen e efikasitetit, por SMP në Pascal mund të jetë shumë më tepër. Maxwell mund ta kthejë projektimin me 90 gradë për kartat kub (Mapping Cube) ose leje të ndryshme për projektimin, por ishte e dobishme vetëm në një rreth të kufizuar të aplikacioneve, si VXGI.

Nga aplikacionet e tjera SMP, vërejmë vizatimin me rezolucion të ndryshëm dhe stereorenderin me një kalim. Për shembull, vizatimi me rezolucion të ndryshëm (hije multi-res) mund të përdoret në lojërat e optimizimit të performancës. Kur përdoret, një rezolutë më e lartë përdoret në qendër të kornizës, dhe në periferi ajo zvogëlohet për të marrë një normë më të lartë të paraqitjes.

Stereorenderimi me një kalim përdoret në VR, tashmë është shtuar në paketën e Vrworks dhe përdor mundësinë e multipojit për të zvogëluar sasinë e punës gjeometrike të kërkuar nga VR duke bërë. Në rastin e përdorimit të këtij funksioni, procesori i GeForce GTX 1080 përpunon gjeometrinë e skenës vetëm një herë, duke gjeneruar dy parashikime në të njëjtën kohë për çdo sy, i cili dyfishoi ngarkesën gjeometrike në GPU, dhe gjithashtu zvogëlon humbjen nga shoferi dhe OS .

Një metodë edhe më e avancuar e përmirësimit të efikasitetit të pasqyrimit të VR është shadhi i përputhur me lente, kur shtrembërimet gjeometrike të kërkuara me marrjen e VR janë simuluar duke përdorur disa parashikime. Kjo metodë përdor shumëprim për dhënien e skenës 3D në sipërfaqe, e cila është përafërsisht e ngjashme me lente të rregulluara gjatë tërheqjes për të dalë në një helmetë VR, e cila lejon të mos tërheqë shumë piksele të panevojshme në periferi që do të fshihen. Është më e lehtë për të kuptuar thelbin e metodës së ilustrimit - para çdo sy, përdoren katër parashikime të pakta (Pascal mund të përdoret gjithashtu për 16 parashikime për çdo sy - për imitim më të saktë të lente të lakuara) në vend të një:

Një qasje e tillë është në gjendje të kursejë mirë në performancë. Pra, një imazh tipik për Oculus Rift për çdo sy është 1.1 Megapixel. Por për shkak të ndryshimit në parashikimet, për ta bërë atë, imazhi origjinal është përdorur në 2.1 megapiksel - 86% më shumë të nevojshme! Përdorimi i multiprocessing i ngulitur në arkitekturën Pascal lejon të zvogëlojë zgjidhjen e imazhit të tërhequr në 1.4 megapiksel, duke marrë një dhe një kursim gjysmë-rrugë në normën e përpunimit të pixel, dhe gjithashtu kursen bandwidth të kujtesës.

Dhe së bashku me kursimet e dyfishta në shpejtësinë e përpunimit të gjeometrisë për shkak të stereorit të vetëm të kalimit, procesori i GeForce GTX 1080 është i aftë të ofrojë një rritje të konsiderueshme në performancën e dhënies së VR, shumë të kërkuar dhe të shpejtësisë së përpunimit të gjeometrisë dhe madje më shumë - për të përpunuar pixel.

Përmirësimet në prodhimin e videove dhe blloqet e përpunimit

Përveç performancës dhe funksionalitetit të ri që lidhet me paraqitjen 3D, është e nevojshme të mbahen një nivel të mirë dhe mundësinë e nxjerrjes së imazhit, si dhe dekodimin dhe kodimin e të dhënave video. Dhe përpunuesi i parë i grafikës së arkitekturës Pascal nuk e zhgënjen - Mbështet gjithçka standardet moderne Në këtë kuptim, duke përfshirë dekodimin e harduerit të formatit të HEVC që kërkohet për të parë videot 4K në PC. Gjithashtu, pronarët e ardhshëm të kartave video të GeForce GTX 1080 do të jenë në gjendje të gëzojnë shpejt rishikimin e video streaming 4k nga Netflix dhe ofruesit e tjerë në sistemet e tyre.

Nga pikëpamja e një prodhimi të imazhit në shfaqje, GeForce GTX 1080 ka mbështetje për HDMI 2.0b me HDCP 2.2, si dhe DisplayPort. Deri më tani, versioni i PD 1.2 është i certifikuar, por GPU është gati për certifikim për standardet më të reja: DP 1.3 gati dhe DP 1.4 gati. Kjo e fundit ju lejon të shfaqni një imazh në ekranet 4K në një frekuencë rinovimi prej 120 Hz, dhe në 5k- dhe 8K-ekranet - në 60 Hz kur përdorni DisplayPort 1.3 kabllor. Nëse për GTX 980 rezolucioni maksimal i mbështetur ishte 5120 × 3200 në 60 Hz, pastaj për modelin e ri GTX 1080, ajo u rrit në 7680 × 4320 me të njëjtin 60 Hz. Referenca GeForce GTX 1080 ka tre rezultate DisplayPort, një HDMI 2.0b dhe një Digital Dual-Link DVI.

Modeli i New Nvidia Video Card gjithashtu mori një njësi të përmirësuar të dekodimit të videos dhe kodim të të dhënave video. Kështu, CHIP GP104 përputhet me standardet e larta të PlayReady 3.0 (SL3000) për të luajtur video streaming, duke ju lejuar të jeni të sigurt se duke luajtur përmbajtje me cilësi të lartë nga furnizuesit e mirënjohur, si Netflix, do të jetë si cilësi e lartë dhe efikase për energji. Detajet mbi mbështetjen e formateve të ndryshme video gjatë kodimit dhe dekodimit janë paraqitur në tabelë, risi është qartë ndryshe nga zgjidhjet e mëparshme për të mirë:

Por një risi edhe më interesante mund të quhet mbështetje për të ashtuquajturat shfaqje të nivelit të lartë dinamik (varg dinamik të lartë - HDR), të cilat janë gati të bëhen të përhapura në treg. TV janë shitur tashmë në 2016 (dhe në vetëm një vit është planifikuar të shesin katër milionë TV HDR), dhe monitorët janë si më poshtë. HDR është zbulimi më i madh në teknologjitë e ekranit për shumë vite, ky format ka dyfishuar hije ngjyrash (75% e spektrit të dukshëm, ndryshe nga 33% për RGB), më shumë të ndritshme (1000 nit) me kontrast më të madh (10,000: 1) dhe ngjyra të ngopura.

Shfaqja e riprodhimit të përmbajtjes me një ndryshim më të madh në shkëlqimin dhe ngjyrat më të pasura dhe të pasura do të sjellë imazhin në ekran në realitet, ngjyra e zezë do të bëhet më e thellë, drita e ndritshme do të jetë e verbër, si në botën reale. Prandaj, përdoruesit do të shohin më shumë detaje në imazhe të ndritshme dhe të errëta të imazheve, krahasuar me monitorët dhe televizorët standardë.

Për të mbështetur ekranet HDR, GeForce GTX 1080 ka gjithçka që ju nevojitet - aftësinë për të nxjerrë një ngjyrë 12-bit, mbështetje për standardet e BT.2020 dhe SMPTE 2084, si dhe prodhimin e imazhit në përputhje me HDMI 2.0B 10/12-bit HDR në rezolucion 4k, i cili ishte dhe Maxwell. Përveç kësaj, Pascal ka mbështetur një format 4k-rezolucion HEVC decoding me 60 Hz dhe 10 ose 12-bit ngjyrë, e cila është përdorur për HDR Video, si dhe kodimin e të njëjtit format me të njëjtin parametra, por vetëm në 10-bit për të regjistruar video HDR ose streaming. Gjithashtu, një risi është e gatshme të standardizojë Displayport 1.4 për të transmetuar të dhënat e HDR për këtë lidhës.

Nga rruga, kodimi i videos HDR mund të jetë i nevojshëm në të ardhmen në mënyrë që të transmetojë të dhëna të tilla nga një PC në shtëpi në konsolën e mburojës, e cila mund të luajë një hevc 10-bit. Kjo është, përdoruesi do të jetë në gjendje të transmetojë lojën me një PC në formatin HDR. Ndaloni, dhe ku të merrni lojëra me një mbështetje të tillë? NVIDIA vazhdimisht punon me zhvilluesit e lojërave për të zbatuar një mbështetje të tillë, duke kaluar gjithçka që ju nevojitet (mbështetje në shofer, shembuj të kodit, etj.) Për paraqitjen e saktë të një imazhi HDR në përputhje me shfaqjet ekzistuese.

Në kohën e lëshimit të kartës video, GeForce GTX 1080, mbështetja për prodhimin e HDR ka lojëra të tilla si përpjekje, dëshmitari, ligjvënësi, ngritja e sulmuesit të varrit, Paragon, Parimi i Talos dhe Shadow Warrior 2. Por në afërsi e ardhmja pritet të rimbushë këtë listë..

Ndryshimet në paraqitjen e shumëfishtë të SLI

Ka pasur edhe disa ndryshime të lidhura me teknologjinë e korporatave të SLI të shumëfishtë, megjithëse askush nuk priste. SLI përdoret nga entuziastët e lojrave të PC-ve për të rritur performancën ose vlerat ekstreme, duke vendosur kartat më të fuqishme të videove të vetme në të njëjtën kohë, ose për të marrë një normë shumë të lartë kornize, duke kufizuar një çift të nivelit të mesëm Zgjidhje, të cilat ndonjëherë kushtojnë më lirë se një të lartë (vendimi është i diskutueshëm, por e bën atë). Nëse ka monitorë 4k, lojtarët nuk kanë pothuajse asnjë opsion tjetër, me përjashtim të instalimit të një çifti video, pasi edhe modelet më të mira shpesh nuk mund të ofrojnë një lojë të rehatshme në mjediset maksimale në kushte të tilla.

Një nga komponentët e rëndësishëm të NVIDIA SLI janë ura që lidhin kartat video në një transmetues të përbashkët video dhe punonjës për të organizuar një kanal dixhital të transmetimit të të dhënave në mes tyre. Në kartat video të GeForce, lidhësit e dyfishtë SLI u instaluan tradicionalisht, të cilat shërbyen për t'u lidhur ndërmjet dy ose katër kartave video në konfigurimet e 3 dhe 4-të SLI. Secila nga kartat video duhet të ishte e lidhur me secilin, pasi të gjithë GPU-të dërguan me ta korniza në procesorin kryesor të grafikut, prandaj, u nevojitej dy ndërfaqe në secilën prej bordeve.

Duke filluar nga modeli GEFORCE GTX 1080, për të gjitha kartat video NVIDIA bazuar në arkitekturën Pascal, dy ndërfaqe SLI janë të lidhura së bashku për të rritur performancën e transmetimit të të dhënave në mes të kartave video dhe një mënyrë të tillë të re me dy kanale që ju lejon të përmirësoni produktivitetin dhe rehati kur shfaqin informacion vizual mbi ekranet me rezolucion shumë të lartë ose sistemet e shumë komponentëve.

Për një mënyrë të tillë, ura të reja të quajtura SLI HB ishin të nevojshme. Ata kombinojnë një palë karta video GEFORCE GTX 1080 në të njëjtën kohë në dy kanale SLI, edhe pse kartat e reja video janë gjithashtu të pajtueshme me urat e vjetra. Për rezolucionin e 1920 × 1080 dhe 2560 × 1440 piksele, në një frekuencë të përditësimit 60 Hz, ju mund të përdorni ura standarde, por në mënyrat më të vështira (4K, 5K dhe sistemet multimonitor) rezultatet më të mira në ndryshimin e kornizës së qetë do të ofrojnë vetëm Urat e reja, edhe pse të vjetra do të punojnë, por disi më keq.

Gjithashtu, kur përdorni SLI HB ura, ndërfaqja e transmetimit të të dhënave GEFORCE GTX 1080 funksionon në 650 MHz, krahasuar me 400 MHz në ura konvencionale SLI në GPU-të e vjetër. Për më tepër, për disa nga urat e ngurta të vjetra, një frekuencë më e lartë e transmetimit të të dhënave me video patate të skuqura të arkitekturës Pascal është gjithashtu në dispozicion. Me rritjen e normës së transmetimit të të dhënave në mes të GPU-së në një ndërfaqe të dyfishtë SLI me një frekuencë në rritje të punës, një prodhim kornizë më të butë është dhënë në ekran, krahasuar me zgjidhjet e mëparshme:

Duhet gjithashtu të theksohet se mbështetja e renditjes së shumëfishtë në DirectX 12 është disi e ndryshme nga ajo që ishte e njohur më herët. Në versioni i fundit API grafike, microsoft. Duke bërë shumë ndryshime të lidhura me punën e sistemeve të tilla video. Për zhvilluesit e softuerit në DX12, dy opsione për përdorimin e Multiple GPU janë në dispozicion: Modalitetet Multi Display Adapter (MDA) dhe përshtatësin e ekranit të lidhur (LDA).

Për më tepër, modaliteti LDA ka dy forma: LDA implicite (që përdor NVIDIA për SLI) dhe LDA qartë (kur zhvilluesi i lojës merr detyrat e menaxhimit të detyrave të menaxhimit të paraqitjes. MDA dhe mënyrat e eksplicite të LDA janë zbatuar në DirectX 12 për të dhënë Zhvilluesit e lojërave janë liri dhe mundësi më të mëdha kur përdorin sistemet video multimevieweview. Dallimi në mes të mënyrave është qartë i dukshëm në tabelën e mëposhtme:

Në modalitetin LDA, çdo kujtesë GPU mund të lidhet me kujtesën e një tjetri dhe të shfaqet në formën e një vëllimi të madh të përgjithshëm, natyrisht, me të gjitha kufizimet e performancës kur të dhënat shkojnë nga kujtesa e dikujt tjetër. Në modalitetin MDA, çdo kujtesë GPU punon veç e veç, dhe GPU të ndryshme nuk mund të marrin qasje të drejtpërdrejtë në të dhëna nga kujtesa e një përpunuesi tjetër grafik. Modaliteti i LDA është projektuar për sisteme multi-pastërtie të performancës së ngjashme, dhe modaliteti MDA ka më pak kufizime, dhe GPU-të diskrete dhe të integruara ose zgjidhje diskrete me patate të skuqura të prodhuesve të ndryshëm mund të punojnë së bashku. Por kjo mënyrë gjithashtu kërkon që zhvilluesit më shumë vëmendje dhe të punojnë kur programimi i bashkëpunimit në mënyrë që GPU të shkëmbejë informacion me njëri-tjetrin.

By default, sistemi SLI i bazuar në GeForce GTX 1080 bordet mbështet vetëm dy konfigurime të GPU-ve, dhe tre dhe katër madhësi nuk janë të rekomanduara zyrtarisht për përdorim, si në lojërat moderne bëhet gjithnjë e më e vështirë për të siguruar përfitimet e produktivitetit nga shtimi i procesorin e tretë dhe të katërt të grafikut. Për shembull, shumë lojëra qëndrojnë në mundësi procesor qendror Sistemet kur punojnë me sisteme video me shumë tipare, teknikat e përkohshme (të përkohshme) që përdorin të dhëna nga kornizat e mëparshme përdoren gjithnjë e më shumë në lojëra të reja, në të cilat funksionimi efektiv i disa GPUs është thjesht e pamundur.

Sidoqoftë, funksionimi i sistemeve në sistemet e tjera (jo-SLI) mbetet e mundur, si modes MDA ose LDA në sistemin DirectX 12 ose dy tipi SLI me një GPU të tretë të dedikuar për efektet fizike të Physx. Por, ç'të themi për të dhënat në standardet, me të vërtetë në Nvidia i refuzojnë ato fare? Jo, sigurisht, por meqenëse sistemet e tilla janë në kërkesë në botë pothuajse njësi të përdoruesve, pastaj për ultrantusiasts të tilla, ata dolën me çelësin e veçantë të çelësit të entuziastit, të cilat mund të shkarkohen në faqen e internetit të NVIDIA dhe të zhbllokojë këtë mundësi. Për ta bërë këtë, së pari duhet të merrni një identifikues unik GPU duke përdorur një aplikacion të veçantë, atëherë kërkoni një çelës entuziast në faqen e internetit dhe shkarkoni atë, vendosni çelësin e sistemit, zhbllokimin e konfigurimit të tretë dhe 4-rrugor SLI.

Teknologjia e sinkronizimit të shpejtë të sinkronizimit

Disa ndryshime ndodhën në teknologjitë e sinkronizimit kur shfaqin informacion në ekran. Vlerësimi përpara, asgjë e re nuk është shfaqur në sinkronizimin e G-Sync, pasi teknologjia e sinkronizimit adaptiv adaptiv nuk mbështetet. Por në NVIDIA vendosi të përmirësojë butësinë e prodhimit dhe sinkronizimit për lojëra që tregojnë performancë shumë të lartë kur norma e kuadrit tejkalon ndjeshëm normën e përditësimit të monitorit. Kjo është veçanërisht e rëndësishme për lojërat që kërkojnë vonesa minimale dhe përgjigje të shpejtë dhe në të cilën mbahen betejat multiplayer dhe konkurrenca.

Sinkronizimi i shpejtë është një alternativë e re për sinkronizimin vertikal, i cili nuk ka artefakte vizuale në formën e pushimeve të figurës në imazh dhe nuk është i lidhur me një frekuencë të përditësimit fiks, gjë që rrit vonesat. Cili është problemi i sinkronizimit vertikal në lojëra të tilla si kundër-grevat: Ofendim global? Kjo lojë në GPU të fuqishëm modern punon me disa qindra korniza për sekondë, dhe lojtari ka një zgjedhje: përfshijnë sinkronizimin vertikal ose jo.

Në lojërat multiplayer, përdoruesit më shpesh ndjekin vonesat minimale dhe shkëputjen vsync, duke marrë boshllëqe të dukshme në imazhin, jashtëzakonisht të pakëndshme dhe me shkallë të lartë kuadër. Nëse përfshini sinkronizimin vertikal, lojtari do të marrë një rritje të konsiderueshme të vonesave midis veprimeve të tij dhe imazhit në ekran kur transportuesi grafik ngadalësohet në frekuencën e përditësimit të monitorit.

Pra, punimet tradicionale të transportuesit. Por NVIDIA vendosi të ndajë procesin e paraqitjes dhe të shfaqë imazhin në ekran duke përdorur teknologjinë e shpejtë të sinkronizimit. Kjo ju lejon të vazhdoni punën më efikase për pjesën e GPU, e cila është e angazhuar në nxjerrjen e kornizave me shpejtësi të plotë, duke ruajtur këto korniza në një tampon të përkohshëm tampon të posaçëm të fundit.

Kjo metodë ju lejon të ndryshoni rrugën e prodhimit në ekran dhe të merrni më të mirën nga mënyrat VSYNC dhe VSYNC nga marrja e vonesave të ulëta, por pa artefakte të imazhit. Me sinkronizimin e shpejtë, nuk ka kontroll kornizë, motori i lojës punon në mënyrën e mënyrës së sinkronizimit dhe nuk thotë të presësh me vizatimin e të ardhshëm, prandaj vonesat janë pothuajse aq të ulëta sa modaliteti VSYNC off. Por që nga sinkronizimi i shpejtë zgjedh tampon për të prodhuar në ekran dhe tregon të gjithë kornizën, atëherë nuk ka pushime të figurës.

Kur punojnë shpejt, tre mbulesa të ndryshme përdoren, dy të parat prej të cilave përdoren në të njëjtën mënyrë si buffering dyfishtë në transportues klasik. Buffer primar (tampon para - fb) është një tampon, informacion nga i cili shfaqet në ekran, kornizë të tërhequr plotësisht. Buffer sekondar (Back Buffer - BB) është një tampon që vjen me informacion gjatë dhënies.

Kur përdorni sinkronizimin vertikal nën kushtet e kornizës së lartë, loja është duke pritur për momentin e përditësimit të informacionit në ekran (rifreskoni intervalin) për të shkëmbyer tampon primar me të mesëm për të shfaqur imazhin me një copë në ekran. Kjo ngadalëson procesin, dhe duke shtuar buffers shtesë si me buffering tradicionale trefishtë vetëm shton një vonesë.

Me përdorimin e sinkronizimit të shpejtë, shtohet tamponi i tretë i tamponëve të tretë (LRB), i cili përdoret për të ruajtur të gjitha kornizat, të cilat sapo janë dhënë në tampon sekondar. Emri tampon flet për vete, ai përmban një kopje të kornizës së fundit të ri-tërhequr plotësisht. Dhe kur do të vijë momenti i tamponit primar, kjo tampon LRB kopjohet në tërësi tërësisht, dhe jo në pjesë, si nga e mesme kur sinkronizimi vertikal është i fikur. Meqenëse kopjimi i informacionit nga buffers është joefikas, ata thjesht ndryshojnë vendet (ose riemërohen, pasi do të jenë më të përshtatshëm për të kuptuar), dhe vendet e reja të ndryshimit të tamponave që u shfaqën në GP104 menaxhon këtë proces.

Në praktikë, përfshirja e një metode të re sinkronizimi të shpejtë të sinkronizimit siguron një vonesë pak të madhe, krahasuar me sinkronizimin vertikal të paaftë plotësisht - mesatarisht, 8 ms më shumë, por tregon korniza në të gjithë monitorin, pa objekte të pakëndshme në ekran që lot imazh. Një metodë e re mund të aktivizohet nga cilësimet grafike të panelit të kontrollit NVIDIA në seksionin e kontrollit të sinkronizimit vertikal. Megjithatë, vlera e parazgjedhur është menaxhimi i aplikacionit dhe sinkronizimi i shpejtë nuk kërkohet thjesht në të gjitha aplikacionet 3D, është më mirë të mos e zgjidhni këtë metodë posaçërisht për lojëra të larta FPS.

Virtual Reality Technologies Nvidia Vrworks

Ne kemi ndikuar në mënyrë të përsëritur në temën e nxehtë të realitetit virtual në artikull, por më së shumti ka të bëjë me rritjen e frekuencës së personelit dhe dhënien e vonesave të ulëta, shumë të rëndësishme për VR. E gjithë kjo është shumë e rëndësishme dhe përparimi është me të vërtetë atje, por deri më tani lojrat VR duken shumë larg nga shumë mbresëlënëse si më të mirët e lojrave moderne "të zakonshme". Pra, rezulton jo vetëm për shkak se zhvilluesit kryesorë të lojërave të lojërave të VR nuk janë veçanërisht të përfshira, por edhe për shkak të kërkesave më të mëdha të VR për normën e kuadrit, i cili nuk lejon shumë nga teknikat e zakonshme në lojëra të tilla për shkak të kërkesave të larta.

Për të zvogëluar ndryshimin në cilësinë midis lojrave VR dhe të zakonshme, NVIDIA vendosi të lëshojë një paketë të tërë të teknologjive përkatëse të Vrworks, e cila përfshinte një numër të madh të API-ve, bibliotekat, motorët dhe teknologjitë që lejojnë të përmirësojnë ndjeshëm cilësinë dhe performancën Vr- Aplikime. Si e zbatohet kjo për shpalljen e zgjidhjes së parë të lojës në Pascal? Është shumë e thjeshtë - disa teknologji kanë futur në të, duke ndihmuar për të rritur produktivitetin dhe për të përmirësuar cilësinë, dhe ne kemi shkruar tashmë për to.

Dhe megjithëse nuk vjen vetëm për grafikë, së pari më tregoni pak për këtë. Vrworks Grafike Teknologjia Set përfshin teknologjitë e përmendura më parë, si lente që përputhen me mbrojtje, duke përdorur shumëprerjen e mundësisë që shfaqet në GeForce GTX 1080. Risi që ju lejon të merrni një rritje të produktivitetit prej 1.5-2 herë në lidhje me vendimet që nuk kanë të tillë mbështetje. Ne gjithashtu përmendëm teknologjitë e tjera, si mbrojtja e multirës, \u200b\u200be destinuar për dhënien me një rezolutë të ndryshme në qendër të kornizës dhe në periferi të saj.

Por shumë më tepër të papritura ishte shpallja e teknologjisë audio të Vrworks, e projektuar për të dhënat e altoparlantëve të kualitetit të lartë CCD në skena 3D, veçanërisht të rëndësishme në sistemet e realitetit virtual. Në motorët e zakonshëm, pozicionimi i burimeve të shëndosha në një mjedis virtual llogaritet në mënyrë korrekte nëse armiku shkëlqejnë të drejtën, atëherë zëri është më i fortë nga kjo anë e sistemit audio, dhe kjo llogaritje nuk është shumë e kërkuar për fuqinë informatike.

Por në të vërtetë, tingujt vijnë jo vetëm për lojtarin, por në të gjitha drejtimet dhe reflektohen nga materiale të ndryshme, të ngjashme me mënyrën se si reflektohen rrezet e dritës. Dhe në realitet, dëgjojmë këto reflektime, edhe pse jo aq të dukshme si valët e drejta të zërit. Këto reflektime të zërit indirekt zakonisht simulohen me efekte të veçanta reverb, por kjo është një qasje shumë primitive ndaj detyrës.

Në paketën audio Vrworks, llogaritja e valëve të zërit është e ngjashme me gjurmimin e rrezeve kur bëhet kur rruga e rrezes së lehtë është gjurmuar në disa reflektime nga objektet në skenën virtuale. Vrworks Audio gjithashtu imiton përhapjen e valëve të zërit në mjedis, kur monitorohen valët e drejta dhe të pasqyruara, në varësi të këndit të rënies dhe pronave të tyre të materialeve reflektuese. Në punën e saj, Vrworks Audio përdor një motor të lartë të performancës NVIDIA Optix me performancë të lartë NVIDIA të dizajnuar për të gjurmuar rrezet sipas detyrave grafike. Optix mund të përdoret për një shumëllojshmëri të detyrave, të tilla si llogaritja e ndriçimit indirekt dhe përgatitja e kartave të ndriçimit, dhe tani për gjurmimin e valëve audio në audio Vrworks.

NVIDIA ka ngulitur llogaritjen e saktë të valëve të zërit në programin e demonstrimit të fondeve VR, përdor disa mijëra rrezet dhe llogaritet deri në 12 reflektime nga objektet. Dhe për të caktuar përfitimet e teknologjisë në një shembull të kuptueshëm, ne ju sugjerojmë të shikoni një video për punën e teknologjisë në rusisht:

Është e rëndësishme që qasja nvidia ndryshon nga motorët tradicionalë të zërit, duke përfshirë harduerin e përshpejtuar duke përdorur një bllok të veçantë në metodën e GPU nga konkurrenti kryesor. Të gjitha këto metoda ofrojnë vetëm pozicionim të saktë të burimeve të shëndosha, por nuk llogarisin reflektimin e valëve të zërit nga objektet në skenën 3D, edhe pse mund të simulojnë këtë duke përdorur efektin e reverberimit. Sidoqoftë, përdorimi i teknologjisë së gjurmimit të rrezeve mund të jetë shumë më realist, pasi vetëm një qasje e tillë do të sigurojë imitim të saktë të tingujve të ndryshëm, duke marrë parasysh madhësinë, format dhe materialet e objekteve në skenë. Është e vështirë të thuhet nëse një saktësi e tillë kërkohet për një lojtar tipik, por mund të thuhet me siguri: në VR, ajo mund të shtojë përdoruesit në më realiste, e cila nuk është e mjaftueshme për lojërat e zakonshme.

Epo, ne kemi lënë të tregojmë vetëm për teknologjinë VR SLI, duke punuar në OpenGL dhe në DirectX. Parimi i saj është jashtëzakonisht i thjeshtë: sistemi video me dy procesor në aplikacionin VR do të funksionojë në mënyrë që çdo sy të ndahet GPU i veçantë, në kontrast me paraqitjen Afr, e cila është e njohur për konfigurimet e SLI. Kjo në masë të madhe përmirëson performancën e përgjithshme, aq e rëndësishme për sistemet e realitetit virtual. Teorikisht, ju mund të përdorni më shumë GPU, por sasia e tyre duhet të jetë edhe.

Një qasje e tillë ishte e nevojshme për shkak se AFR është dobët i përshtatshëm për VR, pasi me ndihmën e saj GPU i parë do të tërheqë një kornizë të barabartë për të dy sytë, dhe e dyta është e çuditshme, e cila nuk zvogëlon vonesat, kritike për sistemet e realitetit virtual. Megjithëse frekuenca e kornizave do të jetë mjaft e lartë. Pra, me VR SLI, puna në secilën kornizë është e ndarë në dy GPU - një punon nga ana e kornizës për syrin e majtë, e dyta është për të drejtën, dhe pastaj këto korniza gjysmë janë të kombinuara në një tërësi.

Një ndarje e tillë e punës midis një pjese të përpunuesve grafik sjell rritje pothuajse dy herë të performancës që ju lejon të rrisni normën e kuadrit dhe të zvogëloni vonesat në krahasim me sistemet e bazuara në një kartë video. Vërtetë, përdorimi i VR SLI kërkon mbështetje të veçantë nga aplikacioni për të përdorur këtë metodë shkallëzimi. Por teknologjia VR SLI tashmë është ndërtuar në një aplikacion të tillë të demonstrimit VR si laborator nga valvula dhe tatoine nga Ilmxlab, dhe ky është vetëm fillimi - në NVIDIA premtojnë shfaqjen e aplikacioneve të tjera, si dhe futjen e teknologjisë në motorët e Unreal Motor 4 , Unitet dhe maxplay.

Ansel Loja Screenshot Platforma e krijimit

Një nga njoftimet më interesante në lidhje me softuerin ishte prodhimi i teknologjive të ekranit të cilësisë së lartë në aplikacionet e lojrave të quajtur nga një fotograf i famshëm - Ansel. Lojërat kanë qenë prej kohësh jo vetëm lojëra, por edhe vendi i aplikimit të duarve të gjalla për personalitete të ndryshme krijuese. Dikush ndryshon skenat në lojëra, dikush prodhon grupe me cilësi të lartë në lojëra, dhe dikush - bën screenshot të bukur.

NVIDIA ka vendosur të ndihmojë këtë të fundit, duke paraqitur një platformë të re për krijimin (është krijimi, sepse nuk është një proces i tillë i thjeshtë) fotografi me cilësi të lartë nga lojërat. Ata besojnë se Anulli mund të ndihmojë në krijimin e një lloji të ri të artit modern. Në fund të fundit, tashmë ka shumë artistë që shpenzojnë pjesën më të madhe të jetës për PC, duke krijuar screenshots bukur nga lojrat, dhe ata ende nuk kanë pasur një mjet të përshtatshëm për këtë.

Ansel ju lejon të mos kapni vetëm imazhin në lojë, por për ta ndryshuar atë ashtu siç është e nevojshme për të krijuar. Me këtë teknologji, ju mund të lëvizni kamerën në skenë, të rrotulloheni dhe ta anoni atë në çdo drejtim në mënyrë që të merrni përbërjen e dëshiruar të kornizës. Për shembull, në lojëra të tilla, si rekreativë të parë, ju mund të lëvizni vetëm lojtarin, asgjë më shumë do të ndryshohet më shumë, kështu që të gjitha screenshots janë mjaft monotonike. Me aparatin e lirë në Ansel, ju mund të dilni nga dhoma e lojës, duke zgjedhur një kënd të tillë, i cili është i nevojshëm për një pamje të suksesshme, ose për të kapur një stereo të plotë 360-shkallë nga pika e dëshiruar dhe në një rezolutë të lartë për shikimin e mëvonshëm në përkrenare VR.

Ansel punon mjaft thjesht - me një bibliotekë të veçantë nga Nvidia, kjo platformë futet në kodin e lojës. Për ta bërë këtë, zhvilluesi i saj ka nevojë vetëm për një pjesë të vogël të kodit për projektin e saj për të lejuar lëvizjen e videove NVIDIA për të kapur të dhënat dhe shaders tampon. Punon atje mjaft pak, futja e anselit në lojë kërkon më pak se një ditë për të zbatuar. Pra, përfshirja e kësaj mundësie në lojë Dëshmitari zinte rreth 40 rreshta të kodit, dhe në Witcher 3 - rreth 150 rreshta të kodit.

Ansel do të shfaqet me një paketë të hapur të zhvillimit - SDK. Gjëja kryesore që përdoruesi merr një grup standard të cilësimeve me të, duke e lejuar atë për të ndryshuar pozicionin dhe këndin e kamerës, shtoni efekte, etj Platforma Ansel punon si kjo: ajo e vendos lojën e lojës, përfshin një dhomë të lirë dhe Ju lejon të ndryshoni kornizën në pamjen e dëshiruar, regjistrimin e rezultatit në formën e një screenshot të rregullt, snowshot 360-shkallë, çifte stereo ose vetëm panoramas me leje të madhe.

E vetmja shënim: jo të gjitha ndeshjet do të marrin mbështetje për të gjitha tiparet e platformës së krijimit screenshots Gaming Ansel. Disa nga zhvilluesit e lojërave për një arsye ose një tjetër nuk duan të përfshijnë një dhomë plotësisht të lirë në lojërat e tyre - për shembull, për shkak të mundësisë së përdorimit të kësaj funksionaliteti me mashtruesit. Ose ata duan të kufizojnë ndryshimin në këndin e shqyrtimit me të njëjtën arsye - kështu që askush nuk ka marrë një avantazh të padrejtë. Epo, ose se përdoruesit nuk shohin sprites të mjerueshme në sfond. E gjithë kjo është mjaft dëshirat normale të krijuesve të lojrave.

Një nga tiparet më interesante të Ansel është krijimi i screenshots vetëm një leje të madhe. Nuk ka rëndësi që loja të mbështesë lejet deri në 4K, për shembull, dhe monitorin e përdoruesit dhe HD të plotë. Duke përdorur platformën e heqjes së screenshot, ju mund të kapni një imazh shumë më të lartë të kufizuar nga vëllimi dhe performanca e makinës. Platforma lehtë kap screenshots me një rezolucion prej deri në 4.5 gigapixels, me një qepje prej tyre nga 3,600 copë!

Është e qartë se në foto të tilla ju mund të konsideroni të gjitha detajet, deri në tekstin në gazetat që largohen, nëse një nivel i tillë i detajuar është dhënë në parim në lojë - Ansel është në gjendje të menaxhojë dhe të nivelojë nivelin e detajeve, duke ekspozuar nivelin maksimal për të marrë foton më të mirë të cilësisë. Por ju ende mund të aktivizoni prezantimin super. E gjithë kjo ju lejon të krijoni imazhe nga lojërat që mund të shtypen në mënyrë të sigurt në banderola të mëdha dhe të jenë të qetë për cilësinë e tyre.

Interesante, një kod special i përshpejtuar me harduer të bazuar në CUDA përdoret për të qepur imazhe të mëdha. Në fund të fundit, asnjë kartë video nuk do të jetë në gjendje të ngadalësojë një imazh shumëditor të tërë, por mund ta bëjë atë në copa që ju vetëm duhet të kombinoni më pas, duke pasur parasysh ndryshimin e mundshëm në ndriçimin, ngjyrën dhe gjëra të tjera.

Pas qepjes së panoramave të tilla, një post-përpunim i posaçëm përdoret për të gjithë kornizën, gjithashtu përshpejtuar në GPU. Dhe për të kapur imazhe në një rritje dinamike në rritje, mund të përdorni një format të posaçëm të imazhit - EXR, një standard të hapur nga drita industriale dhe magji, vlerat e ngjyrave në secilën kanal të të cilave regjistrohen në një format të pikës lundruese 16-bit ( FP16).

Ky format ju lejon të ndryshoni ndriçimin dhe gamën dinamike të imazhit me anë të përpunimit, duke e çuar atë në ekranin e dëshiruar në të njëjtën mënyrë si ajo është bërë me formate të papërpunuara nga kamera. Po, dhe për përdorimin pasues të filtrave pas përpunimit në programet e përpunimit të imazhit, ky format është shumë i dobishëm, pasi përmban shumë më tepër të dhëna sesa formatet e zakonshme për imazhet.

Por platforma Ansel dhe vetë përmban shumë filtra për përpunim pas përpunimit, i cili është veçanërisht i rëndësishëm, sepse ka qasje jo vetëm në figurën përfundimtare, por edhe për të gjitha buffers të përdorura nga loja kur paraqitet, e cila mund të përdoret për efekte shumë interesante, si thellësia e fushës. Për ta bërë këtë, Ansel ka një API të veçantë për përpunim pas përpunimit, dhe çdo efekt mund të përfshihet në lojë me mbështetje për këtë platformë.

Filtrat Post Ansel përfshin filtra të tillë si: Curves Color, Space Color, Transformimi, Desaturation, Bloom, Lente Flare, Glare Anamorphic, Shtrembër, Heathaze, Fisheye, Aberration Color, Mapping Ton, Dirt Lens, LightShafes , Vigette, korrigjim gamma, convolution, mprehje, zbulim buzë, turbullirë, sepia, denoise, fxaa dhe të tjerët.

Sa për shfaqjen e mbështetjes së anselit në lojëra, atëherë do të duhet të presë pak ndërsa zhvilluesit do të zbatohen dhe të testohen. Por NVIDIA premton shfaqjen e një mbështetjeje të tillë në lojëra të tilla të njohura si Divizioni, Dëshmitari, Lagaja, Witcher 3, Paragon, Fortnite, Odgrim, No Man "S Qielli, Unreal Tournament dhe të tjerë.

Procesi i ri teknologjik prej 16 nm finfet dhe optimization arkitekture lejoi kartën video GEFORCE GTX 1080 bazuar në procesorin grafik GP104, për të arritur një frekuencë të lartë të orës prej 1.6-1.7 GHz, madje edhe në formë referimi dhe të punojë në frekuencat maksimale në lojëra Garanton një brez të ri. GPU Boost Teknologjia. Së bashku me një numër të shtuar të blloqeve ekzekutive, këto përmirësime bënë një risi jo vetëm kartën më të lartë të performancës me performancë të vetme për të gjithë kohën, por edhe zgjidhjen më efikase të energjisë në treg.

Modeli GeForce GTX 1080 është bërë kartela e parë video që mban një lloj të ri të kujtesës GDDR5X grafike - një gjeneratë e re e patate të skuqura me shpejtësi të lartë, gjë që bëri të mundur arritjen e një frekuence shumë të lartë të transmetimit të të dhënave. Në rastin e modifikimit të GeForce GTX 1080, ky lloj i kujtesës vepron në një frekuencë efektive prej 10 GHz. Në kombinim me përmirësimin e algoritmeve të kompresimit të informacionit në kornizë, ajo çoi në një rritje efektive bandwidth Kujtesa për këtë procesor grafik është 1.7 herë, krahasuar me paraardhësin e drejtpërdrejtë në fytyrën e GeForce GTX 980.

NVIDIA ka vendosur me kujdes që të mos lëshojë një arkitekturë rrënjësisht të re në një proces krejtësisht të ri teknik për veten e tij në mënyrë që të mos hasni probleme shtesë në zhvillimin dhe prodhimin. Në vend të kësaj, ata u përmirësuan seriozisht dhe aq të mirë dhe shumë efektive arkitekturë Maxwell, duke shtuar disa mundësi. Si rezultat, me prodhimin e GPU të ri, gjithçka është e mirë, dhe në rastin e modelit GFORCE GTX 1080, inxhinierët kanë arritur një potencial shumë të lartë të frekuencës - në opsionet e overclocked nga partnerët, frekuenca e GPU pritet të deri në 2 GHz! Një frekuencë e tillë mbresëlënëse është bërë e vërtetë në sajë të procesit të përsosur dhe punës së përpiktë të inxhinierëve të NVIDIA kur zhvillon një procesor grafik Pascal.

Dhe megjithëse Pascal është bërë një ndjekës i drejtpërdrejtë i rastit të Maxwell-it, dhe këto arkitektura grafike bazohen në vetvete shumë të ndryshme nga njëri-tjetri, NVIDIA ka prezantuar shumë ndryshime dhe përmirësime, duke përfshirë aftësinë për të shfaqur imazhe në shfaqje, motor dhe video Motori i dekodimit, i përmirësuar asinkron ekzekutimin e llojeve të ndryshme të llogaritjeve në GPU, bëri ndryshime në renditjen multimeele dhe zbatoi një metodë të re sinkronizimi të sinkronizimit të shpejtë.

Është e pamundur të mos nxjerrë në pah teknologjinë e njëkohshme multi-projektim multiproying, e cila ndihmon në rritjen e produktivitetit në sistemet e realitetit virtual, të ketë një shfaqje më korrekte të skenave në sistemet me shumë domuclear, dhe të zbatojë teknika të reja të optimizimit të performancës. Por rritja më e madhe në shpejtësi do të marrë një aplikim VR kur teknologjia shumëpretuese do të mbështetet, e cila ndihmon në mënyrë që të ruajë burimet e GPU gjatë përpunimit të të dhënave gjeometrike dhe një herë e gjysmë - me kompjuterin Pixel.

Ndër ndryshimet e pastra të softuerit, platforma është veçanërisht e theksuar për krijimin e screenshots në lojërat e quajtur Ansel - provoni në këtë rast do të jetë interesante jo vetëm për një shumë të luajtur, por edhe të interesuar vetëm për grafikë 3D me cilësi të lartë. Risi ju lejon të promovoni artin e krijimit dhe retouching screenshots në një nivel të ri. E pra, paketat e tyre për zhvilluesit e lojërave, si Gameworks dhe Vrworks, NVIDIA thjesht vazhdon të përmirësojë hap pas hapi - kështu që, në këtë të fundit ka pasur një mundësi interesante të një zëri me cilësi të lartë të tingullit, duke marrë parasysh reflektimet e shumta të valëve të zërit duke përdorur një gjurmë hardware të rrezeve.

Në përgjithësi, në formën e një karte video Nvidia Geforce GTX 1080, një udhëheqës i vërtetë është lëshuar në treg, duke pasur të gjitha cilësitë e nevojshme për këtë: performancë të lartë dhe funksionalitet të gjerë, si dhe mbështetje për karakteristika dhe algoritme të reja. Blerësit e parë të kësaj karte video do të jenë në gjendje të vlerësojnë menjëherë shumë nga këto avantazhe, dhe mundësitë e tjera të zgjidhjeve do të zbulohen pak më vonë kur do të shfaqet mbështetje e gjerë nga ana. softuer. Gjëja kryesore është se GEFORCE GTX 1080 doli të jetë shumë e shpejtë dhe efikase, dhe disa nga problemet e problemeve (të njëjtat llogaritjet asinkronike), siç shpresojmë që Nvidia arriti të rregullojë.

GeForce GTX 1070 Accelerator Graphics

ParametërVlerë
Emri i kodit CHIP.GP104.
Teknologjia e Prodhimit16 nm finfet.
Numri i transistorëve7.2 miliardë
Bërthama katrore314 mm²
ArkitekturëUnifikuar, me një sërë përpunues të përbashkët për transmetimin e llojeve të shumta të të dhënave: vertices, pixels, etj.
Mbështetja e harduerit DirectXDirectX 12, me mbështetje për nivelin e funksionit 12_1
Autobusi i kujtesës.256-bit: tetë kontrollues të pavarur 32-bit memorie me mbështetje për kujtesën GDDR5 dhe GDDR5X
Shpeshtësia e procesorit grafik1506 (1683) MHz
Blloqe informatike15 aktive (nga 20 në chip) shumëfishimin e shumëfishtë që përbëjnë 1920 (nga 2560) Scalar ALU për llogaritjet e pikës lundruese nën standardin IEEE 754-2008;
Blloqe texturing120 aktive (nga 160 në chip) blloqe të adresave të strukturës dhe filtrimit me mbështetjen e komponentit FP16- dhe FP32 në tekstet dhe mbështetjen për filtrimin e trilinear dhe anisotropik për të gjitha formatet tekstuale
Blloqet e operacioneve të rasterit (ROP)8 blloqe të gjera të ROP (64 piksele) me mbështetjen e mënyrave të ndryshme zbutëse, duke përfshirë formatin e programueshëm dhe në FP16 ose FP32. Blloqet përbëhen nga një sërë alu konfigurabile dhe janë përgjegjës për gjenerimin dhe krahasimin e thellësisë, shumëfishimin dhe përzierjen
Mbështetja e monitoruarMbështetje e integruar deri në katër monitorë të lidhur me ndërfaqet DUG LINK DVI, HDMI 2.0b dhe DisplayPort 1.2 (1.3 / 1.4 gati)

Specifikimet e kartës së referencës GeForce GTX 1070
ParametërVlerë
Shpeshtësia e bërthamës1506 (1683) MHz
Numri i procesorëve universal1920
Numri i blloqeve tekstuale120
Numri i blloqeve të gabuara64
Frekuenca efektive e kujtesës8000 (4 × 2000) MHz
Lloji i kujtesësGddr5
Autobusi i kujtesës.256-bit
Kujtesë8 gb
Bandwidth kujtesës256 GB / s
Performanca kompjuterike (FP32)rreth 6.5 Teraflops
Shpejtësia maksimale e teorikës96 gigapixels / me
Textures teorike të mostrave të mostrave181 GABATEXELS / me
GomëPCI Express 3.0
LidhëseNjë lidhës DVI i dyfishtë, një HDMI dhe tre DisplayPort
Konsumim i energjisederi në 150 W.
Ushqim shtesëNjë lidhje 8 pin
Numri i lojërave elektronike të zëna në rastin e sistemit2
Çmimi i rekomanduar$ 379-449 (SHBA), 34 990 (Rusi)

Karta GeForce GTX 1070 gjithashtu mori një emër logjik të ngjashëm me të njëjtën zgjidhje nga seria e mëparshme GeForce. Ai ndryshon nga paraardhësi i tij i drejtpërdrejtë Geforce GTX 970 vetëm një brez i modifikuar. Risi bëhet në vijën aktuale të kompanisë për të hedhur poshtë zgjidhjen aktuale të lartë GeForce GTX 1080, e cila është bërë një anije e përkohshme e serisë së re për lirimin e zgjidhjeve në GPU edhe më të madhe.

Çmimet e rekomanduara për festën e re të NVIDIA Top Video janë $ 379 dhe $ 449 për versionet e zakonshme të partnerëve NVIDIA dhe një edicion special i edicionit të themeluesve. Krahasuar me modelin më të lartë, është një çmim shumë i mirë duke pasur parasysh se GTX 1070 është inferior ndaj saj rreth 25% në rastin më të keq. Dhe në kohën e njoftimit dhe lirimi i GTX 1070 bëhet zgjidhja më e mirë në klasën e saj. Ashtu si GEFORCE GTX 1080, modeli GTX 1070 nuk ka konkurrentë të drejtpërdrejtë nga AMD, dhe është e mundur të krahasohet, përveç me Radeon R9 390X dhe tërbim.

Procesori i GP104 grafik në modifikimin GEFORCE GTX 1070 vendosi të lërë një autobus të plotë 256-bit të memories, megjithëse nuk aplikohet një lloj i ri i memories GDDR5X, por shumë i shpejtë GDDR5, i cili vepron në një frekuencë të lartë efikase prej 8 GHz. Vëllimi i kartës së kujtesës me një autobus të tillë mund të jetë 4 ose 8 GB dhe për të siguruar performancën maksimale të një zgjidhjeje të re në mjediset e larta dhe rezolutat e dhënies, modeli i kartës së GeForce GTX 1070 është pajisur gjithashtu me 8 GB memorie video , si motra e saj më e vjetër. Ky vëllim është i mjaftueshëm për të nisur çdo aplikacion 3D me cilësime maksimale të cilësisë për disa vite.

Edicioni Special GeForce GTX 1070 themeluesit edicionin

Me shpalljen e GEFORCE GTX 1080 në fillim të majit, një edicion special i kartës video të quajtur Edicioni themelues, i cili ka një çmim më të lartë, në krahasim me kartat konvencionale të partnerëve të kompanisë. E njëjta gjë vlen edhe për risi. Në këtë material, ne do të tregojmë përsëri për edicionin e veçantë të kartës video GeForce GTX 1070 të quajtur Edition Themeluesve. Ashtu si në rastin e modelit të vjetër, NVIDIA vendosi të lirojë këtë version të kartës video reference të prodhuesit me një çmim më të lartë. Ata argumentojnë se shumë lojtarë dhe entuziastë blerjen e kartave të shtrenjta video të nivelit të lartë duan një produkt me një "premium" përkatëse dhe ndjenjë prej saj.

Prandaj, është pikërisht për përdoruesit e tillë në treg, GEFORCE GTX 1070 Themelues Edition Video Card do të lëshohet, e cila është projektuar dhe e bërë nga Inxhinierët NVIDIA nga materialet premium dhe komponentët, të tilla si mbulesa e edicionit të GeForce GTX 1070 alumini, si si pjatë e pasme e profilit të ulët, që mbulon anën rrënjësore të bordit të printuar të qarkut dhe shumë të popullarizuara në mesin e entuziastëve.

Siç mund ta shihni në fotografi të bordit, GeForce GTX 1070 themeluesit edicionin e themeluesve trashëguar saktësisht të njëjtin dizajn industrial të natyrshëm në versionin referues të edicionit të themeluesve të GeForce GTX 1080. Në të dy modelet, përdoret një tifoz radial, duke hedhur ajrin e nxehtë jashtë, i cili është shumë i dobishëm si në raste të vogla dhe konfigurimet e SLI të multimery me hapësirë \u200b\u200bfizikisht të kufizuar. Duke hedhur poshtë ajrin e nxehtë në pjesën e jashtme në vend të qarkullimit të saj brenda rastit zvogëlon ngarkesën e temperaturës, rrit rezultatet e overclocking dhe zgjat jetën e komponentëve të sistemit.

Nën mbulesën e sistemit të freskimit të referencës, GeForce GTX 1070 është fshehur nga një radiator i veçantë me formë alumini me tre tuba të integruar të ngrohjes nga bakri, duke hequr ngrohjen nga vetë procesori i grafikës. Ngrohja e caktuar nga tubat e nxehtësisë, pastaj shpërndan duke përdorur një radiator alumini. E pra, pjatë metalike të profilit të ulët në anën e pasme të bordit është projektuar gjithashtu për të siguruar karakteristika më të mira të temperaturës. Ajo gjithashtu ka një seksion të anuluar për lëvizje më të mirë të ajrit midis kartave të shumta video në konfigurimet SLI.

Sa i përket sistemit të furnizimit me energji, GeForce GTX 1070 Themelues Edition ka një sistem ushqimi me katër faza të optimizuar për një furnizim të qëndrueshëm të energjisë. NVIDIA siguron që përdorimi i komponentëve të veçantë në edicionin e themeluesve të GTX 1070 bëri të mundur rritjen e efikasitetit të furnizimit me energji elektrike, stabilitetit dhe besueshmërisë në krahasim me GEFORCE GTX 970, duke siguruar performancë më të mirë gjatë përshpejtimit. Në testet e veta të kompanisë, kartat e GeForce GTX 1070 janë lehtësisht më të larta se 1.9 GHz, i cili është i afërt me rezultatet e modelit më të vjetër GTX 1080.

Karta Nvidia Geforce GTX 1070 do të jetë në dispozicion në dyqanet e shitjes me pakicë duke filluar nga 10 qershor. Çmimet e rekomanduara për GeForce GTX 1070 themeluesit e themeluesve dhe zgjidhjet e partnerëve janë të ndryshme, dhe kjo është pyetja më e rëndësishme për këtë publikim të veçantë. Nëse partnerët e NVIDIA janë duke shitur kartat e tyre të GeForce GTX 1070 me një çmim, duke filluar nga $ 379 (në tregun amerikan), edicioni i themeluesve të dizajnit të referencës NVIDIA do të kushtojë 449 dollarë. A ka shumë entuziastë, të gatshëm për të paguar për të, thonë avantazhet e drejta, të dyshimta të opsionit referues? Koha do të tregojë, por ne besojmë se tarifa e referencës është më interesante si një opsion i disponueshëm për blerje në fillim të shitjeve, dhe më vonë kuptimin e blerjes së saj (madje edhe për një çmim të madh!) Është reduktuar tashmë në zero.

Mbetet për të shtuar se tarifa referuese e referencës GeForce GTX 1070 është e ngjashme me atë të kartës video të vjetër dhe të dyja ndryshojnë nga bordet e mëparshme të kompanisë. Vlera e inovacionit tipik për risi është 150 W, e cila është më e vogël se vlera për GTX 1080 me pothuajse 20% dhe afër konsumit të energjisë të gjeneratës së mëparshme GeForce GTX 970. Karta e Referencës NVIDIA ka një grup tashmë të njohur të lidhësve Për të bashkangjitur pajisjet e prodhimit të imazhit: një dual-link DVI, një HDMI dhe tre displaport. Për më tepër, u shfaq mbështetja e versioneve të reja të HDMI dhe Displayport, të cilat ne shkruam për pamjen e modelit GTX 1080.

Ndryshime arkitektonike

Karta GEFORCE GTX 1070 është e bazuar në CHIP GP104, shtratin e parë të gjeneratës së re të Nvidia Grafikë Arkitekturë - Pascal. Kjo arkitekturë u bazua në një zgjidhje që ishte ende e shpenzuar në Maxwell, por gjithashtu ka disa dallime funksionale për të cilat kemi shkruar në detaje në detaje - në pjesën e dedikuar për kartën video të Topboard GeForce GTX 1080.

Ndryshimi kryesor në arkitekturën e re ishte procesi teknologjik në të cilin do të kryhen të gjitha procesorët e rinj grafikë. Zbatimi i procesit teknik prej 16 nm finfet në prodhimin e GP104 bëri të mundur rritjen e ndjeshme të kompleksitetit të çipit duke ruajtur zonën dhe koston relativisht të ulët, dhe arkitektura e parë Pascal CHIP ka një blloqe të dukshme ekzekutive, duke përfshirë sigurimin Funksionalitet i ri, krahasuar me patate të skuqura maxwell pozicionim të ngjashëm.

GP104 Video Chip në pajisjen e tij është i ngjashëm me zgjidhjet e ngjashme të arkitekturës Maxwell dhe të dhëna të detajuara në pajisjen e GPU-ve moderne ju mund të gjeni në rishikimet tona të zgjidhjeve të mëparshme NVIDIA. Ashtu si përpunuesit e mëparshëm të grafikut, patate të skuqura të reja të arkitekturës do të kenë një konfigurim të ndryshëm të grupit të grumbullimit të grupeve të grumbullimit të grupeve të grumbullimit, duke transmetuar shumë multiprocessor (SM) dhe kontrollorët e kujtesës, dhe në GeForce GTX 1070 Disa ndryshime kanë ndodhur - pjesë e çipit ka është bllokuar dhe joaktiv (theksoi gri):

Megjithëse procesori i GP104 i GP104 përfshin katër grupime GPC dhe 20 multirocessors SM, në versionin për GeForce GTX 1070, ajo mori një modifikim të shkurorëzuar me hardware me aftësi të kufizuara nga një grup GPC. Meqenëse secili grup GPC ka një motor të dedikuar të rasterizimit dhe përfshin pesë multirocessors SM, dhe çdo blloqe të tekstit të TMU-së, pastaj në këtë version të blloqeve të GP104 1920 dhe 120 tmu nga 2560 procesorë streaming dhe 160 blloqe texturike që ekzistojnë fizikisht.

Procesori i grafikut, i cili bazohet në kartën video GEFORCE GTX 1070, përmban tetë kontrollues të kujtesës 32-bit që japin një autobus të memories prej 256 bit - pikërisht si në rastin e modelit më të vjetër GTX 1080. Nënsistemi i kujtesës nuk ka qenë shkurtohet në mënyrë që të sigurohet një kujtesë mjaft e lartë e bandwidth me kusht për përdorimin e kujtesës GDDR5 në GeForce GTX 1070. Për secilën prej kontrollorëve të kujtesës është e lidhur me tetë blloqe rop dhe 256 KB të cache të nivelit të dytë, kështu që cache GP104 dhe në këtë Modifikimi gjithashtu përmban 64 ROP dhe 2048 KB të nivelit të blloqeve të memories së parasë.

Falë optimizimeve arkitektonike dhe një procesi të ri, procesori grafik GP104 është bërë procesori grafik më efikas për energji në këtë moment. Inxhinierët e NVIDIA ishin në gjendje të rrisin frekuencën e orës më shumë se sa llogaritën kur kalonin në një proces të ri teknik, për të cilin ata duhej të punonin mirë, duke kontrolluar plotësisht dhe duke optimizuar të gjitha pengesat e zgjidhjeve të mëparshme që nuk i lejojnë ata të punojnë në një frekuencë më të lartë . Prandaj, GeForce GTX 1070 vepron gjithashtu në një frekuencë shumë të lartë, më shumë se 40% më e lartë se vlerat e referencës për GeForce GTX 970.

Meqenëse modeli GEFORCE GTX 1070 është, në thelb, vetëm një gtx 1080 pak më pak produktiv me kujtesën GDDR5, mbështet absolutisht të gjitha teknologjitë e përshkruara nga ne në seksionin e mëparshëm. Për të marrë më shumë detaje rreth arkitekturës Pascal, si dhe mbështetur nga teknologjitë e TI, të tilla si blloqe të përmirësuara të prodhimit dhe përpunimit të të dhënave video, mbështetje për kompjuterin asinkron ANYNC Compute, teknologji të njëkohshme multi-projektim multiprocessing, ndryshime në SLI të shumëfishtë dhe një Lloji i ri i sinkronizimit të shpejtë të sinkronizimit, ia vlen të familjarizohet me seksionin GTX 1080.

Memorie me performancë të lartë GDDR5 dhe përdorimi efikas i saj

Ne kemi shkruar për ndryshimet në nënsistemin e kujtesës në procesorin GP104 GP104, i cili bazohet në modelet GEFORCE GTX 1080 dhe GTX 1070 - kontrolluesit e kujtesës në përbërjen e këtij GPU ruhet si një lloj i ri i kujtesës video GDDR5X, e cila është Shkruar në detaje në shqyrtimin GTX 1080. Dhe kujtesa e vjetër GDDR5 e vjetër, e njohur për ne për disa vite tani.

Në mënyrë që të mos humbasësh shumë në bandwidth të kujtesës në modelin më të ri GTX 1070 në krahasim me GTX 1080 më të vjetër, u la aktive të gjitha tetë kontrollorët e kujtesës 32-bit, duke marrë një ndërfaqe të plotë të memories së zakonshme prej 256 bit. Përveç kësaj, karta video ishte e pajisur me memorie me shpejtësi më të lartë GDDR5, e cila ishte e disponueshme vetëm në treg - me një frekuencë efektive të punës prej 8 GHz. E gjithë kjo ofroi PSP në 256 GB / s, ndryshe nga 320 GB / s në një zgjidhje të lartë - për të njëjtën sasi dhe aftësitë kompjuterike u prerë, kështu që bilanci është vërejtur.

Mos harroni se edhe pse bandwidth kulm teorik është i rëndësishëm për performancën e përpunuesve grafikë, ju duhet t'i kushtoni vëmendje efektivitetit të përdorimit të saj. Në procesin e paraqitjes, shumë pengesa të ndryshme mund të kufizojnë performancën e përgjithshme pa lënë përdorimin e të gjithë PSP-ve në dispozicion. Për të minimizuar numrin e vendeve të ngushta, përpunuesit grafikë përdorin një kompresim të veçantë të informacionit pa humbje, përmirësimin e efikasitetit të operacioneve të leximit dhe të shkrimit.

Në arkitekturën Pascal, u prezantua gjenerata e katërt e kompresionit të Deltës të Informacionit Buffer, duke lejuar GPU të përdorë më efektivisht aftësitë e gomave të memories në dispozicion. Nënsistemi i kujtesës në GeForce GTX 1070 dhe GTX 1080 përdor përmirësimin e teknikave të reja dhe disa të reja të kompresimit të të dhënave pa humbje, të dizajnuara për të zvogëluar kërkesat për PSP. Kjo zvogëlon numrin e të dhënave të regjistruara në kujtesë, përmirëson efikasitetin e përdorimit të Cache L2 dhe zvogëlon sasinë e të dhënave të dërguara në mes të pikëve të ndryshme të GPU, si TMU dhe Freimbuple.

GPU Boost 3.0 dhe veçoritë e përshpejtimit

Shumica e partnerëve të NVIDIA kanë njoftuar tashmë vendimet e fabrikës bazuar në GEFORCE GTX 1080 dhe GTX 1070. Dhe shumë nga prodhuesit e kartelave video gjithashtu krijojnë shërbime të veçanta overclocking për të përdorur funksionalitetin e ri të teknologjisë së teknologjisë GPU Boost 3.0. Një shembull i shërbimeve të tilla është Evga Precision XOC, i cili përfshin një skaner automatik për të përcaktuar raportin e tensionit dhe kurbën e frekuencës - në këtë mënyrë për secilën nga vlerat e tensionit duke përdorur fillimin e testit të stabilitetit, ekziston një frekuencë e qëndrueshme në të cilën GPU Ofron një rritje të performancës. Megjithatë, kjo kurbë mund të ndryshohet me dorë.

Ne e dimë teknologjinë e rritjes së GPU në kartat video të mëparshme NVIDIA. Në përpunuesit e saj grafikë, ata përdorin këtë tipar hardware që synon të rrisë frekuencën e orës së punës GPU në mënyrat kur ende nuk ka arritur kufijtë e konsumit të energjisë dhe të lëshimit të nxehtësisë. Në përpunuesit grafikë të Pascal, ky algoritëm ka pësuar disa ndryshime, kryesore e të cilave është bërë një instalim më delikate i frekuencave turbo, në varësi të tensionit.

Nëse më parë diferenca midis frekuencës bazë dhe frekuencës turbo ishte fikse, atëherë në GPU Boost 3.0 ishte e mundur të instaloni zhvendosjet turbo frekuencën për çdo tension veç e veç. Tani frekuenca turbo mund të instalohet për secilën nga vlerat e tensionit individual, i cili ju lejon të shtrydhni plotësisht të gjitha mundësitë e overclocking nga GPU. Ne shkruam në detaje në lidhje me këtë mundësi në rishikimi i GeForce GTX 1080, dhe për këtë ju mund të përdorni EVGA Precision XOC dhe MSI WAPTIFTER.

Meqenëse në metodën e overclocking me lirimin e kartave video me mbështetjen e GPU Boost 3.0, disa detaje kanë ndryshuar, NVIDIA ka pasur për të bërë shpjegime shtesë në udhëzimet për overclocking produkteve të reja. Ka teknika të ndryshme përshpejtimi me variabla të ndryshëm që ndikojnë në rezultatin përfundimtar. Për çdo sistem specifik, mund të jetë më mirë të afrohesh me një metodë të veçantë, por baza është gjithmonë për të njëjtën gjë.

Shumë nga overclockers për të verifikuar stabilitetin e sistemit përdorin pikë referimi të Qiellit Unigine 4.0, të cilat në mënyrë të përkryer ngarkon procesorin e grafikut me punën, ka mjedise fleksibile dhe mund të drejtohen në modalitetin e dritares me dritaren e shërbimeve për overclocking dhe monitorim afër, si evga Precision ose MSI pasburner. Megjithatë, një inspektim i tillë është i mjaftueshëm vetëm për sulmet fillestare, dhe për një konfirmim të fortë të stabilitetit të overclocking, ajo duhet të kontrollohet në disa aplikacione të lojës, sepse lojëra të ndryshme sugjerojnë një ngarkesë të ndryshme në blloqe funksionale të ndryshme të GPU: matematikore, tekstuale, gjeometrike . Qielli 4.0 Benchmark është gjithashtu i përshtatshëm për detyrën e overclocking sepse ajo ka një mënyrë të funksionimit të funksionimit në të cilin është i përshtatshëm për të ndryshuar cilësimet e overclocking dhe ka një pikë referimi për të vlerësuar shpejtësinë e shpejtësisë.

Nvidia këshillon kur overclocking kartat e reja GEFORCE GTX 1080 dhe GTX 1070 për të drejtuar në qiell 4.0 dhe Evga Precision XOC Windows së bashku. Së pari, është e këshillueshme që menjëherë të rritet shpejtësia e rrotullimit të tifozit. Dhe për një overclocking serioze, menjëherë mund të vendosni vlerën e shpejtësisë me 100%, e cila do të bëjë punën e kartës video me një shumë zë të lartë, por ftohjen maksimale të GPU dhe komponentët e mbetur të kartës video, duke reduktuar temperaturën Niveli më i ulët i mundshëm, duke parandaluar trottimin (reduktimin e frekuencave për shkak të rritjes së temperaturës së GPU mbi një vlerë të caktuar).

Tjetra, ju duhet të instaloni vlerën e fuqisë së synuar (objektivi i energjisë) është gjithashtu maksimumi. Ky cilësim do të sigurojë një procesor grafik me sasinë maksimale të mundshme të energjisë, duke rritur nivelin e konsumit të energjisë dhe temperaturën e synuar të GPU (objektivi i Temput GPU). Për disa qëllime, vlera e dytë mund të ndahet nga ndryshimi i objektivit të energjisë, dhe pastaj këto cilësime mund të konfigurohen individualisht - për të arritur një ngrohje më të vogël të çipit video, për shembull.

Hapi i ardhshëm është rritja e vlerës së fitimit të frekuencës së videove (GPU Clock Ofset) - kjo do të thotë se sa i madh frekuenca turbo është kur punon. Kjo vlerë rrit frekuencën për të gjitha vlerat e tensionit dhe të çon në një performancë më të madhe. Si zakonisht, kur overclocking, ju duhet të kontrolloni stabilitetin kur rritni frekuencën e GPU në hapa të vegjël - nga 10 MHz në 50 MHz një hap para se të varni, gabimin e shoferit ose aplikacionin ose artefaktet vizuale. Kur të arrihet një kufi i tillë, është e nevojshme për të zvogëluar vlerën e frekuencës për të hedhur poshtë dhe për të kontrolluar stabilitetin dhe performancën kur overclocking.

Përveç frekuencës së GPU, ju gjithashtu mund të rrisni frekuencën e kujtesës video (Offset e Memory Clock), e cila është veçanërisht e rëndësishme në rastin e GeForce GTX 1070 të pajisur me memorie GDDR5, e cila zakonisht përshpejton mirë. Procesi në rastin e frekuencës së kujtesës është përsëritur pikërisht, çfarë po bëhet kur të gjesh një frekuencë të qëndrueshme të GPU-së, e vetmja ndryshim është se hapat mund të bëhen më të mëdha - për të shtuar 50-100 MHz në të njëjtën kohë në frekuencën bazë.

Përveç hapave të përshkruar më lart, mund të rrisni kufirin e tensionit (overvoltage), sepse frekuenca më e lartë e procesorit grafik është arritur shpesh me një tension në rritje kur punojnë pjesë të paqëndrueshme të GPU marrin fuqi shtesë. Vërtetë, disavantazhi i mundshëm i kësaj vlere është mundësia e dëmtimit të çipit video dhe dështimit të përshpejtuar, kështu që është e nevojshme të përdoret një tension me kujdes ekstrem.

Të dashuruarit e overclocking përdorin disa teknika të ndryshme, duke ndryshuar parametrat në mënyrë të ndryshme. Për shembull, disa overclockers ndajnë eksperimente për të gjetur një frekuencë të qëndrueshme të GPU dhe kujtesës në mënyrë që ata të mos ndërhyjnë me njëri-tjetrin dhe pastaj të testojnë chipin e kombinuar të overclocking dhe video patate të skuqura dhe të kujtesës, por këto janë detaje të parëndësishme të një qasjeje individuale.

Duke gjykuar nga opinionet në forumet dhe komentet e artikujve, disa përdorues nuk duket të shijonin algoritmin e ri të GPU të rritur 3.0, kur frekuenca e GPU-së zvogëlohet shumë e lartë, shpesh më e lartë se frekuenca turbo, por pastaj nën ndikimin e Temperatura e GPU ose rritja e konsumit të energjisë mbi kufirin, mund të bjerë në vlera dukshëm më të vogla. Kjo është thjesht specifikat e algoritmit të përditësuar, ju duhet të mësoheni me sjelljen e re të frekuencës në ndryshimin dinamik të GPU, por nuk ka ndonjë pasojë negative.

Karta video GEFORCE GTX 1070 është bërë e dyta pas modelit GTX 1080 në linjën e re të Nvidia, bazuar në procesorët grafikë Pascal. Procesi i ri teknologjik prej 16 nm finfet dhe optimizimi i arkitekturës lejuan kartën video të përfaqësuar për të arritur një frekuencë të lartë të orës, në të cilën ndihmon gjeneratën e re të teknologjisë së rritjes së GPU. Edhe përkundër sasisë së prerë të blloqeve funksionale në formën e përpunuesve të transmetimit dhe moduleve tekstuale, numri i tyre mbetet i mjaftueshëm në mënyrë që GTX 1070 të bëhet zgjidhja më e dobishme dhe efikase për energji.

Instalimi për çiftin më të ri të modeleve të lëshuara të kartave video NVIDIA në çipin GPDR5 GP104 GP104, ndryshe nga një lloj i ri GDDR5X, i cili karakterizohet nga GTX 1080, nuk e pengon atë të arrijë tregues të performancës së lartë. Së pari, Nvidia vendosi të mos e prerë autobusin e kujtesës të modelit GEFORCE GTX 1070, dhe së dyti, është instaluar në të memorien më të shpejtë të GDDR5 me një frekuencë efektive prej 8 GHz, e cila është vetëm nën 10 GHz në modelin më të vjetër të GDDR5X. Duke marrë parasysh algoritmet e përmirësuara të kompresimit të deltës, kapaciteti efektiv i bandwidthit të procesorit grafik është bërë mbi të njëjtin parametër në një model të ngjashëm të gjeneratës së mëparshme GeForce GTX 970.

GeForce GTX 1070 është e mirë sepse ofron performancë dhe mbështetje shumë të lartë për veçoritë dhe algoritmet e reja me një çmim të konsiderueshëm më pak, krahasuar me modelin më të vjetër të shpallur pak më herët. Nëse blerja e GTX 1080 për 55,000 për veten e tij mund të lejojë njësitë e entuziastëve, pastaj të nxjerrin 35,000 për vetëm një tremujor, më pak vendim produktiv, pa probleme me të njëjtat mundësi tashmë mund të kenë një gamë shumë më të madhe të blerësve potencialë. Është një kombinim i një çmimi relativisht të ulët dhe performancës së lartë të bërë GeForce GTX 1070, ndoshta, blerjen më fitimprurëse në kohën e lirimit të saj.

GeForce GTX 1060 përshpejtues grafik

ParametërVlerë
Emri i kodit CHIP.GP106.
Teknologjia e Prodhimit16 nm finfet.
Numri i transistorëve4.4 miliardë
Bërthama katrore200 mm²
ArkitekturëUnifikuar, me një sërë përpunues të përbashkët për transmetimin e llojeve të shumta të të dhënave: vertices, pixels, etj.
Mbështetja e harduerit DirectXDirectX 12, me mbështetje për nivelin e funksionit 12_1
Autobusi i kujtesës.192-bit: Gjashtë kontrollorë të pavarur 32-bit memorie me mbështetjen e kujtesës GDDR5
Shpeshtësia e procesorit grafik1506 (1708) MHz
Blloqe informatike10 multirocressors streaming që përbëjnë 1280 Scalar ALU për pikëpresje lundrues brenda standardit IEEE 754-2008;
Blloqe texturing80 blloqe të adresimit të teksteve dhe filtrimit me mbështetjen e komponentëve FP16 dhe FP32 në tekstet dhe mbështetjen për filtrimin e trilinear dhe anisotropik për të gjitha formatet tekstuale
Blloqet e operacioneve të rasterit (ROP)6 blloqe të gjera ROP (48 piksele) me mbështetjen e mënyrave të ndryshme zbutëse, duke përfshirë programin e programueshëm dhe në FP16 ose FP32. Blloqet përbëhen nga një sërë alu konfigurabile dhe janë përgjegjës për gjenerimin dhe krahasimin e thellësisë, shumëfishimin dhe përzierjen
Mbështetja e monitoruarMbështetje e integruar deri në katër monitorë të lidhur me ndërfaqet DUG LINK DVI, HDMI 2.0b dhe DisplayPort 1.2 (1.3 / 1.4 gati)

GeForce GTX 1060 specifikimet e kartës së referencës
ParametërVlerë
Shpeshtësia e bërthamës1506 (1708) MHz
Numri i procesorëve universal1280
Numri i blloqeve tekstuale80
Numri i blloqeve të gabuara48
Frekuenca efektive e kujtesës8000 (4 × 2000) MHz
Lloji i kujtesësGddr5
Autobusi i kujtesës.192-bits
Kujtesë6 gb
Bandwidth kujtesës192 GB / s
Performanca kompjuterike (FP32)rreth 4 teraflops.
Shpejtësia maksimale e teorikës72 gigapixel / me
Textures teorike të mostrave të mostrave121 gaologjiks / me
GomëPCI Express 3.0
LidhëseNjë lidhës DVI i dyfishtë, një HDMI dhe tre DisplayPort
Konsumi tipik i energjisë120 W.
Ushqim shtesëNjë lidhës 6-pin
Numri i lojërave elektronike të zëna në rastin e sistemit2
Çmimi i rekomanduar$ 249 ($ 299) në SHBA dhe 18,990 në Rusi

Karta Video GEFORCE GTX 1060 gjithashtu mori emrin e ngjashëm me të njëjtën zgjidhje nga seria e mëparshme e GeForce, e ndryshme nga emri i paraardhësit të tij të drejtpërdrejtë të GEFORCE GTX 960 vetëm një gjeneratë të ndryshuar me shifra të parë. Risi është bërë në linjën aktuale të kompanisë për të hedhur poshtë zgjidhjet e GeForce GTX 1070 të lëshuara më parë, e cila është shpejtësia mesatare në serinë e re.

Çmimet e rekomanduara për një kompani të re video Company NVIDIA janë $ 249 dhe $ 299 për versionet e zakonshme të partnerëve të kompanisë dhe për një edicion të veçantë të edicionit të themeluesit, respektivisht. Krahasuar me dy modele të larta, ky është një çmim shumë i favorshëm, pasi modeli i ri GTX 1060 është më pak inferior ndaj pagesave të larta, por jo aq sa është më e lirë. Në kohën e njoftimit, risi u bë e përkryer në aspektin e performancës në klasën e saj dhe një nga ofertat më fitimprurëse në këtë çmim.

Ky model i kartës video të familjes Nvidia të familjes Nvidia ka dalë për të kundërshtuar zgjidhjen më të fundit të kompanisë konkurruese AMD, e cila pak më herët lëshoi \u200b\u200btregun Radeon RX 480. Për të krahasuar romanin NVIDIA me këtë kartë video, edhe pse është Jo tërësisht të ndryshme, pasi ato janë ende shumë të ndryshme të ndryshme me çmim.. GeForce GTX 1060 është më e shtrenjtë ($ 249-299 kundrejt $ 199-229), por gjithashtu padyshim një konkurrent shpejt.

Procesori i GP106 grafik ka një autobus të memories 192-bit, kështu që sasia e kujtesës montuar në një kartë video me një gomë të tillë mund të jetë 3 ose 6 GB. Vlera e vogël në kushtet moderne është sinqerisht e mjaftueshme, dhe shumë projekte të lojërave edhe në rezolucion të plotë HD do të pushojnë në mungesën e kujtesës video, e cila do të ndikojë seriozisht në butësinë e paraqitjes. Për të siguruar performancën maksimale të një zgjidhjeje të re në mjedise të larta, modeli i kartës së GeForce GTX 1060 ishte i pajisur me 6 GB memorie video, e cila është e mjaftueshme për të filluar çdo aplikacion 3D me ndonjë cilësim të cilësisë. Për më tepër, sot nuk ka dallim në mes të 6 dhe 8 GB, dhe disa para do të kursejnë një zgjidhje të tillë.

Vlera e inovacionit tipik për risi është 120 W, e cila është më e vogël se vlera për GTX 1070 me 20% dhe të barabartë me konsumin e energjisë të kartës video të gjeneratës së mëparshme GeForce GTX 960, e cila ka shumë më pak performancë dhe aftësi. Bordi i referencës ka një grup të njohur të lidhjeve për bashkëngjitjen e pajisjeve të prodhimit të imazhit: një dual-link DVI, një HDMI dhe tre displaport. Për më tepër, u shfaqën versionet e reja të HDMI dhe Displayport, të cilat ne shkruam për modelin GTX 1080.

Gjatësia e tarifës së referencës GEFORCE GTX 1060 është 9.8 inç (25 cm), dhe nga dallimet nga opsionet e larta, theksojnë veçmas se GeForce GTX 1060 nuk e mbështet konfigurimin e renditjes së shumëfishtë të SLI dhe nuk ka një lidhje të veçantë për këtë. Meqenëse bordi konsumon më pak energji sesa modelet më të vjetra, atëherë një lidhës i furnizimit me energji 6-pin PCI-E u instalua në tarifë.

GeForce GTX 1060 karta video u shfaq në treg që nga shpallja e produkteve partnere të kompanisë: ASUS, EVGA, fitim, Gigabyte, Innovision 3D, MSI, Pali, ZOTAC. Një edicion special i edicionit të themeluesit të GeForce GTX 1060, të prodhuar nga NVIDIA, do të lirohet në një numër të kufizuar, i cili do të shitet me një çmim prej 299 dollarë ekskluzivisht në faqen e internetit të NVIDIA dhe zyrtarisht në Rusi do të prezantohet. Edicioni i themeluesit karakterizohet në atë që është bërë nga materiale dhe komponente me cilësi të lartë, duke përfshirë një rast alumini dhe përdor një sistem efikas të ftohjes, si dhe zinxhirë të furnizimit me energji të ulët dhe rregullatorë të veçantë të tensionit të dizajnit.

Ndryshime arkitektonike

Karta Video GEFORCE GTX 1060 bazohet në një procesor grafik të ri të modelit GP106, i cili nuk është funksionalisht i ndryshëm nga arkitektura Pascal, e parëlindur në formën e CHIP GP104, e cila përshkruan modelet e GeForce GTX 1080 dhe GTX 1070 të përshkruara më sipër. Kjo arkitekturë ka bazuar në zgjidhjet e përpunuara në maxwell, por ka disa dallime funksionale për të cilat kemi shkruar në detaje më parë.

GP106 video chip në pajisjen e saj është i ngjashëm me çipin e lartë Pascal dhe zgjidhjet e ngjashme të arkitekturës Maxwell, dhe ju mund të gjeni informacion të detajuar në lidhje me pajisjen moderne GPU në rishikimet tona të Nvidia. Ashtu si përpunuesit e mëparshëm të grafikëve, patate të skuqura e arkitekturës së re kanë një konfigurim të ndryshëm të grupit të grumbullimit të grupeve të përpunimit të grafikut, duke u transmetuar multirocessors streaming shumëprocessor (SM) dhe kontrollorët e kujtesës:

Procesori i GP106 i GP106 ka dy grupe GPC që përbëhen nga 10 multiprocesors streaming (streaming multiprocessor - SM), domethënë gjysma e GP104 ekzistuese. Ashtu si në GPU të lartë, secili prej shumëprocesorëve përmban 128 bërthamë informatikë, 8 blloqe TMU texture, 256 Kb regjistrohu kujtesën, 96 KB memorie të përbashkëta dhe 48 KB të cache të nivelit të parë. Si rezultat, GeForce GTX 1060 përmban një total prej 1280 module informatike dhe 80 module të strukturës - dy herë më të vogla se GTX 1080.

Por nënsistemi i kujtesës GEFORCE GTX 1060 nuk u trimmed nga përgjysmuar në krahasim me zgjidhjen e lartë, ajo përmban gjashtë kontrollues të memories 32-bit që japin një autobus të përgjithshëm të memories 192-bit. Me një frekuencë efektive të memories GDDR5-video për GeForce GTX 1060, të barabartë me 8 GHz, bandwidth arrin 192 GB / s, e cila është shumë e mirë për të zgjidhur këtë segment të çmimeve, veçanërisht duke pasur parasysh efikasitetin e lartë të përdorimit të saj në Pascal. Tetë nga ROP dhe 256 KB të blloqeve të nivelit të dytë të cache janë të lidhura me secilën prej kontrollorëve të kujtesës, prandaj, në përgjithësi, versioni i plotë i procesorit grafik GP106 përmban 48 blloqe të ROP dhe 1536 CB L2-cache.

Për të zvogëluar bandwidthin e kujtesës dhe përdorimin më efikas të Paskalit në dispozicion në arkitekturën Pascal, një kompresim intraceku i informacionit pa humbje është përmirësuar më tej, i cili është i aftë të kompresojë të dhënat në buffers, duke fituar një rritje të efikasitetit dhe performancës. Në veçanti, metodat e reja të kompresimit të deltës me një raport prej 4: 1 dhe 8: 1 u shtuan në patate të skuqura të familjes së re me një raport prej 4: 1 dhe 8: 1, duke siguruar një shtesë prej 20% në efektivitetin e PSP krahasuar me zgjidhjet e mëparshme të familjes Maxwell.

Shpeshtësia themelore e GPU-së së re është e barabartë me 1506 MHz - frekuenca nuk duhet të zbritet në parim nën këtë shenjë. Një frekuencë tipike turbo (Clock Boost) është shumë më e lartë dhe e barabartë me 1708 MHz është vlera mesatare e frekuencës reale në të cilën GEFORCE GTX 1060 Chip grafik po kandidon në një grup të madh të lojrave dhe aplikacioneve 3D. Frekuenca e vërtetë e rritjes varet nga loja dhe kushtet në të cilat testet e testuara.

Ashtu si pjesa tjetër e zgjidhjeve familjare Pascal, modeli GEFORCE GTX 1060 nuk punon vetëm në një frekuencë të lartë të orës, duke siguruar performancë të lartë, por ka një diferencë të mirë si overclocking. Eksperimentet e para flasin për mundësinë e arritjes së frekuencave të rendit të 2 GHz. Nuk është për t'u habitur që partnerët e kompanisë janë përgatitur duke përfshirë variantet e shpërndara në fabrikë të kartës video GTX 1060.

Pra, ndryshimi kryesor në arkitekturën e re ishte procesi teknologjik i 16 nm finfet, përdorimi i të cilit në prodhimin e GP106 bëri të mundur rritjen e ndjeshme të kompleksitetit të çipit duke ruajtur një zonë relativisht të ulët në 200 mm², kështu që kjo Arkitektura Pascal Chip ka një numër të dukshëm më të madh të blloqeve ekzekutive në krahasim me pozicionin Maxwell Chip të ngjashme të prodhuara duke përdorur procesin teknik prej 28 nm.

Nëse GM206 (GTX 960) me një sipërfaqe prej 227 mm² kishte nën 3 miliardë tranzistorë dhe 1024 ALU, 64 TMU, 32 ROP dhe një autobus 128-bit, atëherë GPU i ri tashmë ka akomoduar në 200 mm² tashmë 4.4 miliardë transistorë, 1280 ALU, 80 TMU dhe 48 ROP me një autobus 192-bit. Po, me pothuajse një herë e gjysmë me një frekuencë më të lartë: 1506 (1708) kundrejt 1126 (1178) MHz. Dhe kjo është me të njëjtën konsum të energjisë prej 120 W! Si rezultat, procesori grafik GP106 është bërë një nga përpunuesit grafikë më të efektshëm të energjisë, së bashku me GP104.

Teknologjitë e reja të NVIDIA

Një nga teknologjitë më interesante të kompanisë që mbështetet nga GeForce GTX 1060 dhe zgjidhjet e tjera të familjes Pascal është teknologjia. Nvidia multi-projektim i njëkohshëm. Ne kemi shkruar tashmë për këtë teknologji në shqyrtimin e GEFORCE GTX 1080, ju lejon të përdorni disa teknika të reja për të bërë optimizimin. Në veçanti, njëkohësisht projektimin e imazhit VR në të njëjtën kohë për dy sy, herë në kohë duke rritur efikasitetin e përdorimit të GPU në një realitet virtual.

Për të mbështetur SMP në të gjithë procesorët grafik, familja Pascal ka një motor të veçantë, i cili ndodhet në motor polimorfi në fund të transportuesit gjeometrik para njësisë së rasterizimit. Me ndihmën e tij, GPU mund të projektojë njëkohësisht një primitiv gjeometrik për disa parashikime nga një pikë, ndërsa këto parashikime mund të jenë stereo (i.e., deri në 16 ose 32 parashikime mbështeten në të njëjtën kohë). Kjo veçori lejon përpunuesit grafik Pascal të riprodhojnë me saktësi një sipërfaqe të lakuar për dhënien e VR, dhe gjithashtu të dalin në mënyrë korrekte imazhin në sistemet me shumë domucare.

Është e rëndësishme që teknologjia e njëkohshme me shumë projekt të jetë e integruar në motorët e lojërave popullore (motori joreal dhe unitet) dhe lojëra, dhe sot mbështetja e teknologjisë është thënë për më shumë se 30 ndeshje në zhvillim, duke përfshirë projekte të tilla të njohura si Turneu Unreal, Poolnation VR, VR Everest, OBDuction, adr1ft dhe të dhëna të papërpunuara. Interesante, megjithëse turneu joreal nuk është një lojë VR, por në të SMP përdoret për të arritur një pamje më të mirë dhe përmirësimin e produktivitetit.

Një tjetër teknologji e shumëpritur është bërë një mjet i fuqishëm për të krijuar screenshots në lojëra Nvidia ansel. Ky mjet ju lejon të krijoni screenshots të pazakonta dhe me cilësi të lartë nga lojërat, me aftësi të paarritshme, duke i mbajtur ato në rezolucion shumë të lartë dhe duke plotësuar efekte të ndryshme dhe për të ndarë veprat tuaja. Ansel ju lejon të ndërtoni një screenshot pasi artisti dëshiron të instalojë kamerën me çdo parametër në çdo pikë të skenës, të imponojë imazhin e filtrave të posaçëm të postës ose madje të bëni një pamje 360-shkallë për të parë në përkrenare virtuale të realitetit.

NVIDIA ka standardizuar integrimin e ndërfaqes së përdoruesit Ansel në lojë, dhe është shumë e thjeshtë për të shtuar në kodin e disa rreshtave. Ju nuk keni nevojë të prisni për paraqitjen e kësaj mundësi në lojëra, ju mund të vlerësoni aftësitë e Ansel tani në buzën e pasqyrë të lojës: katalizator, dhe pak më vonë do të jetë në dispozicion në Witcher 3: Gjueti i egër. Përveç kësaj, në zhvillimin ka shumë projekte të lojërave me mbështetje për Ansel, duke përfshirë lojëra të tilla si Fortnite, Paragon dhe Turneu Unreal, Pushtimi, Dëshmitari, Ligji, Divizioni i Tom Clancy, nuk ka qiellin e njeriut dhe të tjerët.

Gjithashtu një procesor i ri GeForce GTX 1060 mbështet paketën e mjeteve Nvidia vrworks.Zhvilluesit mbështetës për të krijuar projekte mbresëlënëse për realitetin virtual. Kjo paketë përfshin shumë shërbime dhe mjete për zhvilluesit, duke përfshirë Audio Vrworks, duke ju lejuar të kryeni një llogaritje shumë të saktë të reflektimeve të valëve të zërit nga objektet e skenës duke përdorur një rreze në GPU. Paketa gjithashtu përfshin integrimin në VR dhe efektet fizike fizike për të siguruar sjelljen fizikisht korrekte të objekteve në skenë.

Një nga lojërat virtuale më të ndritshme që kanë marrë një avantazh nga Vrworks u bë Funhouse VR - një lojë në realitetin virtual të vetë Nvidia, e cila është në dispozicion për pagesë në shërbimin e avullit të valvulave. Kjo lojë është e bazuar në motorin e motorit Unreal 4 (lojërat epike), dhe punon në kartat video GEFORCE GTX 1070, 1070 dhe 1060 në një pako me HTC VIVE helmeta. Për më tepër, kodi burimor i kësaj loje do të jetë në dispozicion të publikut, i cili do të lejojë zhvilluesit e tjerë të përdorin ide të gatshme dhe kodin tashmë në rides e tyre VR. Besoni për fjalën, kjo është një nga demonstratat më mbresëlënëse të mundësive të realitetit virtual.

Përfshirja e teknologjive SMP dhe Vrworks, përdorimi i procesorit grafik GEFORCE GTX 1060 në aplikacionet VR siguron produktivitet mjaft të mjaftueshëm për nivelin fillestar dhe GPU në fjalë korrespondon me nivelin minimal të kërkuar të harduerit, duke përfshirë Steamvr, duke u bërë një nga blerjet më të suksesshme Për përdorim në sistemet me mbështetjen zyrtare VR.

Meqenëse modeli GEFORCE GTX 1060 bazohet në një çip GP106, i cili nuk është inferior ndaj procesorit grafik GP104, i cili është bërë baza për modifikimet më të vjetra, ai mbështet absolutisht të gjitha teknologjitë e përshkruara nga ne më lart.

Karta GEFORCE GTX 1060 është bërë modeli i tretë në linjën e re të Nvidia, bazuar në procesorët grafik Pascal. Procesi i ri teknologjik prej 16 nm finfet dhe optimizimi i arkitekturës lejoi të gjitha kartat e reja video për të arritur një frekuencë të lartë orën dhe vendin në GPU blloqe më funksionale në formën e procesorëve streaming, moduleve tekstuale dhe të tjerëve, krahasuar me videot e patate të skuqura të gjenerata e mëparshme. Kjo është arsyeja pse modeli GTX 1060 është bërë zgjidhja më e dobishme dhe efikase për energji dhe në klasën e saj.

Është veçanërisht e rëndësishme që GEFORCE GTX 1060 ofron performancë dhe mbështetje mjaft të lartë për karakteristika të reja dhe algoritme me një çmim të konsiderueshëm më pak krahasuar me zgjidhjet më të vjetra në GP104. GP106 Graphics Chip përdoret në modelin e ri ofron performancën më të mirë dhe efikasitetin e energjisë në klasë. Modeli GEFORCE GTX 1060 është projektuar në mënyrë specifike dhe është e përkryer për të gjitha lojërat moderne në cilësimet e grafikut të lartë dhe maksimal në rezolucionin e 1920x1080 dhe madje edhe me zbutjen e ekranit të plotë me metoda të ndryshme (FXAA, MPAA ose MSAA).

Dhe për ata që duan të marrin një performancë edhe më të lartë në prani të shfaqjeve ultra të larta të rezolutës, NVIDIA ka modele të lartë GeForce GTX 1070 dhe GTX 1080 karta video, të cilat janë gjithashtu shumë të mira në aspektin e performancës dhe efikasitetit të energjisë. Megjithatë, kombinimi i çmimeve të ulëta dhe performanca e mjaftueshme është shumë e dallueshme nga GeForce GTX 1060 në sfondin e zgjidhjeve të larta. Krahasuar me Radeon RAX 480 konkurrues, zgjidhja NVIDIA është disi më e shpejtë me një kompleksitet më të vogël dhe zonë GPU, dhe ka një efikasitet më të mirë të energjisë. Vërtetë, ajo shitet disi më e shtrenjtë, kështu që çdo kartë video ka ngrohtë e vet.