การ์ดวิดีโอครอบครัว NVIDIA ข้อมูลพื้นหลัง GeForce ครอบครัวการ์ดวิดีโอ NVIDIA ข้อมูลพื้นฐาน GeForce การเปลี่ยนแปลงใน SLI หลายการแสดงผล

GPU Boost 2.0

ด้วยการ์ดวิดีโอ NVIDIA GeForce GTX 680 เราได้รับคุณสมบัติใหม่ที่สำคัญ: GPU Boost และ NVIDIA GeForce GTX ใหม่ของ NVIDIA GEFORCE ไปอีกขั้นหนึ่งโดยการขยายคุณสมบัตินี้ไปยังรุ่น GPU Boost 2.0 รุ่นแรกของ GPU Boost 1.0 มุ่งเน้นไปที่การใช้พลังงานสูงสุดที่ประสบความสำเร็จในเกมที่ทันสมัยที่สุด ในเวลาเดียวกันอุณหภูมิของ GPU ไม่ได้มีบทบาทพิเศษยกเว้นว่ามันใกล้เคียงกับเกณฑ์ที่สำคัญ ความถี่ของนาฬิกาสูงสุดถูกกำหนดขึ้นอยู่กับแรงดันสัมพัทธ์ ข้อเสียค่อนข้างชัดเจน: GPU Boost 1.0 ไม่สามารถป้องกันสถานการณ์เมื่อแม้จะมีความตึงเครียดที่ไม่สำคัญอุณหภูมิจะเพิ่มขึ้นมากเกินไป

NVIDIA GeForce GTX Titan - GPU-Boost 2.0

GeForce GTX Titan ได้ประเมินสองพารามิเตอร์แล้ว: แรงดันไฟฟ้าและอุณหภูมิ นั่นคือแรงดันไฟฟ้าแบบสัมพัทธ์ (VREF) ได้รับการพิจารณาแล้วตามข้อมูลพารามิเตอร์สองรายการแล้ว แน่นอนว่าการพึ่งพาอินสแตนซ์ของเกรดเฉลี่ยของแต่ละบุคคลจะดำเนินต่อไปเนื่องจากการแพร่กระจายในการผลิตชิปมีอยู่ดังนั้นการ์ดแต่ละการ์ดจะแตกต่างจากอื่น ๆ แต่ NVIDIA ระบุว่าอุณหภูมิของสารเติมแต่งในทางเทคนิคได้รับอนุญาตให้ให้การโอเวอร์คล็อกเพิ่มขึ้นเฉลี่ย 3-7 เปอร์เซ็นต์ เทคโนโลยี GPU Boost 2.0 สามารถถ่ายโอนไปยังการ์ดวิดีโอเก่าได้ในทางทฤษฎี แต่ไม่น่าจะเกิดขึ้น

NVIDIA GeForce GTX Titan - GPU-Boost 2.0

ให้ฉันพิจารณา GPU Boost 2.0 ในรายละเอียดเพิ่มเติม ยูทิลิตี้ที่คล้ายกับเครื่องมือความแม่นยำ EVGA หรือ MSI Afterburner ได้รับการสนับสนุนโดย GPU Boost 2.0 แล้ว เราใช้ยูทิลิตี้เครื่องมือความแม่นยำ EVGA ในเวอร์ชัน 4.0

NVIDIA GeForce GTX Titan - GPU-Boost 2.0

GPU Boost 2.0 คำนึงถึงอุณหภูมิและที่อุณหภูมิต่ำเทคโนโลยีสามารถเพิ่มประสิทธิภาพการผลิตได้มากขึ้น อุณหภูมิเป้าหมาย (ttarget) ตั้งอยู่ที่ 80 ° C

NVIDIA GeForce GTX Titan - GPU-Boost 2.0

เทคโนโลยี GPU Boost 2.0 มีฟังก์ชั่นทั้งหมดที่คุ้นเคยกับเราในรุ่นแรกของเทคโนโลยี แต่ในเวลาเดียวกันก็ทำให้สามารถตั้งค่าแรงดันไฟฟ้าที่สูงขึ้นดังนั้นและความถี่ของนาฬิกาที่สูงขึ้น สำหรับโอเวอร์คล็อกเกอร์เป็นไปได้ที่จะเปลี่ยนการตั้งค่า คุณสามารถเปิดใช้งาน GPU overvoltage แต่ควรจำไว้ว่าการลดลงของชีวิตของการ์ดวิดีโอ

NVIDIA GeForce GTX Titan - GPU-Boost 2.0

โอเวอร์คล็อกเกอร์สามารถเพิ่ม vref และ vmax (overvoltaging) สิ่งนี้ต้องการให้ผู้ใช้จำนวนมากใน GK104 แต่ NVIDIA ไม่ได้มอบความไว้วางใจให้กับผู้ใช้หรือผู้ผลิตรายใด และการ์ดแสดงผล EVGA GTX 680 ที่ผ่านการทดสอบโดย US เป็นเพียงตัวอย่างที่ยอดเยี่ยม การ์ดแสดงผลนี้มีโมดูล EVGA EVGA พิเศษที่ให้การควบคุมผู้ใช้มากกว่าแรงดันไฟฟ้า แต่ NVIDIA เรียกร้องอย่างเร่งด่วนว่า EVGA ลบอุปกรณ์เพิ่มเติมออกจากการ์ดวิดีโอของพวกเขา ในกรณีของ GPU Boost 2.0 และ Overvoltaging Nvidia ตัวเธอเองก้าวเข้ามาในทิศทางนี้ ดังนั้นผู้ผลิตการ์ดวิดีโอสามารถผลิตรุ่น GeForce GTX Titan หลายรุ่นเช่นรุ่นมาตรฐานและตัวเลือกที่มีการโอเวอร์คล็อกจากโรงงาน การเปิดใช้งานการ overvoltaging ดำเนินการผ่านสวิตช์ VBIOS (นั่นคืออย่างชัดเจนสำหรับผู้ใช้เพื่อให้ทราบถึงผลที่เป็นไปได้)

รีวิววิดีโอ NVIDIA GEFORCE GTX 780 | ประสบการณ์ GeForce และ Shadowplay

ประสบการณ์ GeForce

ในฐานะที่เป็นผู้ที่ชื่นชอบคอมพิวเตอร์เราขอขอบคุณการรวมกันของการตั้งค่าต่าง ๆ ที่มีผลต่อประสิทธิภาพและคุณภาพของเกม วิธีที่ง่ายที่สุดในการใช้จ่ายเงินจำนวนมาก การ์ดแสดงผลใหม่ และตั้งค่ากราฟิกทั้งหมดเป็นค่าสูงสุด แต่เมื่อพารามิเตอร์บางตัวกลายเป็นเรื่องหนักเกินไปสำหรับการ์ดและจะต้องลดหรือปิดใช้งานมันยังคงเป็นความรู้สึกที่ไม่พึงประสงค์และการรับรู้ว่าเกมสามารถทำงานได้ดีขึ้นมาก

อย่างไรก็ตามการตั้งค่าการตั้งค่าที่ดีที่สุดไม่ใช่เรื่องง่าย พารามิเตอร์บางตัวให้เอฟเฟ็กต์ภาพที่ดีกว่าคนอื่น ๆ ในขณะที่ระดับอิทธิพลต่อประสิทธิภาพสามารถเปลี่ยนแปลงได้อย่างมาก โปรแกรม GeForce Experience คือ NVIDIA พยายามที่จะทำให้การเลือกการตั้งค่าเกมง่ายขึ้นโดยการเปรียบเทียบ CPU, GPU และสิทธิ์ของคุณกับฐานข้อมูลการกำหนดค่า ส่วนที่สองของยูทิลิตี้ช่วยตรวจสอบว่าจำเป็นต้องมีการอัปเดตไดรเวอร์หรือไม่

อาจเป็นไปได้ที่ผู้ที่ชื่นชอบจะยังคงเลือกการตั้งค่าด้วยตนเองและการรับรู้ในเชิงลบ โปรแกรมเพิ่มเติม. อย่างไรก็ตามนักเล่นเกมส่วนใหญ่ต้องการติดตั้งเกมและเริ่มการเล่นเกมทันทีโดยไม่ต้องตรวจสอบไดรเวอร์และการค้นหาการตั้งค่าต่าง ๆ แน่นอนโอกาสนี้จะได้รับการซ่อมแซม ไม่ว่าในกรณีใดประสบการณ์ GeForce จาก NVIDIA ช่วยให้ผู้คนเพลิดเพลินไปกับเกมให้มากที่สุดและดังนั้นจึงเป็นยูทิลิตี้ที่มีประโยชน์สำหรับเกมพีซี

ประสบการณ์ GeForce ได้ระบุเกมทั้งเก้าเกมที่ติดตั้งในระบบทดสอบของเรา โดยปกติแล้วพวกเขาไม่ได้บันทึกการตั้งค่าเริ่มต้นเมื่อเราใช้การตั้งค่าบางอย่างในความสนใจของการทดสอบ แต่ก็ยังน่าสนใจว่าประสบการณ์ GeForce จะเปลี่ยนตัวเลือกที่เราเลือกได้อย่างไร

สำหรับ Tomb Raider ยูทิลิตี้ประสบการณ์ GeForce ต้องการปิดใช้งานเทคโนโลยี Tressfx แม้ว่า NVIDIA GeForce GTX 780 ด้วยฟังก์ชั่นที่เปิดใช้งานโดยเฉลี่ย 40 เฟรมต่อวินาทีแสดงให้เห็น ด้วยเหตุผลบางอย่างโปรแกรมไม่สามารถระบุการกำหนดค่าได้ ไกลร้องไห้ 3. แม้ว่าการตั้งค่าที่เสนอโดยมันกลายเป็นค่อนข้างสูง ด้วยเหตุผลที่ไม่รู้จักสำหรับ Skyrim ยูทิลิตี้ต้องการปิดใช้งาน FXAA

เป็นเรื่องดีที่ได้รับชุดของภาพหน้าจอสำหรับแต่ละเกมที่มีคำอธิบายของอิทธิพลของการตั้งค่าเฉพาะเกี่ยวกับคุณภาพของภาพ จากเก้าตัวอย่างของตัวอย่างของประสบการณ์ GeForce เข้าหาที่ดีที่สุดในความคิดเห็นของเราการตั้งค่าของเรา แม้ การปิดใช้งาน FXAA ใน Skyrim ไม่สมเหตุสมผลเลยเนื่องจากเกมโดยเฉลี่ยให้ 100 FPS เป็นไปได้ว่าผู้ที่ชื่นชอบจะต้องติดตั้งประสบการณ์ GeForce หลังจากการส่งมอบระบบโล่ NVIDIA จะเริ่มขึ้นเนื่องจากฟังก์ชั่นสตรีมมิ่งเกมดูเหมือนว่าจะใช้งานผ่านแอปพลิเคชัน NVIDIA

Shadowplay: บันทึกวิดีโอที่ใช้งานอยู่เสมอสำหรับเกม

คนรักว้าวมักเขียนจู่โจมของพวกเขา แต่ต้องใช้ระบบที่ค่อนข้างทรงพลัง Fraps และพื้นที่ดิสก์จำนวนมาก

เมื่อเร็ว ๆ นี้ NVIDIA ประกาศฟังก์ชั่น ShadowPlay ใหม่ซึ่งสามารถทำให้กระบวนการบันทึกง่ายขึ้นอย่างมีนัยสำคัญ

เมื่อเปิดใช้งาน ShadowPlay ให้ใช้ตัวถอดรหัส NVENC คงที่ที่สร้างขึ้นใน GPU Kepler ซึ่งจะบันทึกการเล่นเกม 20 นาทีล่าสุดโดยอัตโนมัติ ทั้งคุณสามารถเริ่มต้นและหยุด shadowplay ด้วยตนเอง ดังนั้นเทคโนโลยีจึงแทนที่โซลูชันซอฟต์แวร์เช่น Fraps ซึ่งให้ภาระที่สูงขึ้นบนโปรเซสเซอร์กลาง

สำหรับการอ้างอิง: NVENC ทำงานด้วยการเข้ารหัส H.264 ที่ความละเอียดเป็น 4096x4096 พิกเซล Shadowplay ยังไม่สามารถใช้งานได้ในตลาด แต่ NVIDIA ประกาศว่าเมื่อถึงเวลาที่เขาปรากฏตัวในช่วงฤดูร้อนนี้โปรแกรมจะสามารถบันทึกวิดีโอใน 1080p ด้วยความถี่เฟรมสูงสุดถึง 30 FPS เราต้องการที่จะเห็นการอนุญาตที่สูงขึ้นเพราะก่อนหน้านี้ระบุไว้ว่าตัวเข้ารหัสอาจสามารถรักษาไว้ในระดับฮาร์ดแวร์ได้

รีวิววิดีโอ NVIDIA GEFORCE GTX 780 | GPU Boost 2.0 และปัญหาที่เป็นไปได้กับการโอเวอร์คล็อก

GPU Boost 2.0

ในการตรวจสอบ GeForce GTX Titan เราไม่ได้ผลการทดสอบเต็มรูปแบบของรุ่นที่สอง NVIDIA GPU Boost Technology แต่ตอนนี้เธอได้รับ NVIDIA GeForce GTX 780 . นี่คือคำอธิบายเล็ก ๆ ของเทคโนโลยีนี้:

GPU Boost คือกลไก NVIDIA ที่เปลี่ยนประสิทธิภาพของการ์ดวิดีโอขึ้นอยู่กับประเภทของการประมวลผลงาน อย่างที่คุณทราบเกมมีข้อกำหนดต่าง ๆ สำหรับทรัพยากร GPU ในอดีตความถี่จะต้องปรับแต่งโดยคำนึงถึงสถานการณ์ที่เลวร้ายที่สุด แต่เมื่อประมวลผลงาน "ปอด" GPU ทำงานที่สูญเปล่า GPU Boost ติดตามพารามิเตอร์ต่างๆและเพิ่มขึ้นหรือลดความถี่ขึ้นอยู่กับความต้องการของแอปพลิเคชันและสถานการณ์ปัจจุบัน

การดำเนินการครั้งแรกของการเพิ่ม GPU ที่ทำงานภายใต้เกณฑ์พลังงานบางอย่าง (170 W ในกรณี GeForce GTX 680. อย่างไรก็ตามวิศวกรของ บริษัท พบว่าพวกเขาสามารถเกินระดับนี้ได้อย่างปลอดภัยหากอุณหภูมิโปรเซสเซอร์กราฟิกต่ำพอ ดังนั้นการผลิตสามารถเพิ่มประสิทธิภาพให้มากยิ่งขึ้น

ในทางปฏิบัติ GPU Boost 2.0 แตกต่างกันเพียงโดยความจริงที่ว่าตอนนี้ NVIDIA เร่งความถี่ขึ้นอยู่กับตัวบ่งชี้การใช้พลังงานมาก แต่ในอุณหภูมิที่แน่นอนซึ่งคือ 80 องศาเซลเซียส ซึ่งหมายความว่าจะใช้ค่าความถี่และแรงดันไฟฟ้าที่สูงขึ้นจนกว่าความร้อนของชิปจะสูงถึง 80 องศา อย่าลืมว่าอุณหภูมิส่วนใหญ่ขึ้นอยู่กับโปรไฟล์และการตั้งค่าของพัดลม: ยิ่งความเร็วสูงขึ้นอุณหภูมิและดังนั้นเหนือการเพิ่ม GPU (และระดับเสียงรบกวน แต่น่าเสียดายที่เช่นกัน) เทคโนโลยียังคงทำการประเมินสถานการณ์ครั้งเดียวใน 100 MS ดังนั้น NVIDIA จึงยังคงทำงานในรุ่นในอนาคต

การตั้งค่าอุณหภูมิขึ้นอยู่กับอุณหภูมิทำให้กระบวนการทดสอบมีความซับซ้อนเมื่อเทียบกับรุ่นแรกของ GPU Boost ทั้งหมดที่เพิ่มขึ้นหรือลดอุณหภูมิของ GK110 เปลี่ยนความถี่ของชิป ดังนั้นจึงค่อนข้างยากที่จะบรรลุผลลัพธ์ที่มั่นคงระหว่างการวิ่ง ในสภาพห้องปฏิบัติการเป็นไปได้ที่จะหวังเพียงสำหรับอุณหภูมิแวดล้อมที่มีเสถียรภาพเท่านั้น

นอกเหนือจากการเขียนข้างต้นมันเป็นที่น่าสังเกตว่าคุณสามารถเพิ่มมูลค่าอุณหภูมิ จำกัด ตัวอย่างเช่นถ้าคุณต้องการ NVIDIA GeForce GTX 780 ลดความถี่และแรงดันไฟฟ้าที่ 85 หรือ 90 องศาเซลเซียสสามารถกำหนดค่าในพารามิเตอร์

คุณต้องการ GK110 เท่าที่จะเป็นไปได้จากการ จำกัด อุณหภูมิที่คุณเลือกหรือไม่? โค้งแฟน NVIDIA GeForce GTX 780 ปรับได้อย่างเต็มที่ช่วยให้คุณกำหนดค่ารอบการทำงานตามค่าอุณหภูมิ

ปัญหาที่เป็นไปได้กับการเร่งความเร็ว

ในช่วงที่เรารู้จักกับ GeForce GTX Titan ผู้แทนของ บริษัท แสดงให้เราทราบถึงยูทิลิตี้ภายในที่สามารถอ่านเงื่อนไขของเซ็นเซอร์ต่าง ๆ ได้: ดังนั้นจึงช่วยลดความยุ่งยากในการวินิจฉัยพฤติกรรมของการ์ดที่ไม่ได้มาตรฐาน หากเมื่อโอเวอร์คล็อกอุณหภูมิของ GK110 จะสูงเกินไปแม้จะมีการบันทึกข้อมูลนี้จะถูกบันทึกในบันทึก

ตอนนี้ คุณสมบัตินี้ บริษัท ดำเนินการผ่านแอปพลิเคชันที่มีความแม่นยำ X ซึ่งเปิดตัวอัลกอริทึม "เหตุผล" เชิงป้องกันหากการกระทำที่รบกวนความต่อเนื่องที่มีประสิทธิภาพเกิดขึ้นระหว่างการเร่งความเร็ว นี่เป็นฟังก์ชั่นที่ยอดเยี่ยมเพราะคุณไม่จำเป็นต้องสร้างการเดาเกี่ยวกับ "สถานที่แคบ" ที่เป็นไปได้อีกต่อไป นอกจากนี้ยังมีตัวบ่งชี้ขีด จำกัด ของ OV MAX ซึ่งจะรู้ว่าคุณถึงจุดสูงสุดของแรงดันไฟฟ้าของ GPU หรือไม่ ในกรณีนี้มีความเสี่ยงต่อการเผาไหม้แผนที่ คุณสามารถดูเป็นข้อเสนอเพื่อลดพารามิเตอร์การโอเวอร์คล็อก

รีวิววิดีโอ NVIDIA GEFORCE GTX 780 | ทดสอบบูธและเกณฑ์มาตรฐาน


ทดสอบการกำหนดค่ายืน
ซีพียู Intel Core i7-3770K (Ivy Bridge) 3.5 GHz @ 4.0 GHz (40 * 100 MHz), LGA 1155, 8 MB ทั่วไปของ Cache L3, ไฮเปอร์เธรดในการประหยัดพลังงาน
เมนบอร์ด GIGABYTE Z77X-UD5H (LGA 1155), ชิปเซ็ต Z77 ด่วน, BIOS F15Q
แกะ G.Skill 16 GB (4 x 4 GB) DDR3-1600, F3-12800CL9Q2-32GBZL @ 9-9-9-24 โดย 1.5 v
อุปกรณ์เก็บข้อมูล Crucial M4 SSD 256 GB SATA 6 GB / S
วีดีโอการ์ด NVIDIA GeForce GTX 780 3 GB

AMD Radeon HD 7990 6 GB

AMD Radeon HD 7970 GHz Edition 3 GB

NVIDIA GeForce GTX 580 1.5 GB

NVIDIA GeForce GTX 680 2 GB

NVIDIA GeForce GTX Titan 6 GB

NVIDIA GeForce GTX 690 4 GB

แหล่งจ่ายไฟ Cooler Master UCP-1000 W
ซอฟต์แวร์ระบบและไดรเวอร์
ระบบปฏิบัติการ. Windows 8 มืออาชีพ 64 บิต
DirectX DirectX 11
กราฟ. คนขับรถ AMD Catalyst 13.5 (Beta 2)
NVIDIA GeForce รุ่น 320.00
NVIDIA GeForce รุ่น 320.18 (สำหรับ GeForce GTX 780)

เราได้รับค่าที่ถูกต้องของความถี่เปลี่ยนเฟรม

ผู้อ่านการสังเกตจะสังเกตเห็นว่าตัวบ่งชี้ในหน้าต่อไปนี้มีความสุภาพมากกว่าในการตรวจสอบ AMD Radeon HD 7990 และมีเหตุผลสำหรับมัน ก่อนหน้านี้เราเป็นตัวแทนของอัตราเฟรมสังเคราะห์และจริงแล้วแสดงให้เห็นถึงความผันผวนของเวลาระหว่างเฟรมพร้อมกับเฟรมที่ไม่ได้รับและสั้น ความจริงก็คือวิธีการดังกล่าวไม่ได้สะท้อนความรู้สึกที่แท้จริงจากการทำงานของการ์ดวิดีโอและในส่วนของเรามันจะไม่ยุติธรรมที่จะประณาม AMD ขึ้นอยู่กับอัตราการสังเคราะห์ล่าช้าระหว่างเฟรม

นั่นคือเหตุผลที่พร้อมกับความผันผวนของความถี่เฟรมตอนนี้เราให้ตัวบ่งชี้อัตราเฟรมในทางปฏิบัติมากขึ้นในพลวัต ผลลัพธ์นั้นไม่เกินราคา แต่ในเวลาเดียวกันพวกเขามีคารมคมคายมากในเกมที่ AMD มีปัญหา

การทดสอบและการตั้งค่า
Battlefield 3. คุณภาพกราฟิก - อัลตร้า, V-sync, 2560x1440, DirectX 11, การล่าสัตว์, 90s, fcat
ไกลร้องไห้ 3. กราฟิกคุณภาพ - Ultra, DirectX 11, V-sync ปิด, 2560x1440, วิ่งจ๊อกกิ้งในเส้นทางของคุณเอง, 50 วินาที, fcat
Borderlands 2. คุณภาพกราฟิก - สูงที่สุด Physx ต่ำ, การกรอง Anisotropic 16x, 2560x1440, ทำงานบนเส้นทางของคุณเอง, fcat
HITMAN: Absolution คุณภาพกราฟิก - อัลตร้า, MSAA, 2560x1440, เกณฑ์มาตรฐานในตัว, FCAT
The Elder Scrolls V: Skyrim คุณภาพกราฟิก - Ultra, FXAA เปิดใช้งาน, 2560x1440, วิ่งจ๊อกกิ้งในเส้นทางของคุณเอง, 25 วินาที, fcat
3DMark เกณฑ์มาตรฐานการโจมตีด้วยไฟ
BioShock Infinite กราฟิกคุณภาพ - Ultra, DirectX 11, ความลึกของการกระจายฟิลด์, 2560x1440, เกณฑ์มาตรฐานในตัว, FCAT
Crysis 3 คุณภาพกราฟิก - สูงมาก MSAA: ต่ำ (2x) ตำราความละเอียดสูง 2560x1440 วิ่งบนเส้นทางของคุณเอง 60 วินาที FCAT
Tomb Raider คุณภาพกราฟิก - Ultimate, FXAA บน, การกรอง anisotropic 16x, ผม Tressfx, 2560x1440, วิ่งจ๊อกกิ้งในเส้นทางของคุณเอง, 45 วินาที, FCAT
LuxMark 2.0 64 บิตไบนารีเวอร์ชัน 2.0 ศาลาฉาก
Sisoftware Sandra 2013 Professional Sandra Tech Support (วิศวกร) 2013.Sp1 การเข้ารหัสการวิเคราะห์ทางการเงิน


เนื้อหา
พารามิเตอร์ค่า
ชิปชื่อรหัสGP104
เทคโนโลยีการผลิต16 nm finfet
จำนวนทรานซิสเตอร์7.2 พันล้าน
นิวเคลียสสแควร์314 mm²
สถาปัตยกรรม
รองรับฮาร์ดแวร์ DirectX
บัสหน่วยความจำ
1607 (1733) MHz
บล็อกคอมพิวเตอร์20 การสตรีมมัลติโปรเซสเซอร์ประกอบด้วยสเกลาร์ ALUS 2560 สำหรับอัฒภาคลอยตัวภายในกรอบของมาตรฐาน IEEE 754-2008;
บล็อกพื้นผิว160 พื้นผิวที่อยู่และการกรองบล็อกที่มีการสนับสนุนคอมโพเนนต์ FP16 และ FP32 ในพื้นผิวและการสนับสนุนสำหรับการกรอง Trilinear และ Anisotropic สำหรับรูปแบบพื้นผิวทั้งหมด
รองรับการตรวจสอบ
ข้อมูลจำเพาะของการ์ดแสดงผล GeForce GTX 1080
พารามิเตอร์ค่า
ความถี่ของนิวเคลียส1607 (1733) MHz
2560
จำนวนบล็อกพื้นตา160
จำนวนบล็อกที่ทำผิดพลาด64
ความถี่หน่วยความจำที่มีประสิทธิภาพ10,000 (4 × 2500) MHz
ประเภทหน่วยความจำGDDR5X
บัสหน่วยความจำ256 บิต
หน่วยความจำ8 GB
320 gb / s
ประมาณ 9 teraflops
103 กิกพิกเซล / ด้วย
257 goldexels / ด้วย
ยางPCI Express 3.0
ตัวเชื่อมต่อ
การใช้พลังงานสูงถึง 180 วัตต์
อาหารเพิ่มเติมขั้วต่อ 8 พินหนึ่งตัว
2
แนะนำราคา$ 599-699 (USA), 54990 รูเบิล (รัสเซีย)

โมเดลการ์ด GeForce GTX 1080 GeForce GTX 1080 เป็นแนวทางเดียวสำหรับการแก้ปัญหาแรกของชุด GeForce ใหม่ - มันแตกต่างจากรุ่นก่อนโดยตรงเพียงรุ่นที่ดัดแปลง ความแปลกใหม่ไม่เพียงแค่เปลี่ยนโซลูชันยอดนิยมในบรรทัดปัจจุบันของ บริษัท แต่บางครั้งมันก็กลายเป็นเรือธงของซีรีส์ใหม่จนกระทั่งไททัน X เปิดตัวใน GPU พลังที่ยิ่งใหญ่กว่า รุ่น GeForce GTX 1070 ที่ประกาศอยู่แล้วยังอยู่ด้านล่างในลำดับชั้นตามรุ่นที่ตัดแต่งของชิป GP104 ซึ่งเราจะพิจารณาด้านล่าง

ราคาที่แนะนำสำหรับวิดีโอวันหยุดใหม่ NVIDIA คือ $ 599 และ $ 699 สำหรับรุ่นทั่วไปและรุ่นพิเศษของผู้ก่อตั้งรุ่น (ดูด้านล่าง) ตามลำดับและนี่เป็นประโยคที่ดีพอสมควรโดยคำนึงถึงความจริงที่ว่า GTX 1080 อยู่ข้างหน้า ไม่เพียง แต่ GTX 980 Ti เท่านั้น แต่ยังรวมถึงไททัน X ในวันนี้ความแปลกใหม่นั้นดีที่สุดในการดำเนินการโดยวิธีแก้ปัญหาในตลาดการ์ดวิดีโอชิปเดียวที่ไม่มีคำถามใด ๆ และในเวลาเดียวกันค่าใช้จ่ายราคาถูกกว่าการ์ดวิดีโอที่มีประสิทธิภาพมากที่สุด ของรุ่นก่อนหน้า ในขณะที่คู่แข่งจาก AMD จาก Geforce GTX 1080 เป็นจริงดังนั้น NVIDIA จึงสามารถสร้างราคาที่เหมาะสมกับพวกเขา

การ์ดแสดงผลที่อยู่ภายใต้การพิจารณาจะขึ้นอยู่กับชิป GP104 ซึ่งมีหน่วยความจำ 256 บิต แต่หน่วยความจำ GDDR5X ชนิดใหม่ทำงานในความถี่ที่มีประสิทธิภาพสูง 10 GHz ซึ่งให้แบนด์วิดธ์สูงสุดสูงใน 320 GB / C - ซึ่งเกือบจะอยู่ที่ระดับ GTX 980 TI จาก 384 -Bed Bus จำนวนของหน่วยความจำที่ติดตั้งบนการ์ดวิดีโอที่มีรถบัสดังกล่าวอาจเท่ากับ 4 หรือ 8 GB แต่มันจะโง่สำหรับการแก้ปัญหาที่ทรงพลังในสภาพที่ทันสมัยดังนั้น GTX 1080 จึงได้รับหน่วยความจำ 8 GB อย่างสมบูรณ์และปริมาตรนี้ ก็เพียงพอที่จะเริ่มแอปพลิเคชัน 3 มิติใด ๆ ด้วยการตั้งค่าคุณภาพใด ๆ เป็นเวลาหลายปีข้างหน้า

บอร์ดวงจรพิมพ์ GeForce GTX 1080 สำหรับเหตุผลที่ชัดเจนนั้นแตกต่างกันอย่างเหมาะสมจาก PCB ก่อนหน้าของ บริษัท มูลค่าของนวัตกรรมทั่วไปสำหรับความแปลกใหม่คือ 180 W - สูงกว่าของ GTX 980 เล็กน้อย แต่ต่ำกว่าไททัน X และ GTX 980 Ti ที่มีประสิทธิภาพน้อยกว่าเล็กน้อย บอร์ดอ้างอิงมีชุดเชื่อมต่อที่คุ้นเคยสำหรับการติดตั้งอุปกรณ์เอาต์พุตภาพ: DWI ลิงค์ DVI หนึ่งตัวหนึ่ง HDMI และสาม DisplayPort

Edition การออกแบบการออกแบบอ้างอิง

ประกาศของ GeForce GTX 1080 ที่จุดเริ่มต้นของเดือนพฤษภาคมการ์ดแสดงผลพิเศษที่เรียกว่า Founders Edition ได้รับการประกาศซึ่งมีราคาสูงกว่าเมื่อเทียบกับการ์ดวิดีโอทั่วไปของพันธมิตรของ บริษัท ในสาระสำคัญสิ่งพิมพ์นี้เป็นการ์ดออกแบบอ้างอิงและระบบระบายความร้อนและทำโดย NVIDIA คุณสามารถเชื่อมโยงแตกต่างกันกับการ์ดวิดีโอที่แตกต่างกัน แต่พัฒนาโดยวิศวกรของการออกแบบอ้างอิงของ บริษัท และการออกแบบที่ผลิตโดยใช้ส่วนประกอบคุณภาพสูงมีแฟน ๆ ของตัวเอง

แต่ไม่ว่าพวกเขาจะให้อีกสองสามพันรูเบิลสำหรับการ์ดวิดีโอจาก NVIDIA เอง - นี่เป็นคำถามคำตอบที่การฝึกฝนเท่านั้นที่สามารถให้ได้ ไม่ว่าในกรณีใด ๆ มันเป็นครั้งแรกที่ขายว่าการ์ดอ้างอิงจาก NVIDIA ในราคาที่เพิ่มขึ้นจะปรากฏขึ้นและไม่แตกต่างจากอะไรเลย - มันเกิดขึ้นกับการประกาศทุกครั้ง แต่การอ้างอิง GeForce GTX 1080 มีลักษณะเฉพาะในนั้น มีการวางแผนที่จะขายตลอดชีวิตตามเวลาจนถึงการเปิดตัวโซลูชันรุ่นต่อไป

NVIDIA เชื่อว่าสิ่งพิมพ์นี้มีข้อได้เปรียบก่อนผลงานที่ดีที่สุดของพันธมิตร ตัวอย่างเช่นการออกแบบสองแผ่นของเครื่องทำความเย็นช่วยให้คุณสามารถรวบรวมบนพื้นฐานของการ์ดวิดีโอที่ทรงพลังนี้ได้อย่างง่ายดายในฐานะพีซีเกมของปัจจัยรูปแบบที่ค่อนข้างเล็กเช่นเดียวกับระบบวิดีโอมัลติมิเฟย์ (แม้จะมีการทำงานที่ใช้งานฟรี ในโหมดสามและสี่ชั่วโมง) GeForce GTX 1080 Founders Edition มีข้อได้เปรียบบางอย่างในรูปแบบของเครื่องทำความเย็นที่มีประสิทธิภาพโดยใช้ห้องระเหยและพัดลมที่เปล่งอากาศร้อนจากเคส - นี่เป็นโซลูชัน NVIDIA ตัวแรกที่ใช้พลังงานน้อยกว่า 250 วัตต์

เมื่อเทียบกับการออกแบบอ้างอิงก่อนหน้าของผลิตภัณฑ์ของ บริษัท วงจรพลังงานได้รับการอัพเกรดด้วยสี่เฟสถึงห้าเฟส NVIDIA ยังพูดเกี่ยวกับส่วนประกอบที่ได้รับการปรับปรุงซึ่งมีความแปลกใหม่อยู่บนพื้นฐานการรบกวนทางไฟฟ้าก็ลดลงเพื่อปรับปรุงความเสถียรของแรงดันไฟฟ้าและศักยภาพการโอเวอร์คล็อก อันเป็นผลมาจากการปรับปรุงทั้งหมดประสิทธิภาพการใช้พลังงานของค่าธรรมเนียมอ้างอิงเพิ่มขึ้น 6% เมื่อเทียบกับ GeForce GTX 980

และเพื่อที่จะแตกต่างจากรุ่น "สามัญ" ของ GeForce GTX 1080 และภายนอกสำหรับ Edition ผู้ก่อตั้งพัฒนากรณี "สับ" ที่ผิดปกติ อย่างไรก็ตามอาจนำไปสู่ภาวะแทรกซ้อนของรูปร่างของห้องระเหยและหม้อน้ำ (ดูรูป) ซึ่งเป็นไปได้และทำหน้าที่เป็นหนึ่งในเหตุผลที่คิดค่าใช้จ่ายที่ $ 100 สำหรับรุ่นพิเศษดังกล่าว เราจะทำซ้ำที่จุดเริ่มต้นของการขายตัวเลือกพิเศษสำหรับผู้ซื้อจะไม่เป็น แต่ในอนาคตคุณสามารถเลือกทั้งทางออกที่มีการออกแบบของคุณเองจากหนึ่งในคู่ค้าของ บริษัท และดำเนินการโดย NVIDIA เอง

รุ่นใหม่ของสถาปัตยกรรมกราฟิก Pascal

การ์ดวิดีโอ GeForce GTX 1080 ได้กลายเป็นโซลูชันแรกของชิป GP104 ตามสถาปัตยกรรมกราฟิก NVIDIA รุ่นใหม่ - Pascal แม้ว่าสถาปัตยกรรมใหม่จะขึ้นอยู่กับการตัดสินใจทำงานใน Maxwell แต่ก็มีความแตกต่างในการทำงานที่สำคัญที่เราจะเขียนเกี่ยวกับ การเปลี่ยนแปลงหลักจากมุมมองทั่วโลกคือกระบวนการทางเทคโนโลยีใหม่ที่ดำเนินการโปรเซสเซอร์กราฟิกใหม่

การใช้กระบวนการทางเทคนิคของ FinFET 16 NM ในการผลิตหน่วยประมวลผลกราฟิก GP104 ที่โรงงาน TSMC TSMC ทำให้สามารถเพิ่มความซับซ้อนของชิปได้อย่างมีนัยสำคัญในขณะที่รักษาพื้นที่ที่ค่อนข้างต่ำและค่าใช้จ่าย เปรียบเทียบจำนวนทรานซิสเตอร์และพื้นที่ชิป GP104 และ GM204 - พวกเขาอยู่ใกล้ในพื้นที่ (คริสตัลของนวัตกรรมนั้นน้อยกว่าร่างกายน้อยกว่า) แต่ชิปสถาปัตยกรรมปาสคาลมีทรานซิสเตอร์มากขึ้นอย่างเห็นได้ชัดและสอดคล้องกับบล็อกผู้บริหาร รวมถึงการให้ฟังก์ชั่นใหม่

จากมุมมองทางสถาปัตยกรรม Pascal เกมแรกนั้นคล้ายกับโซลูชั่นที่คล้ายกันของสถาปัตยกรรม Maxwell แม้ว่าจะมีความแตกต่างบางอย่าง เช่น Maxwell, โปรเซสเซอร์ Pascal Architecture จะมีการกำหนดค่าคลัสเตอร์การประมวลผลกราฟิกที่แตกต่างกัน (GPC) การกำหนดค่าคลัสเตอร์การสตรีมม้วนมัลติโปรเซสเซอร์สตรีมมัวไหลมัลติโปรเซสเซอร์ (SM) และตัวควบคุมหน่วยความจำ SM MultiProcessor เป็นมัลติโปรเซสเซอร์แบบขนานที่มีแผนและรัน Warp (Warp กลุ่มของสตรีมคำสั่ง 32 ลำ) บน Cuda-Nuclei และบล็อกผู้บริหารอื่น ๆ ในมัลติโปรเซสเซอร์ ข้อมูลรายละเอียดบนอุปกรณ์ของบล็อกเหล่านี้ทั้งหมดที่คุณสามารถค้นหาได้ในบทวิจารณ์ของเราเกี่ยวกับ NVIDIA โซลูชันก่อนหน้า

เครื่องมัลติโปรเซสเซอร์แต่ละเครื่องจะถูกฉีดพ่นด้วยเครื่องยนต์เครื่องยนต์ Polymorph ซึ่งประมวลผลตัวอย่างเนื้อสัมผัสการเปลี่ยนแปลงการติดตั้งแอตทริบิวต์จุดสุดยอดและการแก้ไขมุมมอง ซึ่งแตกต่างจากโซลูชั่นก่อนหน้าของ บริษัท Polymorph Engine ในชิป GP104 ยังมีหน่วยมัลติโปรเจคชั่นหลายเครื่องใหม่พร้อมกันซึ่งเราจะพูดถึง การรวมกันของ SM Multiprocessor รวมกับเครื่องยนต์ Polymorph Engine แบบดั้งเดิมสำหรับ NVIDIA ที่เรียกว่าคลัสเตอร์โปรเซสเซอร์ TPC - พื้นผิว

ชิป GP104 ทั้งหมดใน GeForce GTX 1080 มีสี่กลุ่ม GPC และ 20 SM Multiprocessors รวมถึงตัวควบคุมหน่วยความจำแปดตัวรวมกับบล็อก ROP ในจำนวน 64 ชิ้น คลัสเตอร์ GPC แต่ละแห่งมีเอ็นจิ้นการกำหนดเส้นทางที่เฉพาะเจาะจงและมีมัลติโปรเซสเซอร์ห้าตัว ในทางกลับกันแต่ละเครื่องให้ประกอบด้วย 128 CUDA-CORES, 256 KB ของไฟล์ลงทะเบียน, หน่วยความจำที่ใช้ร่วมกัน 96 CB, 48 KB ของแคชระดับแรกและบล็อกพื้นผิว TMU แปดบล็อก นั่นคือทั้งหมด GP104 มี 2560 CUDA-CORES และ 160 TMU บล็อก

นอกจากนี้หน่วยประมวลผลกราฟิกซึ่งขึ้นอยู่กับการ์ดวิดีโอ GeForce GTX 1080 มีแปด 32 บิต (ซึ่งแตกต่างจากตัวควบคุมหน่วยความจำที่ใช้ก่อนหน้านี้ 64 บิตซึ่งช่วยให้เรามีบัสหน่วยความจำ 256 บิตสุดท้าย ตัวควบคุมหน่วยความจำแต่ละตัวถูกผูกติดอยู่กับแปด ROP และแคชระดับที่สอง 256 KB นั่นคือชิป GP104 ทั้งหมดมี 64 บล็อก ROP และแคชระดับสอง 2048 KB

ขอบคุณการเพิ่มประสิทธิภาพสถาปัตยกรรมและกระบวนการทางเทคนิคใหม่ Pascal เกมแรกได้กลายเป็นหน่วยประมวลผลกราฟิกที่ประหยัดพลังงานมากที่สุดตลอดกาล ยิ่งไปกว่านั้นการมีส่วนร่วมกับมันเป็นหนึ่งในกระบวนการทางเทคโนโลยีที่ทันสมัยที่สุดของ 16 NM FinFET และจากการเพิ่มประสิทธิภาพของสถาปัตยกรรมใน Pascal เมื่อเทียบกับ Maxwell NVIDIA สามารถเพิ่มความถี่ของนาฬิกาได้มากกว่าที่คำนวณเมื่อเปลี่ยนเป็นกระบวนการทางเทคนิคใหม่ GP104 ทำงานที่ความถี่ที่สูงกว่า GM204 สมมุติที่สูงขึ้นจะถูกปล่อยออกมาโดยใช้กระบวนการ 17 นาโนเมตร สำหรับสิ่งนี้วิศวกร NVIDIA ต้องตรวจสอบอย่างละเอียดและเพิ่มประสิทธิภาพคอขวดทั้งหมดของโซลูชันก่อนหน้านี้ไม่อนุญาตให้เร่งความเร็วสูงกว่าเกณฑ์ที่แน่นอน เป็นผลให้รุ่น GeForce GTX 1080 ใหม่ทำงานโดยความถี่ที่เพิ่มขึ้นมากกว่า 40% เมื่อเทียบกับ GeForce GTX 980 แต่นี่ไม่ใช่การเปลี่ยนแปลงทั้งหมดที่เกี่ยวข้องกับความถี่ของการทำงานของ GPU

GPU Boost 3.0 เทคโนโลยี

ในขณะที่เรารู้ดีตาม NVIDIA วิดีโอการ์ดในโปรเซสเซอร์กราฟิกของพวกเขาพวกเขาใช้เทคโนโลยีฮาร์ดแวร์ Boost GPU ที่มีวัตถุประสงค์เพื่อเพิ่มความถี่นาฬิกาการทำงานของ GPU ในโหมดเมื่อยังไม่ถึงขีด จำกัด การใช้พลังงานและการสร้างความร้อน ในช่วงปีที่ผ่านมาอัลกอริทึมนี้มีการเปลี่ยนแปลงมากมายและรุ่นที่สามของเทคโนโลยีนี้ใช้ไปแล้วในชิปวิดีโอสถาปัตยกรรมปาสคาล - GPU Boost 3.0 นวัตกรรมหลักที่ได้กลายเป็นการติดตั้งที่ละเอียดอ่อนมากขึ้นของความถี่เทอร์โบขึ้นอยู่กับ บนแรงดันไฟฟ้า

หากคุณจำหลักการของการทำงานของเทคโนโลยีรุ่นก่อนหน้านั้นความแตกต่างระหว่างความถี่พื้นฐาน (ค่าความถี่ต่ำสุดรับประกันต่ำกว่าซึ่ง GPU ไม่ตกอย่างน้อยในเกม) และความถี่เทอร์โบได้รับการแก้ไข นั่นคือความถี่เทอร์โบนั้นอยู่ในจำนวนที่แน่นอนของ Meghertz เหนือพื้นฐาน GPU Boost 3.0 มีความสามารถในการติดตั้งการกำจัดความถี่เทอร์โบสำหรับแต่ละแรงดันไฟฟ้าแยกต่างหาก วิธีที่ง่ายที่สุดในการเข้าใจถูกแสดงโดย:

ด้านซ้ายคือการเพิ่ม GPU ของรุ่นที่สองทางด้านขวา - ที่สามซึ่งปรากฏใน Pascal ความแตกต่างคงที่ระหว่างความถี่พื้นฐานและเทอร์โบไม่อนุญาตให้เปิดเผยความสามารถของ GPU อย่างสมบูรณ์ในบางกรณีโปรเซสเซอร์กราฟิกรุ่นก่อนหน้านี้สามารถทำงานได้เร็วขึ้นในแรงดันไฟฟ้าที่ติดตั้ง แต่ส่วนเกินของเทอร์โบที่กำหนดไม่อนุญาต . ใน GPU Boost 3.0 คุณสมบัตินี้ปรากฏขึ้นและสามารถติดตั้งความถี่เทอร์โบสำหรับแต่ละค่าแรงดันไฟฟ้าแต่ละอันบีบน้ำผลไม้ทั้งหมดจาก GPU อย่างสมบูรณ์

เพื่อควบคุมการเร่งความเร็วและสร้างเส้นโค้งความถี่เทอร์โบจำเป็นต้องใช้ระบบสาธารณูปโภคที่สะดวก NVIDIA เองไม่ได้ทำเช่นนี้ แต่ช่วยให้พันธมิตรสร้างระบบสาธารณูปโภคที่คล้ายกันเพื่อบรรเทาการโอเวอร์คล็อก (ภายในขอบเขตที่สมเหตุสมผลแน่นอน) ตัวอย่างเช่นฟังก์ชั่น GPU Boost 3.0 ใหม่ได้เปิดเผยอยู่ใน EVGA Precision Xoc ซึ่งรวมถึงสแกนเนอร์เร่งความเร็วพิเศษค้นหาและติดตั้งความแตกต่างแบบไม่เชิงเส้นระหว่างความถี่พื้นฐานและความถี่เทอร์โบสำหรับค่าแรงดันที่แตกต่างกันโดยใช้การเริ่มต้น การทดสอบประสิทธิภาพและความมั่นคง เป็นผลให้ผู้ใช้เปลี่ยนเส้นโค้งความถี่เทอร์โบซึ่งสอดคล้องกับความสามารถของชิปเฉพาะ ซึ่งนอกจากนี้คุณสามารถแก้ไขในโหมดแมนนวลได้อย่างใด

อย่างที่คุณเห็นบนหน้าจอของยูทิลิตี้นอกเหนือจากข้อมูลเกี่ยวกับ GPU และระบบยังมีการตั้งค่าสำหรับการโอเวอร์คล็อก: Power Target (กำหนดการใช้พลังงานทั่วไปในระหว่างการเร่งความเร็วเป็นเปอร์เซ็นต์ของมาตรฐาน) เป้าหมาย Temp GPU (อุณหภูมิเคอร์เนลที่อนุญาตสูงสุด), ออฟเซ็ตนาฬิกา GPU (เกินกว่าความถี่พื้นฐานสำหรับค่าแรงดันไฟฟ้าทั้งหมด), หน่วยความจำออฟเซ็ต (ความถี่หน่วยความจำวิดีโอเกินกว่าค่าเริ่มต้น), overvoltage (พลังงานเพิ่มเติมเพื่อเพิ่มแรงดันไฟฟ้า)

Utility Precision Xoc มีโหมดการเร่งความเร็วสามโหมด: พื้นฐานหลักเชิงเส้นเชิงเส้นและคู่มือด้วยตนเอง ในโหมดหลักคุณสามารถตั้งค่าความถี่ที่เกินความถี่ (ความถี่เทอร์โบคงที่) เหนือพื้นฐานเช่นเดียวกับ GPU ก่อนหน้านี้ โหมดเชิงเส้นช่วยให้คุณสามารถตั้งค่าการเปลี่ยนแปลงเชิงเส้นในความถี่จากค่าขั้นต่ำไปจนถึงค่าแรงดันสูงสุดสำหรับ GPU ในโหมดแมนนวลคุณสามารถตั้งค่าความถี่ GPU ที่ไม่ซ้ำกันสำหรับแต่ละจุดแรงดันไฟฟ้าบนกราฟ

เป็นส่วนหนึ่งของยูทิลิตี้ยังมีสแกนเนอร์พิเศษสำหรับการโอเวอร์คล็อกอัตโนมัติ คุณสามารถติดตั้งระดับความถี่ของคุณเองหรืออนุญาตให้ใช้ยูทิลิตี้ที่แม่นยำ xoc เพื่อสแกน GPU ในความเครียดทั้งหมดและค้นหาความถี่ที่เสถียรที่สุดสำหรับแต่ละจุดบนเส้นโค้งแรงดันไฟฟ้าและความถี่นั้นเต็มไปด้วยโดยอัตโนมัติ ในกระบวนการสแกนความแม่นยำ XOC ค่อยๆเพิ่มความถี่ของ GPU และตรวจสอบงานของมันเกี่ยวกับความเสถียรหรือลักษณะของสิ่งประดิษฐ์สร้างเส้นโค้งที่สมบูรณ์แบบของความถี่และความเครียดซึ่งจะเป็นเอกลักษณ์สำหรับแต่ละชิปเฉพาะ

สแกนเนอร์นี้สามารถกำหนดค่าภายใต้ข้อกำหนดของคุณเองการตั้งค่าเซ็กเมนต์เวลาของการทดสอบแต่ละค่าแรงดันไฟฟ้าขั้นต่ำและความถี่สูงสุดที่ตรวจสอบและขั้นตอน เป็นที่ชัดเจนว่าเพื่อให้บรรลุผลลัพธ์ที่มั่นคงมันจะดีกว่าที่จะตั้งค่าขั้นตอนเล็ก ๆ และระยะเวลาที่เหมาะสมของการทดสอบ ในกระบวนการทดสอบอุปกรณ์วิดีโอที่ไม่เสถียรและระบบสามารถเกิดขึ้นได้ แต่ถ้าสแกนเนอร์ไม่ได้ขึ้นอยู่กับมันจะเรียกคืนงานและค้นหาความถี่ที่ดีที่สุดต่อไป

ประเภทใหม่ของหน่วยความจำวิดีโอ GDDR5X และการบีบอัดที่ดีขึ้น

ดังนั้นพลังของตัวประมวลผลกราฟิกจึงเพิ่มขึ้นอย่างเห็นได้ชัดและรถบัสหน่วยความจำยังคงอยู่เพียง 256 บิต - จะไม่มีแบนด์วิดท์หน่วยความจำเพื่อ จำกัด ประสิทธิภาพโดยรวมและสิ่งที่สามารถทำได้? ดูเหมือนว่าหน่วยความจำ HBM ที่มีแนวโน้มของรุ่นที่สองยังคงผลิตมากเกินไปดังนั้นฉันจึงต้องมองหาตัวเลือกอื่น ๆ จากช่วงเวลาแห่งการถือกำเนิดของ GDDR5-Memory ในปี 2009 วิศวกร NVIDIA ตรวจสอบความเป็นไปได้ในการใช้หน่วยความจำประเภทใหม่ เป็นผลให้การพัฒนามาถึงการแนะนำมาตรฐานหน่วยความจำ GDDR5X ใหม่ - มาตรฐานที่ซับซ้อนและทันสมัยที่สุดซึ่งให้อัตราการถ่ายโอน 10 Gbps

NVIDIA นำตัวอย่างที่น่าสนใจว่ามันรวดเร็วแค่ไหน มีเพียง 100 picoseconds ระหว่างบิตที่ส่งผ่าน - ในช่วงเวลาดังกล่าวลำแสงแสงจะส่งผ่านระยะทางเพียงหนึ่งนิ้ว (ประมาณ 2.5 ซม.) และเมื่อใช้หน่วยความจำ GDDR5X โซ่การรับสัญญาณของการส่งข้อมูลจะต้องน้อยกว่าครึ่งของเวลานี้เลือกค่าของบิตที่ส่งผ่านก่อนที่จะส่งต่อไปก็เป็นเพียงที่คุณเข้าใจว่าเทคโนโลยีทันสมัยมาถึงอะไร

เพื่อให้ได้ความเร็วในการทำงานนี้จำเป็นต้องพัฒนาสถาปัตยกรรมใหม่ของระบบ I / O ของข้อมูลที่ต้องการหลายปีของการพัฒนาร่วมกับผู้ผลิตชิปหน่วยความจำ นอกเหนือจากอัตราการส่งข้อมูลที่เพิ่มขึ้นประสิทธิภาพการใช้พลังงานเพิ่มขึ้น - ชิปหน่วยความจำมาตรฐาน GDDR5X ใช้แรงดันไฟฟ้าที่ลดลงใน 1.35 V และผลิตตามเทคโนโลยีใหม่ซึ่งให้การใช้พลังงานเดียวกันที่ความถี่มากขึ้น 43%

วิศวกรของ บริษัท ต้องรีไซเคิลสายส่งข้อมูลระหว่างแกน GPU และชิปหน่วยความจำให้ความสำคัญกับการป้องกันการสูญเสียและการเสื่อมสภาพของสัญญาณตลอดหน่วยความจำจากหน่วยความจำไปยัง GPU และด้านหลัง ดังนั้นภาพประกอบข้างต้นแสดงสัญญาณที่ถ่ายในรูปแบบของ "Eye" สมมาตรขนาดใหญ่ซึ่งบ่งชี้การเพิ่มประสิทธิภาพที่ดีของโซ่ทั้งหมดและความสะดวกในการถ่ายภาพจากสัญญาณ นอกจากนี้การเปลี่ยนแปลงที่อธิบายไว้ข้างต้นได้นำไปสู่ความเป็นไปได้ในการใช้ GDDR5X ภายใน 10 GHz เท่านั้น แต่ยังควรช่วยให้ PSP สูงในผลิตภัณฑ์ในอนาคตโดยใช้หน่วยความจำ GDDR5 ที่คุ้นเคยมากขึ้น

ดีกว่า 40% ของการเพิ่มขึ้นของ PSP จากการประยุกต์ใช้หน่วยความจำใหม่ที่เราได้รับ แต่มันไม่เพียงพอเหรอ? เพื่อเพิ่มประสิทธิภาพในการใช้แบนด์วิดธ์หน่วยความจำใน NVIDIA ต่อไปเพื่อปรับปรุงข้อมูลขั้นสูงที่อยู่ในสถาปัตยกรรมก่อนหน้านี้ ระบบย่อยหน่วยความจำใน GeForce GTX 1080 ใช้เทคนิคที่ได้รับการปรับปรุงและใหม่สำหรับการบีบอัดข้อมูลโดยไม่สูญเสียออกแบบมาเพื่อลดความต้องการสำหรับ PSP - รุ่นที่สี่ของการบีบอัดของ intracePical

อัลกอริทึมสำหรับการบีบอัดข้อมูลในหน่วยความจำจะนำช่วงเวลาที่เป็นบวกมาหลายช่วงเวลาทันที การบีบอัดลดจำนวนข้อมูลที่บันทึกลงในหน่วยความจำเช่นเดียวกับข้อมูลที่ส่งจากหน่วยความจำวิดีโอไปยังหน่วยความจำแคชระดับที่สองซึ่งช่วยเพิ่มประสิทธิภาพในการใช้แคช L2 เนื่องจากกระเบื้องบีบอัด (บล็อกของพิกเซลหลายพิกเซล) มีขนาดที่เล็กกว่าที่ไม่มีการบีบอัด นอกจากนี้ยังลดปริมาณข้อมูลที่ส่งระหว่างจุดต่าง ๆ เช่นโมดูลพื้นผิว TMU และ Framebuffer

สายพานลำเลียงการบีบอัดข้อมูลใน GPU ใช้อัลกอริทึมหลายตัวซึ่งพิจารณาขึ้นอยู่กับ "การบีบอัด" ของข้อมูล - สำหรับพวกเขาที่ดีที่สุดของอัลกอริทึมที่มีอยู่จะถูกเลือก หนึ่งในที่สำคัญที่สุดคืออัลกอริทึมของการเข้ารหัสเดลต้าของข้อมูลสีพิกเซล (การบีบอัดสีเดลต้า) วิธีการบีบอัดนี้เข้ารหัสข้อมูลในรูปแบบของความแตกต่างระหว่างค่าตามลำดับแทนที่จะเป็นข้อมูลเอง GPU คำนวณความแตกต่างในค่าสีระหว่างพิกเซลในบล็อก (ไทล์) และบันทึกบล็อกเป็นสีเฉลี่ยบางอย่างสำหรับบล็อกทั้งหมดรวมถึงความแตกต่างของค่าสำหรับแต่ละพิกเซล สำหรับข้อมูลกราฟิกวิธีนี้มักจะเหมาะอย่างยิ่งเนื่องจากสีภายในกระเบื้องขนาดเล็กสำหรับพิกเซลทั้งหมดมักจะไม่แตกต่างกัน

หน่วยประมวลผลกราฟิก GP104 ซึ่งเป็นส่วนหนึ่งของ GeForce GTX 1080 รองรับอัลกอริธึมการบีบอัดมากขึ้นเมื่อเทียบกับชิปสถาปนิก Maxwell ก่อนหน้านี้ ดังนั้นอัลกอริทึมการบีบอัดที่ 2: 1 มีประสิทธิภาพมากขึ้นและนอกเหนือจากอัลกอริธึมใหม่สองตัวปรากฏขึ้น: โหมดการบีบอัด 4: 1 เหมาะสำหรับกรณีเมื่อความแตกต่างของสีของพิกเซลบล็อกมีขนาดเล็กมากและโหมดของ 8: 1 รวมการบีบอัดอัลกอริทึมคงที่ด้วยอัตราส่วน 4: 1 บล็อกของ 2 × 2 พิกเซลที่มีการบีบอัดสองเท่าของเดลต้าระหว่างบล็อก เมื่อการบีบอัดไม่เป็นไปไม่ได้อย่างสมบูรณ์มันไม่ได้ใช้

อย่างไรก็ตามในความเป็นจริงหลังไม่บ่อยนัก สิ่งนี้สามารถเห็นได้โดยตัวอย่างของภาพหน้าจอจากเกม Project Cars ซึ่งนำ NVIDIA ให้แสดงอัตราการบีบอัดที่เพิ่มขึ้นใน Pascal ในภาพประกอบของสีม่วงกระเบื้องบัฟเฟอร์บุคลากรเหล่านั้นถูกทาสีซึ่งสามารถบีบตัวประมวลผลกราฟิกและการบีบอัดแบบไม่สูญเสียยังคงอยู่กับสีเดิม (จากด้านบน - แม็กซ์เวลล์ด้านล่าง - ปาสกาล)

อย่างที่คุณเห็นอัลกอริทึมการบีบอัดใหม่ใน GP104 ทำงานได้ดีกว่าใน Maxwell จริงๆ แม้ว่าสถาปัตยกรรมเก่ายังสามารถบีบอัดกระเบื้องส่วนใหญ่ในที่เกิดเหตุหญ้าและต้นไม้จำนวนมากที่ขอบรวมถึงชิ้นส่วนของรถยนต์ไม่ได้สัมผัสกับอัลกอริทึมการบีบอัดที่ล้าสมัย แต่เมื่อคุณเปิดใช้งานเทคนิคใหม่ใน Pascal ภาพจำนวนเล็กน้อยของภาพที่ยังไม่ได้รับการบีบอัด - ประสิทธิภาพที่ดีขึ้นนั้นชัดเจน

อันเป็นผลมาจากการบีบอัดข้อมูลที่ปรับปรุงแล้ว GeForce GTX 1080 สามารถลดจำนวนข้อมูลที่ส่งในแต่ละเฟรมได้อย่างมีนัยสำคัญ หากเราพูดถึงตัวเลขการบีบอัดที่ปรับปรุงแล้วจะช่วยเพิ่มความสามารถเพิ่มเติมประมาณ 20% ของแบนด์วิดท์หน่วยความจำที่มีประสิทธิภาพ นอกเหนือจากมากกว่า 40% ของ PSP ที่เพิ่มขึ้นใน GeForce GTX 1080 เมื่อเทียบกับ GTX 980 จากการใช้หน่วยความจำ GDDR5X ทุกอย่างให้ประมาณ 70% ของการเพิ่มขึ้นของ PSP ที่มีประสิทธิภาพเมื่อเทียบกับรุ่นของรุ่นที่ผ่านมา .

Async คำนวณการสนับสนุนการคำนวณแบบอะซิงโครนัส

เกมที่ทันสมัยที่สุดใช้การคำนวณที่ซับซ้อนนอกเหนือจากกราฟิก ตัวอย่างเช่นการคำนวณในการคำนวณพฤติกรรมของร่างกายร่างกายไม่สามารถดำเนินการก่อนหรือหลังการคำนวณกราฟิก แต่พร้อมกันเนื่องจากพวกเขาไม่ได้เชื่อมต่อกันและไม่ได้ขึ้นอยู่กับซึ่งกันและกันภายในหนึ่งเฟรม นอกจากนี้ตัวอย่างสามารถรับหลังการประมวลผลบุคลากรและการประมวลผลข้อมูลเสียงซึ่งสามารถดำเนินการได้ควบคู่ไปกับการเรนเดอร์

อีกตัวอย่างที่ชัดเจนของการใช้งานคือการบิดเบือนเวลาแบบอะซิงโครนัส (เวลาแบบอะซิงโครนัส) ที่ใช้ในระบบความเป็นจริงเสมือนเพื่อเปลี่ยนเฟรมเอาต์พุตตามการเคลื่อนไหวของหัวของผู้เล่นโดยตรงก่อนที่จะส่งออกการแสดงผลของการเรนเดอร์ของการเรนเดอร์ต่อไป การโหลดความจุของ GPU แบบอะซิงโครนัสเช่นนี้ทำให้สามารถเพิ่มประสิทธิภาพในการใช้บล็อกผู้บริหารได้

โหลดดังกล่าวสร้างสถานการณ์การใช้ GPU ใหม่สองภาพ สิ่งแรกที่รวมถึงการดาวน์โหลดซ้อนทับเนื่องจากงานหลายประเภทไม่ใช้ความสามารถของโปรเซสเซอร์กราฟิกอย่างสมบูรณ์และเป็นส่วนหนึ่งของทรัพยากรที่ไม่ได้ใช้งาน ในกรณีเช่นนี้คุณสามารถเรียกใช้งานที่แตกต่างกันสองอย่างในหนึ่ง GPU แยกบล็อคผู้บริหารเพื่อรับการใช้งานที่มีประสิทธิภาพมากขึ้นเช่นเอฟเฟกต์ PhysX ที่ทำงานร่วมกับการแสดงเฟรม 3 มิติ

เพื่อปรับปรุงการทำงานของสถานการณ์สมมตินี้สมดุลโหลดแบบไดนามิกปรากฏในสถาปัตยกรรมปาสคาล (สมดุลโหลดแบบไดนามิก) ในสถาปัตยกรรม Maxwell ก่อนหน้านี้โหลดที่ทับซ้อนกันดำเนินการเป็นการกระจายแบบคงที่ของทรัพยากร GPU บนกราฟิกและการคำนวณ วิธีการนี้มีประสิทธิภาพโดยมีเงื่อนไขว่าความสมดุลระหว่างสองโหลดโดยประมาณนั้นสอดคล้องกับการแยกทรัพยากรและภารกิจดำเนินการตามเวลาเท่ากัน หากการคำนวณการเรียนรู้มีการดำเนินการที่ยาวกว่ากราฟิกและทั้งสองกำลังรอการทำงานโดยรวมเสร็จสิ้นแล้วส่วนหนึ่งของเวลาที่เหลือของ GPU จะยืนขึ้นซึ่งจะทำให้เกิดการเพิ่มผลผลิตโดยรวมและจะลดผลประโยชน์ทั้งหมด ฮาร์ดแวร์ Dynamic Load Balancing ยังช่วยให้คุณสามารถใช้ทรัพยากร GPU ที่วางจำหน่ายทันทีที่พร้อมใช้งาน - เพื่อทำความเข้าใจภาพประกอบ

นอกจากนี้ยังมีงานที่สำคัญโดยใช้เวลาดำเนินการและนี่คือสถานการณ์ที่สองของการคำนวณแบบอะซิงโครนัส ตัวอย่างเช่นการดำเนินการของอัลกอริทึมการบิดเบือนเวลาแบบอะซิงโครนัสใน VR ต้องเสร็จสมบูรณ์ก่อนการสแกน (สแกนออก) หรือกรอบจะถูกยกเลิก ในกรณีนี้ GPU จะต้องสนับสนุนการหยุดชะงักของงานที่รวดเร็วและเปลี่ยนเป็นอีกครั้งเพื่อลบงานที่สำคัญน้อยลงจากการดำเนินการใน GPU ปลดปล่อยทรัพยากรของงานที่สำคัญ - เรียกว่าการพรีเมิดต์

หนึ่งทีมการเรนเดอร์จากเกมเกมสามารถมีการโทรนับร้อยสำหรับฟังก์ชั่นการวาดการเรียกแต่ละครั้งการโทรในทางกลับกันมีสามเหลี่ยมแปรรูปหลายร้อยซึ่งแต่ละอันมีหลายร้อยพิกเซลที่ต้องคำนวณและปฏิเสธ ในแนวทางดั้งเดิม GPU ใช้การขัดจังหวะของงานที่ระดับสูงเท่านั้นและสายพานลำเลียงกราฟิกถูกบังคับให้รองานทั้งหมดนี้ก่อนที่จะเปลี่ยนงานซึ่งส่งผลให้เกิดความล่าช้ามาก

ในการแก้ไขมันสถาปัตยกรรม Pascal นำเสนอความสามารถในการขัดจังหวะงานในระดับพิกเซล - Pixel Level Premption บล็อกผู้บริหารของตัวประมวลผลกราฟิก Pascal สามารถติดตามความคืบหน้าของการแสดงผลการแสดงผลได้อย่างต่อเนื่องและเมื่อมีการร้องขอการขัดจังหวะพวกเขาสามารถหยุดการดำเนินการได้โดยการบันทึกบริบทเพื่อให้เสร็จสมบูรณ์เพิ่มเติมเปลี่ยนไปใช้งานอย่างรวดเร็ว

การขัดจังหวะและการสลับที่ระดับการไหลสำหรับการดำเนินการคำนวณคล้ายกับการหยุดชะงักในระดับพิกเซลสำหรับการคำนวณกราฟิก การคำนวณการคำนวณประกอบด้วยกริดหลายเส้นแต่ละอันมีเธรดมากมาย เมื่อได้รับคำขอขัดจังหวะกระแสที่ดำเนินการในมัลติโปรเซสเซอร์เสร็จสิ้นการดำเนินการ บล็อกอื่น ๆ รักษาสถานะของตัวเองเพื่อดำเนินการต่อจากช่วงเวลาเดียวกันในอนาคตและ GPU จะสลับไปยังงานอื่น กระบวนการสลับงานทั้งหมดใช้เวลาน้อยกว่า 100 ไมโครวินาทีหลังจากที่ดำเนินการไหลเสร็จสมบูรณ์

สำหรับการเล่นเกมการรวมกันของการขัดจังหวะในระดับพิกเซลสำหรับกราฟิกและขัดจังหวะที่ระดับการสตรีมสำหรับงานการคำนวณให้โปรเซสเซอร์กราฟิกของสถาปัตยกรรมปาสคาลที่มีความสามารถในการสลับระหว่างงานได้อย่างรวดเร็วด้วยการสูญเสียเวลาน้อยที่สุด และสำหรับการคำนวณงานบน CUDA มันเป็นไปได้ที่จะขัดจังหวะด้วยความละเอียดน้อยที่สุด - ในระดับการเรียนการสอน ในโหมดนี้สตรีมทั้งหมดหยุดการดำเนินการทันทีเปลี่ยนเป็นงานอื่นทันที วิธีการนี้ต้องการการบำรุงรักษาข้อมูลเพิ่มเติมเกี่ยวกับสถานะของการลงทะเบียนทั้งหมดของการไหลแต่ละครั้ง แต่ในบางกรณีของการคำนวณที่ไม่ใช่ความเศร้าโศกมันเป็นธรรมอย่างเต็มที่

การใช้งานการขัดจังหวะและการสลับอย่างรวดเร็วในงานกราฟิกและงานคอมพิวเตอร์ถูกเพิ่มเข้าไปในสถาปัตยกรรมปาสคาลเพื่อให้งานกราฟิกและไม่รู้หนังสือที่จะถูกขัดจังหวะในระดับของคำแนะนำของแต่ละบุคคลและไม่ใช่ทั้งลำธารเช่นเดียวกับที่อยู่ใน Maxwell และ Kepler เทคโนโลยีเหล่านี้สามารถปรับปรุงการดำเนินการแบบอะซิงโครนัสของโหลดต่าง ๆ บนโปรเซสเซอร์กราฟิกและปรับปรุงการตอบสนองในขณะที่ปฏิบัติงานหลายอย่างพร้อมกัน เหตุการณ์ NVIDIA แสดงให้เห็นถึงการสาธิตการคำนวณแบบอะซิงโครนัสเกี่ยวกับตัวอย่างของการคำนวณผลกระทบทางกายภาพ หากไม่มีการคำนวณแบบอะซิงโครนัสประสิทธิภาพอยู่ที่ 77-79 FPS จากนั้นด้วยการรวมความสามารถเหล่านี้อัตราเฟรมเพิ่มขึ้นเป็น 93-94 FPS

เราได้รับตัวอย่างของหนึ่งในความเป็นไปได้ที่จะใช้ฟังก์ชันการทำงานนี้ในเกมในรูปแบบของการบิดเบือนเวลาแบบอะซิงโครนัสใน VR ภาพประกอบแสดงให้เห็นถึงการทำงานของเทคโนโลยีนี้ด้วยการขัดจังหวะแบบดั้งเดิม (การแถลง) และรวดเร็ว ในกรณีแรกกระบวนการของการบิดเบือนเวลาแบบอะซิงโครนัสพยายามที่จะดำเนินการช้าที่สุดเท่าที่จะเป็นไปได้ แต่ก่อนที่จะอัปเดตภาพบนจอแสดงผล แต่การทำงานของอัลกอริทึมควรทำกับการดำเนินการหลายมิลลิวินาทีใน GPU ก่อนหน้านี้เนื่องจากไม่มีการขัดจังหวะอย่างรวดเร็วไม่สามารถทำงานได้อย่างถูกต้องในช่วงเวลาที่เหมาะสมและ GPU ไม่ได้ใช้งานในบางครั้ง

ในกรณีที่มีการหยุดชะงักที่ถูกต้องในระดับพิกเซลและกระแส (ในภาพประกอบด้านขวา) โอกาสดังกล่าวให้ความแม่นยำมากขึ้นในการกำหนดช่วงเวลาของการขัดจังหวะและการบิดเบือนเวลาแบบอะซิงโครนัสสามารถเปิดตัวได้อย่างมีนัยสำคัญในภายหลังด้วยความมั่นใจในการปิดเครื่องก่อน การอัพเดตข้อมูลบนจอแสดงผล และ GPU ยืนอยู่บางครั้งในกรณีแรกสามารถดาวน์โหลดงานกราฟิกเพิ่มเติมได้

เทคโนโลยี Multiprocessing พร้อมกันหลายฉาย

หน่วยประมวลผลกราฟิก GP104 ใหม่ปรากฏการสนับสนุนสำหรับเทคโนโลยี Multiprocessing ใหม่ (Multi-Projection พร้อมกัน - SMP) ซึ่งช่วยให้ GPU วาดข้อมูลในระบบเอาต์พุตภาพที่ทันสมัยได้อย่างมีประสิทธิภาพยิ่งขึ้น SMP อนุญาตให้คำสั่งวิดีโอแสดงข้อมูลในหลาย ๆ การคาดการณ์ซึ่งจำเป็นต้องป้อนบล็อกฮาร์ดแวร์ใหม่ใน GPU ลงในเครื่องยนต์ Polymorph ในตอนท้ายของลำเลียงเรขาคณิตต่อหน้าหน่วยการหมุนเวียน หน่วยนี้มีหน้าที่รับผิดชอบในการทำงานกับการคาดการณ์หลายตัวสำหรับสตรีมเรขาคณิตเดียว

เครื่องยนต์ Multiprocating ประมวลผลข้อมูลทางเรขาคณิตในเวลาเดียวกันสำหรับ 16 การคาดการณ์ที่มีการฉายภาพที่รวมถึงจุดฉายภาพ (กล้อง) การประมาณการเหล่านี้สามารถหมุนได้อย่างอิสระหรือเอียง เนื่องจากแต่ละเรขาคณิตดั้งเดิมอาจปรากฏขึ้นพร้อมกันในการประมาณการหลายเอ็นจิ้น SMP ให้ฟังก์ชั่นดังกล่าวอนุญาตให้แอปพลิเคชันให้คำสั่งวิดีโอเพื่อทำซ้ำรูปทรงเรขาคณิตถึง 32 ครั้ง (16 การฉายภาพที่สองศูนย์ฉายภาพ) โดยไม่มีการประมวลผลเพิ่มเติม

กระบวนการประมวลผลทั้งหมดจะเร่งความเร็วอย่างรวดเร็วและเนื่องจากทำงานหลายเครื่องหลังจากเครื่องยนต์เรขาคณิตไม่จำเป็นต้องทำซ้ำหลาย ๆ ครั้งทั้งหมดของการประมวลผลเรขาคณิต ทรัพยากรที่บันทึกไว้มีความสำคัญภายใต้เงื่อนไขการ จำกัด ความเร็วในการแสดงผลด้วยประสิทธิภาพการประมวลผลเรขาคณิตเช่น Tessellation เมื่องานเรขาคณิตเดียวกันดำเนินการหลายครั้งสำหรับการประมาณการแต่ละครั้ง ดังนั้นในกรณีสูงสุดการจัดสรรสามารถลดความต้องการการประมวลผลเรขาคณิตได้ถึง 32 เท่า

แต่ทำไมทุกอย่างถึงจำเป็น มีตัวอย่างที่ดีหลายอย่างที่เทคโนโลยี Multiprocessing จะมีประโยชน์ ตัวอย่างเช่นระบบหลาย domuclear ของจอแสดงผลสามจอที่ติดตั้งที่มุมซึ่งกันและกันใกล้เคียงกับผู้ใช้ (การกำหนดค่ารอบทิศทาง) ในสถานการณ์ทั่วไปฉากถูกวาดในหนึ่งการฉายภาพซึ่งนำไปสู่การบิดเบือนทางเรขาคณิตและการเรียกใช้รูปทรงเรขาคณิตที่ไม่ถูกต้อง วิธีที่ถูกต้องคือการประมาณการที่แตกต่างกันสามแบบสำหรับจอภาพแต่ละจอตามมุมที่พวกเขาอยู่

ด้วยความช่วยเหลือของการ์ดแสดงผลบนสถาปัตยกรรมปาสคาลสิ่งนี้สามารถทำได้ในรูปทรงเรขาคณิตหนึ่งครั้งซึ่งบ่งบอกถึงการประมาณการที่แตกต่างกันสามแบบสำหรับจอภาพ และผู้ใช้จะสามารถเปลี่ยนมุมที่จอภาพซึ่งตั้งอยู่ซึ่งกันและกันไม่เพียง แต่ร่างกาย แต่ยังสามารถเปลี่ยนการฉายภาพสำหรับจอภาพด้านข้างเพื่อให้ได้มุมมองที่ถูกต้องในฉาก 3 มิติด้วยมุมมองที่กว้างขึ้นอย่างน่าอัศจรรย์ (FOV) . TRUE มีข้อ จำกัด - สำหรับการสนับสนุนดังกล่าวแอปพลิเคชันควรสามารถวาดฉากกับ FOV แบบกว้างและใช้ SMP SMP พิเศษสำหรับการติดตั้ง นั่นคือในแต่ละเกมคุณจะไม่ทำเช่นนี้คุณต้องได้รับการสนับสนุนพิเศษ

ไม่ว่าในกรณีใดเวลาของการฉายภาพเดียวบนจอภาพแบนเพียงครั้งเดียวที่ผ่านไปตอนนี้การกำหนดค่าหลายองค์ประกอบหลายชิ้นและจอแสดงผลโค้งซึ่งสามารถใช้เทคโนโลยีนี้ได้ ไม่ต้องพูดถึงระบบเสมือนจริงที่ใช้เลนส์พิเศษระหว่างหน้าจอและสายตาของผู้ใช้ซึ่งต้องใช้เทคนิคใหม่สำหรับการฉายภาพ 3 มิติเป็นภาพ 2D เทคโนโลยีและเทคนิคเหล่านี้จำนวนมากยังคงอยู่ที่จุดเริ่มต้นของการพัฒนาสิ่งสำคัญคือ GPU เก่าไม่สามารถใช้การฉายภาพแบนได้อย่างมีประสิทธิภาพ สิ่งเหล่านี้ต้องการการแสดงผลหลายครั้งการรักษาซ้ำของเรขาคณิตเดียวกัน ฯลฯ

ชิปสถาปนิก Maxwell มีการสนับสนุนที่มีความละเอียดสูง จำกัด ที่ช่วยเพิ่มประสิทธิภาพ แต่ SMP ใน Pascal อาจมีมากขึ้น Maxwell สามารถหมุนประมาณการได้ 90 องศาสำหรับลูกบาศก์การ์ด (การทำแผนที่ลูกบาศก์) หรือใบอนุญาตต่าง ๆ สำหรับการฉาย แต่มันมีประโยชน์เฉพาะในวงกลมที่ จำกัด ของแอปพลิเคชันเช่น VXGI

จากแอปพลิเคชั่น SMP อื่น ๆ เราสังเกตเห็นภาพวาดที่มีความละเอียดที่แตกต่างกันและสเตอริโอเลตผ่านเดี่ยว ตัวอย่างเช่นการวาดภาพที่มีความละเอียดที่แตกต่างกัน (Multi-res Sheding) สามารถใช้ในเกมการเพิ่มประสิทธิภาพประสิทธิภาพ เมื่อใช้งานมีการใช้ความละเอียดที่สูงขึ้นในศูนย์กลางของเฟรมและบนอุปกรณ์ต่อพ่วงจะลดลงเพื่อให้ได้อัตราการแสดงผลที่สูงขึ้น

มีการใช้ Single-Pass In Stereorendering ใน VR มันได้ถูกเพิ่มลงในแพ็คเกจ VRWorks และใช้ความเป็นไปได้ของ Multiproycation เพื่อลดปริมาณงานทางเรขาคณิตที่ต้องการโดย VR Rendering ในกรณีของการใช้คุณสมบัตินี้หน่วยประมวลผลกราฟิก GeForce GTX 1080 จะประมวลผลเรขาคณิตฉากเพียงครั้งเดียวทำให้เกิดการประมาณสองครั้งในครั้งเดียวสำหรับแต่ละดวงตาซึ่งเพิ่มภาระทางเรขาคณิตใน GPU เป็นสองเท่าและยังช่วยลดการสูญเสียจากไดรเวอร์และระบบปฏิบัติการ .

วิธีการขั้นสูงของการปรับปรุงประสิทธิภาพของการเรนเดอร์ VR คือเลนส์ที่ตรงกับการแรเงาเมื่อบิดเบือนทางเรขาคณิตที่จำเป็นกับการเรนเดอร์ VR ถูกจำลองโดยใช้การฉายภาพหลายตัว วิธีนี้ใช้ multiprocating สำหรับการเรนเดอร์ของฉาก 3 มิติกับพื้นผิวซึ่งมีลักษณะคล้ายกับเลนส์ที่ปรับแล้วเมื่อวาดเพื่อส่งออกบน VR-Helmet ซึ่งช่วยให้ไม่สามารถวาดพิกเซลที่ไม่จำเป็นจำนวนมากในรอบนอกที่จะถูกยกเลิก มันง่ายที่สุดที่จะเข้าใจสาระสำคัญของวิธีการในภาพประกอบ - ด้านหน้าของแต่ละตามีการใช้การประมาณการที่ปรับใช้เพียงเล็กน้อย (Pascal) สำหรับการคาดการณ์ 16 แบบสำหรับแต่ละตา - เพื่อการเลียนแบบที่แม่นยำยิ่งขึ้นของเลนส์โค้ง) แทนที่จะเป็น หนึ่ง:

วิธีการดังกล่าวสามารถบันทึกอย่างเหมาะสมในการทำงาน ดังนั้นภาพทั่วไปสำหรับ Oculus Rift สำหรับแต่ละตาคือ 1.1 ล้านพิกเซล แต่เนื่องจากความแตกต่างของการคาดการณ์เพื่อให้ได้ภาพต้นฉบับจะใช้ใน 2.1 ล้านพิกเซล - ต้องการมากขึ้น 86%! การใช้งาน Multiprocessing ที่ฝังอยู่ในสถาปัตยกรรมปาสคาลช่วยให้สามารถลดความละเอียดของภาพที่วาดเป็น 1.4 ล้านพิกเซลโดยได้รับเงินออมหนึ่งและครึ่งทางที่อัตราการประมวลผลพิกเซลและยังช่วยประหยัดแบนด์วิดธ์หน่วยความจำ

และร่วมกับการออมที่สองในความเร็วในการประมวลผลของเรขาคณิตเนื่องจากการสเตอจารย์ที่ผ่านการส่งผ่านครั้งเดียวหน่วยประมวลผลกราฟิก GeForce GTX 1080 มีความสามารถในการเพิ่มประสิทธิภาพการแสดงผล VR ที่เพิ่มขึ้นอย่างมีนัยสำคัญและความเร็วในการประมวลผลเรขาคณิตและแม้กระทั่ง การประมวลผลพิกเซลมากขึ้น

การปรับปรุงในวิดีโอเอาท์พุทและบล็อกการประมวลผล

นอกเหนือจากประสิทธิภาพการทำงานและฟังก์ชั่นใหม่ที่เกี่ยวข้องกับการเรนเดอร์ 3 มิติมีความจำเป็นต้องรักษาระดับที่ดีและความเป็นไปได้ของการส่งออกภาพรวมถึงการถอดรหัสและการเข้ารหัสข้อมูลวิดีโอ และตัวประมวลผลกราฟิกแรกของสถาปัตยกรรม Pascal ไม่ทำให้ผิดหวัง - รองรับทุกอย่าง มาตรฐานที่ทันสมัย ในแง่นี้รวมถึงการถอดรหัสฮาร์ดแวร์ของรูปแบบ HEVC ที่จำเป็นในการดูวิดีโอ 4K บนพีซี นอกจากนี้เจ้าของวิดีโอการ์ด GeForce GTX 1080 จะสามารถเพลิดเพลินกับการเล่นวิดีโอสตรีมมิ่ง 4K จาก Netflix และผู้ให้บริการอื่น ๆ ในระบบของพวกเขาได้อย่างรวดเร็ว

จากมุมมองของเอาต์พุตภาพบนจอแสดงผล GeForce GTX 1080 รองรับ HDMI 2.0B ด้วย HDCP 2.2 เช่นเดียวกับ DisplayPort จนถึงปัจจุบันรุ่นของ DP 1.2 ได้รับการรับรอง แต่ GPU พร้อมสำหรับการรับรองมาตรฐานที่ใหม่กว่า: DP 1.3 พร้อมและ DP 1.4 พร้อม หลังช่วยให้คุณแสดงภาพหน้าจอ 4K ที่ความถี่ต่ออายุ 120 Hz และที่ 5K- และ 8K-Displays - ที่ 60 Hz เมื่อใช้ DisplayPort 1.3 Cable Pair หากสำหรับ GTX 980 ความละเอียดสูงสุดที่รองรับคือ 5120 × 3200 ที่ 60 Hz จากนั้นสำหรับรุ่น GTX 1080 ใหม่มันเพิ่มขึ้นเป็น 7680 × 4320 ด้วย 60 Hz เดียวกัน การอ้างอิง GeForce GTX 1080 มีเอาต์พุต DisplayPort สามตัวหนึ่ง HDMI 2.0B และ DIGITAL Dual-Link DVI

รุ่นใหม่ NVIDIA Video Card ยังได้รับการปรับปรุงหน่วยการถอดรหัสวิดีโอและการเข้ารหัสข้อมูลวิดีโอ ดังนั้นชิป GP104 ให้สอดคล้องกับมาตรฐานสูงของ PlayReady 3.0 (SL3000) เพื่อเล่นวิดีโอสตรีมมิ่งช่วยให้คุณมั่นใจได้ว่าการเล่นเนื้อหาที่มีคุณภาพสูงจากซัพพลายเออร์ที่รู้จักกันดีเช่น Netflix จะมีคุณภาพสูงและประหยัดพลังงาน รายละเอียดเกี่ยวกับการสนับสนุนรูปแบบวิดีโอต่าง ๆ เมื่อการเข้ารหัสและการถอดรหัสแสดงอยู่ในตารางความแปลกใหม่นั้นแตกต่างจากโซลูชั่นก่อนหน้านี้อย่างชัดเจนสำหรับดีกว่า:

แต่ความแปลกใหม่ที่น่าสนใจยิ่งกว่านั้นสามารถเรียกว่าการสนับสนุนสำหรับการแสดงช่วงไดนามิกที่เรียกว่าสูง (ช่วงไดนามิกสูง - HDR) ซึ่งกำลังจะแพร่กระจายในตลาด ทีวีขายแล้วในปี 2559 (และในเวลาเพียงหนึ่งปีมีการวางแผนที่จะขาย HDR-TV สี่ล้านรายการ) และจอภาพมีดังนี้ HDR เป็นความก้าวหน้าที่ยิ่งใหญ่ที่สุดในเทคโนโลยีการแสดงผลเป็นเวลาหลายปีรูปแบบนี้มีเฉดสีเป็นสองเท่า (75% ของสเปกตรัมที่มองเห็นได้ซึ่งแตกต่างจาก 33% สำหรับ RGB) จอแสดงผลที่สว่างมากขึ้น (1000 nit) ที่มีความคมชัดมากขึ้น (10,000: 1) และ สีอิ่มตัว

การปรากฏตัวของการสืบพันธุ์ของเนื้อหาที่มีความแตกต่างในความสว่างและสีสันที่อุดมไปด้วยและสีที่อุดมไปด้วยจะนำภาพบนหน้าจอไปสู่ความเป็นจริงสีดำจะกลายเป็นลึกความสว่างที่สดใสจะตาบอดเช่นเดียวกับในโลกแห่งความเป็นจริง ดังนั้นผู้ใช้จะเห็นรายละเอียดเพิ่มเติมในภาพที่สว่างและมืดของภาพเมื่อเทียบกับจอภาพมาตรฐานและทีวี

เพื่อรองรับการแสดง HDR, GeForce GTX 1080 มีทุกสิ่งที่คุณต้องการ - ความสามารถในการส่งออกสี 12 บิตรองรับมาตรฐาน BT.2020 และ SMPTE 2084 เช่นเดียวกับเอาต์พุตภาพตาม HDMI 2.0B 10/12 บิตสำหรับ HDR ในความละเอียด 4K ซึ่งเป็นและ Maxwell นอกจากนี้ Pascal ยังสนับสนุนการถอดรหัสรูปแบบ HEVC ความละเอียด 4K ด้วยสี 60 Hz และ 10 หรือ 12 บิตซึ่งใช้สำหรับวิดีโอ HDR รวมถึงการเข้ารหัสรูปแบบเดียวกันกับพารามิเตอร์เดียวกัน แต่เฉพาะใน 10 บิตเพื่อบันทึกวิดีโอ HDR หรือการสตรีม นอกจากนี้ความแปลกใหม่ยังพร้อมที่จะสร้างมาตรฐาน DisplayPort 1.4 เพื่อส่งข้อมูล HDR สำหรับตัวเชื่อมต่อนี้

โดยวิธีการเข้ารหัสวิดีโอ HDR อาจจำเป็นในอนาคตเพื่อส่งข้อมูลดังกล่าวจากพีซีที่บ้านไปยังคอนโซลเกมโล่ซึ่งสามารถเล่น HEVC 10 บิต นั่นคือผู้ใช้จะสามารถถ่ายทอดเกมด้วยพีซีในรูปแบบ HDR หยุดและสถานที่ที่จะพาเกมกับการสนับสนุนดังกล่าว? NVIDIA ทำงานร่วมกับนักพัฒนาเกมอย่างต่อเนื่องเพื่อใช้การสนับสนุนดังกล่าวผ่านทุกสิ่งที่คุณต้องการ (การสนับสนุนในไดรเวอร์ตัวอย่างโค้ด ฯลฯ ) สำหรับการเรนเดอร์ที่ถูกต้องของภาพ HDR ที่เข้ากันได้กับจอแสดงผลที่มีอยู่

ในช่วงเวลาของการเปิดตัวของการ์ดวิดีโอ GeForce GTX 1080 การสนับสนุนเอาท์พุต HDR มีเกมดังกล่าวเป็นการ obduction พยานกฎหมายการเพิ่มขึ้นของ Tomb Raider, Paragon, Talos Principle และ Shadow Warrior 2. แต่ในใกล้ ในอนาคตคาดว่าจะเติมรายการนี้.

การเปลี่ยนแปลงในการแสดงผล SLI หลายครั้ง

นอกจากนี้ยังมีการเปลี่ยนแปลงบางอย่างที่เกี่ยวข้องกับเทคโนโลยีองค์กรของ SLI การเรนเดอร์หลายครั้งแม้ว่าจะไม่มีใครคาดหวัง SLI ถูกใช้โดยผู้ที่ชื่นชอบเกม PC-Games เพื่อเพิ่มประสิทธิภาพหรือค่าสูงสุดการตั้งค่าการ์ดชิปเดียวที่ทรงพลังที่สุดใน Tandem หรือเพื่อให้ได้อัตราเฟรมที่สูงมาก จำกัด การ จำกัด สองสามระดับ โซลูชั่นซึ่งบางครั้งค่าใช้จ่ายราคาถูกกว่าหนึ่งอันดับแรก (การตัดสินใจเป็นที่ถกเถียงกัน แต่ทำ) หากมีจอภาพ 4K ผู้เล่นแทบจะไม่มีตัวเลือกอื่น ๆ ยกเว้นการติดตั้งคู่ป่าวคู่เนื่องจากแม้แต่รุ่นยอดนิยมมักจะไม่สามารถให้เกมที่สะดวกสบายในการตั้งค่าสูงสุดในเงื่อนไขดังกล่าว

หนึ่งในองค์ประกอบที่สำคัญของ NVIDIA SLI คือ Bridges เชื่อมต่อการ์ดวิดีโอเป็นเครื่องส่งสัญญาณวิดีโอทั่วไปและพนักงานในการจัดระเบียบช่องสัญญาณส่งข้อมูลดิจิตอลระหว่างพวกเขา บนการ์ดวิดีโอ GeForce เชื่อมต่อ SLI แบบคู่ถูกติดตั้งแบบดั้งเดิมซึ่งทำหน้าที่เชื่อมต่อระหว่างการ์ดวิดีโอสองหรือสี่ใบในการกำหนดค่า SLI ที่ 3 และ 4 ทาง การ์ดวิดีโอแต่ละใบควรเชื่อมต่อกันกับแต่ละการ์ดเนื่องจาก GPU ทั้งหมดส่งเฟรมเข้าสู่ตัวประมวลผลกราฟิกหลักจึงจำเป็นต้องใช้อินเทอร์เฟซสองตัวในแต่ละบอร์ด

เริ่มต้นจากรุ่น GeForce GTX 1080 สำหรับการ์ดวิดีโอ NVIDIA ทั้งหมดตามสถาปัตยกรรมปาสคาลอินเตอร์เฟส SLI สองอินเทอร์เฟซเชื่อมต่อกันเพื่อเพิ่มประสิทธิภาพการส่งข้อมูลระหว่างการ์ดวิดีโอและโหมด SLI สองช่องทางใหม่ช่วยให้คุณสามารถปรับปรุงประสิทธิภาพการผลิตและ ความสะดวกสบายเมื่อแสดงข้อมูลภาพบนจอแสดงผลความละเอียดสูงหรือระบบหลายคอมโพเนนต์

สำหรับโหมดดังกล่าวสะพานใหม่ที่เรียกว่า SLI HB ต้องการ พวกเขารวมการ์ดวิดีโอ GeForce GTX 1080 คู่หนึ่งในหนึ่งในสองช่อง SLI แม้ว่าการ์ดวิดีโอใหม่จะเข้ากันได้กับสะพานเก่า สำหรับความละเอียด 1920 × 1080 พิกเซลที่ความถี่ของการอัพเดท 60 Hz คุณสามารถใช้สะพานมาตรฐาน แต่ในโหมดที่ต้องการมากขึ้น (4K, 5K และระบบมัลติมิเตอร์) ผลลัพธ์ที่ดีที่สุดในการเปลี่ยนเฟรมที่ราบรื่นจะให้เท่านั้น สะพานใหม่แม้ว่าเก่าจะทำงาน แต่ค่อนข้างแย่กว่านั้น

นอกจากนี้เมื่อใช้ SLI HB Bridges อินเตอร์เฟสการส่งข้อมูล GeForce GTX 1080 ทำงานที่ 650 MHz เมื่อเทียบกับ 400 MHz ในสะพาน SLI แบบดั้งเดิมบน GPU เก่า ยิ่งไปกว่านั้นสำหรับสะพานเก่าที่เข้มงวดบางอย่างความถี่ที่สูงขึ้นของการส่งข้อมูลกับชิปวิดีโอของสถาปัตยกรรมปาสคาลก็มีอยู่ ด้วยอัตราการส่งข้อมูลที่เพิ่มขึ้นระหว่าง GPU บนอินเตอร์เฟส SLI คู่ที่มีความถี่ทำงานที่เพิ่มขึ้นเอาต์พุตเฟรมที่ราบรื่นมีให้กับหน้าจอเมื่อเทียบกับโซลูชันก่อนหน้านี้:

นอกจากนี้ยังควรสังเกตว่าการสนับสนุนการเรนเดอร์หลายครั้งใน DirectX 12 ค่อนข้างแตกต่างจากสิ่งที่คุ้นเคยก่อนหน้านี้ ที่ รุ่นล่าสุด กราฟิก API microsoft การเปลี่ยนแปลงจำนวนมากที่เกี่ยวข้องกับการทำงานของระบบวิดีโอดังกล่าว สำหรับนักพัฒนาซอฟต์แวร์ใน DX12 สองตัวเลือกสำหรับการใช้ GPU หลายตัวพร้อมใช้งาน: Multi Display Adapter (MDA) โหมดและอะแดปเตอร์แสดงผลที่เชื่อมโยง (LDA)

นอกจากนี้โหมด LDA มีสองรูปแบบ: ปริมาตร LDA (ซึ่ง NVIDIA ใช้สำหรับ SLI) และ LDA ที่ชัดเจน (เมื่อนักพัฒนาเกมถือว่างานของการจัดการงานการจัดการการแสดงผล MDA และโหมด LDA ที่ชัดเจนที่จะนำไปใช้ใน DirectX 12 เพื่อให้ นักพัฒนาเกมมีอิสระมากขึ้นและโอกาสเมื่อใช้ระบบวิดีโอมัลติมิเตอร์ความแตกต่างระหว่างโหมดนั้นชัดเจนต่อตารางต่อไปนี้อย่างชัดเจน:

ในโหมด LDA หน่วยความจำ GPU แต่ละหน่วยอาจเชื่อมโยงกับหน่วยความจำของวัตถุอื่นและแสดงในรูปแบบของปริมาณรวมขนาดใหญ่ตามธรรมชาติด้วยข้อ จำกัด ประสิทธิภาพทั้งหมดเมื่อข้อมูลไปจากหน่วยความจำของคนอื่น ในโหมด MDA หน่วยความจำ GPU แต่ละหน่วยงานแยกต่างหากและ GPU ที่แตกต่างกันไม่สามารถเข้าถึงข้อมูลโดยตรงจากหน่วยความจำของโปรเซสเซอร์กราฟิกอื่น โหมด LDA ถูกออกแบบมาสำหรับระบบที่มีความบริสุทธิ์ที่คล้ายคลึงกันของประสิทธิภาพที่คล้ายกันและโหมด MDA มีข้อ จำกัด น้อยลงและ GPU ที่ไม่ต่อเนื่องและแบบรวมด้วยโซลูชันที่ไม่ต่อเนื่องกับชิปของผู้ผลิตที่แตกต่างกันสามารถทำงานร่วมกันได้ แต่โหมดนี้ยังต้องการให้นักพัฒนาความสนใจและทำงานมากขึ้นเมื่อการเขียนโปรแกรมการทำงานร่วมกันเพื่อให้ GPU แลกเปลี่ยนข้อมูลซึ่งกันและกัน

ตามค่าเริ่มต้นระบบ SLI ที่ใช้บอร์ด GeForce GTX 1080 รองรับเพียงสอง GPU เท่านั้นและการกำหนดค่าขนาดสามและสี่ขนาดไม่แนะนำอย่างเป็นทางการสำหรับการใช้งานเช่นเดียวกับในเกมที่ทันสมัยมันจะกลายเป็นเรื่องยากมากขึ้นเพื่อให้ได้ผลผลิตเพิ่มขึ้นจากการเพิ่ม หน่วยประมวลผลกราฟิกที่สามและสี่ ตัวอย่างเช่นเกมมากมายที่เหลืออยู่ในโอกาส หน่วยประมวลผลกลาง ระบบเมื่อทำงานกับระบบวิดีโอแบบหลายประเภทเทคนิคชั่วคราว (ชั่วคราว) ที่ใช้ข้อมูลจากเฟรมก่อนหน้านี้ใช้ในเกมใหม่มากขึ้นซึ่งการดำเนินงานที่มีประสิทธิภาพของ GPU หลายตัวเป็นไปไม่ได้

อย่างไรก็ตามการทำงานของระบบในระบบมัลติมีเดียอื่น ๆ (ไม่ใช่ SLI) ยังคงเป็นไปได้เนื่องจากโหมด MDA หรือ LDA ที่ชัดเจนในระบบ SLI DirectX 12 หรือสองประเภทที่มี GPU ที่สามเฉพาะสำหรับผลกระทบทางกายภาพของ PhysX แต่สิ่งที่เกี่ยวกับบันทึกในเกณฑ์มาตรฐานจริงๆใน Nvidia ปฏิเสธพวกเขาเลยเหรอ? ไม่แน่นอน แต่เนื่องจากระบบดังกล่าวอยู่ในความต้องการในโลกเกือบทุกหน่วยงานของผู้ใช้จากนั้นสำหรับอุลตรัลซิตี้ดังกล่าวพวกเขามาพร้อมกับกุญแจพิเศษของคีย์ที่ชื่นชอบซึ่งสามารถดาวน์โหลดได้บนเว็บไซต์ NVIDIA และปลดล็อกโอกาสนี้ ในการทำเช่นนี้คุณต้องได้รับตัวระบุ GPU ที่ไม่ซ้ำกันโดยเรียกใช้แอปพลิเคชันพิเศษจากนั้นขอคีย์ที่ชื่นชอบในเว็บไซต์และดาวน์โหลดให้ตั้งค่าคีย์ไปยังระบบปลดล็อคการกำหนดค่า SLI ที่ 3 และ 4 ทาง

เทคโนโลยีการซิงโครไนซ์ซิงค์อย่างรวดเร็ว

การเปลี่ยนแปลงบางอย่างเกิดขึ้นในเทคโนโลยีการซิงโครไนซ์เมื่อแสดงข้อมูลบนจอแสดงผล คะแนนไปข้างหน้าไม่มีอะไรใหม่ที่ไม่ปรากฏใน G-Sync เนื่องจากไม่รองรับเทคโนโลยีการซิงโครไนซ์แบบปรับตัวแบบปรับตัวแบบปรับตัว แต่ใน NVIDIA ตัดสินใจที่จะปรับปรุงความราบรื่นของการส่งออกและการซิงโครไนซ์สำหรับเกมที่แสดงประสิทธิภาพสูงมากเมื่ออัตราเฟรมเกินอัตราการอัพเดทจอภาพอย่างมีนัยสำคัญ สิ่งนี้สำคัญอย่างยิ่งสำหรับเกมที่ต้องใช้ความล่าช้าน้อยที่สุดและการตอบสนองอย่างรวดเร็วและการต่อสู้และการแข่งขันที่มีผู้เล่นหลายคน

Fast Sync เป็นทางเลือกใหม่ในการซิงโครไนซ์แนวตั้งซึ่งไม่มีสิ่งประดิษฐ์ที่มองเห็นในรูปแบบของการแบ่งภาพบนภาพและไม่ได้เชื่อมโยงกับความถี่การอัพเดทคงที่ซึ่งจะเพิ่มความล่าช้า ปัญหาของการซิงโครไนซ์แนวตั้งในเกมคืออะไรเช่น Counter-Strike: ที่น่ารังเกียจทั่วโลก? เกมนี้เกี่ยวกับ GPU ที่ทันสมัยที่ทรงพลังทำงานได้หลายร้อยเฟรมต่อวินาทีและผู้เล่นมีตัวเลือก: รวมถึงการซิงโครไนซ์แนวตั้งหรือไม่

ในเกมที่มีผู้เล่นหลายคนผู้ใช้มักจะไล่ล่าความล่าช้าน้อยที่สุดและ vsync ตัดการเชื่อมต่อ, รับช่องว่างที่มองเห็นได้ดีในภาพที่ไม่พึงประสงค์อย่างยิ่งและอัตราเฟรมสูง หากคุณรวมการซิงโครไนซ์แนวตั้งผู้เล่นจะได้รับการเพิ่มความล่าช้าอย่างมีนัยสำคัญระหว่างการกระทำและภาพบนหน้าจอเมื่อสายพานลำเลียงกราฟิกช้าลงไปที่ความถี่การอัพเดทจอภาพ

ดังนั้นสายพานลำเลียงแบบดั้งเดิม แต่ NVIDIA ตัดสินใจที่จะแบ่งกระบวนการแสดงผลและแสดงภาพไปยังหน้าจอโดยใช้เทคโนโลยีการซิงค์ที่รวดเร็ว สิ่งนี้ช่วยให้คุณทำงานที่มีประสิทธิภาพมากที่สุดสำหรับส่วนของ GPU ซึ่งมีส่วนร่วมในการแสดงเฟรมที่ความเร็วเต็มในขณะที่การบำรุงรักษาเฟรมเหล่านี้ในบัฟเฟอร์ชั่วคราวที่เรนเดอร์ที่เรนเดอร์พิเศษ

วิธีนี้ช่วยให้คุณเปลี่ยนวิธีเอาท์พุทไปยังหน้าจอและใช้เวลาที่ดีที่สุดจาก vsync บนและ vsync ปิดโหมดโดยรับความล่าช้าต่ำ แต่ไม่มีสิ่งประดิษฐ์ภาพ ด้วยการซิงค์ที่รวดเร็วไม่มีการควบคุมเฟรมเอ็นจิ้นเกมทำงานในโหมดโหมดการซิงโครไนซ์และไม่ได้บอกว่าจะรอการวาดภาพของต่อไปดังนั้นความล่าช้าจึงต่ำที่สุดเท่าที่โหมด VSYNC ปิด แต่เนื่องจากการซิงค์เร็วจะเลือกบัฟเฟอร์เพื่อส่งออกไปยังหน้าจอและแสดงเฟรมทั้งหมดจากนั้นไม่มีการแบ่งภาพ

เมื่อทำงานซิงค์อย่างรวดเร็วมีการใช้บัฟเฟอร์สามตัวสามตัวแรกที่ใช้ในลักษณะเดียวกับการบัฟเฟอร์สองเท่าในสายพานลำเลียงแบบคลาสสิก บัฟเฟอร์หลัก (บัฟเฟอร์ด้านหน้า - FB) เป็นบัฟเฟอร์ข้อมูลที่ปรากฏบนหน้าจอแสดงผลเต็มรูปแบบ บัฟเฟอร์รอง (Back Buffer - BB) เป็นบัฟเฟอร์ที่มาพร้อมกับข้อมูลระหว่างการเรนเดอร์

เมื่อใช้การซิงโครไนซ์แนวตั้งภายใต้สภาวะกรอบสูงเกมกำลังรอช่วงเวลาของการอัปเดตข้อมูลบนจอแสดงผล (ช่วงรีเฟรช) เพื่อสลับบัฟเฟอร์หลักด้วยรองเพื่อแสดงภาพชิ้นเดียวบนหน้าจอ สิ่งนี้ทำให้กระบวนการช้าลงและเพิ่มบัฟเฟอร์เพิ่มเติมเช่นเดียวกับการบัฟเฟอร์สามแบบดั้งเดิมเท่านั้นเพิ่มความล่าช้า

ด้วยการใช้การซิงค์อย่างรวดเร็วบัฟเฟอร์บัฟเฟอร์ที่แสดงผลสุดท้ายที่สาม (LRB) ซึ่งใช้ในการจัดเก็บเฟรมทั้งหมดซึ่งเพิ่งได้รับการเรนเดอร์ในบัฟเฟอร์รอง ชื่อบัฟเฟอร์พูดด้วยตัวเองมันมีสำเนาของเฟรมที่วาดใหม่ล่าสุด และเมื่อช่วงเวลาของการอัปเดตบัฟเฟอร์หลักจะมาบัฟเฟอร์ LRB นี้จะถูกคัดลอกไปยังหลักทั้งหมดและไม่ได้อยู่ในชิ้นส่วนตั้งแต่ทุติยภูมิเมื่อการซิงโครไนซ์แนวตั้งถูกปิด เนื่องจากข้อมูลการคัดลอกจากบัฟเฟอร์นั้นไม่มีประสิทธิภาพพวกเขาเพียงแค่เปลี่ยนสถานที่ (หรือเปลี่ยนชื่อเนื่องจากจะสะดวกกว่าที่จะเข้าใจ) และสถานที่ตรรกะการเปลี่ยนบัฟเฟอร์ใหม่ที่ปรากฏใน GP104 จัดการกระบวนการนี้

ในทางปฏิบัติการรวมวิธีการซิงโครไนซ์การซิงค์เร็วใหม่ให้ความล่าช้าเล็กน้อยเล็กน้อยเมื่อเทียบกับการซิงโครไนซ์แนวตั้งปิดการใช้งานอย่างสมบูรณ์ - โดยเฉลี่ย 8 ms มากขึ้น แต่แสดงเฟรมบนจอภาพทั้งหมดโดยไม่มีสิ่งประดิษฐ์ที่ไม่พึงประสงค์บนหน้าจอที่ฉีกขาด ภาพ. วิธีการใหม่สามารถเปิดใช้งานได้จากการตั้งค่ากราฟิกของแผงควบคุม NVIDIA ในส่วนการควบคุมการซิงโครไนซ์แนวตั้ง อย่างไรก็ตามค่าเริ่มต้นคือการจัดการของแอปพลิเคชันและการซิงค์ที่รวดเร็วไม่จำเป็นต้องใช้ในแอปพลิเคชัน 3D ทั้งหมดมันจะดีกว่าไม่จำเป็นต้องเลือกวิธีนี้สำหรับเกม FPS สูงโดยเฉพาะ

เทคโนโลยีเสมือนจริง NVIDIA VRWORKS

เราได้ส่งผลกระทบต่อหัวข้อที่ร้อนแรงของความเป็นจริงเสมือนจริงในบทความ แต่ส่วนใหญ่เกี่ยวกับการเพิ่มความถี่ของบุคลากรและให้ความล่าช้าต่ำสำคัญมากสำหรับ VR ทั้งหมดนี้มีความสำคัญมากและความคืบหน้าอยู่ที่นั่นจริงๆ แต่จนถึงตอนนี้เกม VR มองไกลจากเกม 3 มิติที่ทันสมัย \u200b\u200b"ธรรมดา" ที่ดีที่สุด ดังนั้นจึงปรากฎว่าไม่เพียงเพราะการใช้งาน VR นักพัฒนาเกมชั้นนำไม่ได้มีส่วนร่วมเป็นพิเศษ แต่ยังเป็นเพราะความต้องการ VR ที่มากขึ้นสำหรับอัตราเฟรมซึ่งไม่อนุญาตให้มีเทคนิคปกติหลายอย่างในเกมดังกล่าวเนื่องจากความต้องการสูง

เพื่อลดความแตกต่างในคุณภาพระหว่างเกม VR และสามัญ NVIDIA ตัดสินใจที่จะปล่อยแพคเกจทั้งหมดของเทคโนโลยี VRWorks ที่เกี่ยวข้องซึ่งรวมถึง API จำนวนมากห้องสมุดเครื่องยนต์และเทคโนโลยีที่ให้การปรับปรุงคุณภาพและประสิทธิภาพอย่างมีนัยสำคัญ VR- แอปพลิเคชัน. วิธีนี้ใช้กับการประกาศของโซลูชันเกมแรกใน Pascal ได้อย่างไร มันง่ายมาก - เทคโนโลยีบางอย่างได้แนะนำให้รู้จักกับการเพิ่มผลผลิตและปรับปรุงคุณภาพและเราได้เขียนเกี่ยวกับพวกเขาแล้ว

และถึงแม้ว่ามันจะมาถึงกราฟิกไม่เพียง แต่บอกฉันเล็กน้อยเกี่ยวกับเรื่องนี้ ชุดเทคโนโลยีกราฟิก VRWorks รวมถึงเทคโนโลยีที่กล่าวถึงก่อนหน้านี้เช่นการแรเงาเลนส์ที่ตรงกับการใช้ความเป็นไปได้ที่มีความเป็นไปได้ที่ปรากฏใน GeForce GTX 1080 ความแปลกใหม่ช่วยให้คุณได้รับผลผลิตเพิ่มขึ้น 1.5-2 เท่าของการตัดสินใจที่ไม่มี สนับสนุน. นอกจากนี้เรายังกล่าวถึงเทคโนโลยีอื่น ๆ เช่นการแรเงา MultiLes ซึ่งมีไว้สำหรับการแสดงผลด้วยความละเอียดที่แตกต่างกันในศูนย์กลางของเฟรมและบนรอบนอก

แต่สิ่งที่คาดไม่ถึงมากขึ้นคือการประกาศเทคโนโลยี VRWorks Audio ออกแบบมาสำหรับ CCD ข้อมูลลำโพงคุณภาพสูงในฉาก 3 มิติที่สำคัญโดยเฉพาะอย่างยิ่งในระบบเสมือนจริง ในเครื่องยนต์ธรรมดาการวางตำแหน่งแหล่งเสียงในสภาพแวดล้อมเสมือนนั้นถูกคำนวณค่อนข้างอย่างถูกต้องหากศัตรูยิงถูกต้องแล้วเสียงดังขึ้นจากด้านนี้ของระบบเสียงและการคำนวณนี้ไม่ได้เรียกร้องเกินไปสำหรับกำลังคอมพิวเตอร์

แต่ในความเป็นจริงเสียงไม่เพียง แต่สำหรับผู้เล่น แต่ในทุกทิศทางและสะท้อนจากวัสดุต่าง ๆ คล้ายกับวิธีที่แสงสะท้อนแสง และในความเป็นจริงเราได้ยินเสียงสะท้อนเหล่านี้แม้ว่าจะไม่ชัดเจนเหมือนคลื่นเสียงตรง การสะท้อนเสียงทางอ้อมเหล่านี้มักจะจำลองด้วยเอฟเฟกต์เสียงสะท้อนพิเศษ แต่นี่เป็นวิธีการดั้งเดิมมากสำหรับงาน

ในแพ็คเกจเสียง VRWorks การคำนวณผิดของคลื่นเสียงคล้ายกับการติดตามเรย์เมื่อการเรนเดอร์เมื่อเส้นทางของลำแสงแสงถูกติดตามไปยังการสะท้อนหลายอย่างจากวัตถุในฉากเสมือน VRWorks Audio ยังเลียนแบบการแพร่กระจายของคลื่นเสียงในสภาพแวดล้อมเมื่อมีการตรวจสอบคลื่นเสียงตรงและคลื่นขึ้นอยู่กับมุมของการลดลงและคุณสมบัติของวัสดุสะท้อนแสง ในการทำงาน VRWorks Audio ใช้เครื่องยนต์ NVIDIA Optix ประสิทธิภาพสูงประสิทธิภาพสูงที่ออกแบบมาเพื่อติดตามรังสีตามงานกราฟิก สามารถใช้ Optix สำหรับงานที่หลากหลายเช่นการคำนวณแสงทางอ้อมและการเตรียมการ์ดแสงสว่างและตอนนี้สำหรับการติดตามคลื่นเสียงใน VRWorks Audio

NVIDIA ได้ฝังการคำนวณคลื่นเสียงที่แน่นอนในโปรแกรมสาธิต Funhouse VR มันใช้รังสีหลายพันและคำนวณได้ถึง 12 การสะท้อนจากวัตถุ และเพื่อกำหนดประโยชน์ของเทคโนโลยีในตัวอย่างที่เข้าใจได้เราขอแนะนำให้คุณดูวิดีโอเกี่ยวกับงานเทคโนโลยีในรัสเซีย:

เป็นสิ่งสำคัญที่วิธีการ NVIDIA นั้นแตกต่างจากเครื่องยนต์เสียงแบบดั้งเดิมรวมถึงฮาร์ดแวร์เร่งโดยใช้บล็อกพิเศษในวิธี GPU จากคู่แข่งหลัก วิธีการทั้งหมดเหล่านี้ให้การวางตำแหน่งที่แม่นยำของแหล่งกำเนิดเสียงที่ถูกต้องเท่านั้น แต่อย่าคำนวณการสะท้อนของคลื่นเสียงจากวัตถุในฉาก 3 มิติแม้ว่าพวกเขาสามารถจำลองสิ่งนี้ได้โดยใช้เอฟเฟกต์เสียงก้อง อย่างไรก็ตามการใช้เทคโนโลยีการติดตามเรย์อาจเป็นจริงมากขึ้นเนื่องจากวิธีการดังกล่าวจะให้การเลียนแบบที่แม่นยำของเสียงต่าง ๆ โดยคำนึงถึงขนาดรูปแบบและวัสดุของวัตถุในฉาก เป็นการยากที่จะบอกว่าจำเป็นต้องมีความถูกต้องเช่นนี้สำหรับผู้เล่นทั่วไป แต่อาจกล่าวได้ว่าแน่นอนว่า: ใน VR สามารถเพิ่มผู้ใช้ให้กับผู้ใช้ที่สมจริงที่สุดซึ่งไม่เพียงพอสำหรับเกมปกติ

เราได้ออกไปบอกเทคโนโลยี VR SLI เท่านั้นที่ทำงานใน OpenGL และ DirectX หลักการของมันนั้นง่ายมาก: ระบบวิดีโอโปรเซสเซอร์สองตัวในแอปพลิเคชัน VR จะทำงานเพื่อให้ตาแต่ละดวงถูกจัดสรร GPU แยกต่างหากในทางตรงกันข้ามกับการเรนเดอร์ AFR ซึ่งเป็นที่คุ้นเคยกับการกำหนดค่า SLI สิ่งนี้ช่วยเพิ่มประสิทธิภาพโดยรวมเป็นสิ่งสำคัญสำหรับระบบเสมือนจริง ในทางทฤษฎีคุณสามารถใช้ GPU มากขึ้น แต่ปริมาณของพวกเขาควรจะแม้กระทั่ง

วิธีการดังกล่าวจำเป็นต้องใช้เนื่องจาก AFR นั้นเหมาะอย่างยิ่งสำหรับ VR เนื่องจากความช่วยเหลือ GPU ตัวแรกจะวาดกรอบทั้งสองข้างและที่สองคือคี่ซึ่งไม่ลดความล่าช้าที่สำคัญสำหรับระบบเสมือนจริง แม้ว่าความถี่ของเฟรมจะสูงพอ ดังนั้นด้วย VR SLI งานในแต่ละเฟรมแบ่งออกเป็นสอง GPUs - หนึ่งทำงานในส่วนของเฟรมสำหรับตาซ้ายที่สองคือสำหรับด้านขวาแล้วเฟรมครึ่งนี้จะรวมกันเป็นทั้งหมด

การแบ่งการทำงานระหว่างโปรเซสเซอร์กราฟิกหนึ่งคู่นำการเติบโตของประสิทธิภาพเกือบสองครั้งที่ช่วยให้คุณสามารถเพิ่มอัตราเฟรมและลดความล่าช้าเมื่อเทียบกับระบบตามการ์ดแสดงผลหนึ่งการ์ด จริงการใช้ VR SLI ต้องการการสนับสนุนเป็นพิเศษจากแอปพลิเคชันเพื่อใช้วิธีการปรับขนาดนี้ แต่เทคโนโลยี VR SLI ถูกสร้างขึ้นในการสาธิตการสาธิต VR เช่นห้องปฏิบัติการจากวาล์วและ taterine จาก ILMXLAB และนี่เป็นเพียงจุดเริ่มต้น - ใน NVIDIA สัญญาการเกิดขึ้นของแอปพลิเคชันอื่น ๆ เช่นเดียวกับเทคโนโลยีเกม Unreal Engine 4 , ความสามัคคีและ maxplay

แพลตฟอร์มการสร้างเกม Ansel เกม

หนึ่งในประกาศที่น่าสนใจที่สุดที่เกี่ยวข้องกับซอฟต์แวร์คือการผลิตเทคโนโลยีหน้าจอคุณภาพสูงในแอปพลิเคชันการเล่นเกมที่ตั้งชื่อโดยช่างภาพที่มีชื่อเสียงคนหนึ่ง - Ansel เกมไม่ได้เป็นเพียงแค่เกม แต่ยังรวมถึงสถานที่ของการใช้มือขี้เล่นสำหรับบุคลิกภาพที่สร้างสรรค์ต่างๆ มีคนเปลี่ยนสคริปต์ให้กับเกมมีคนผลิตชุดพื้นผิวที่มีคุณภาพสูงเป็นเกมและบางคนสร้างภาพหน้าจอที่สวยงาม

NVIDIA ได้ตัดสินใจที่จะช่วยให้หลังส่งแพลตฟอร์มใหม่สำหรับการสร้าง (มันคือการสร้างเพราะมันไม่ใช่กระบวนการที่ง่าย) ภาพคุณภาพสูงจากเกม พวกเขาเชื่อว่าแอลซีสสามารถช่วยสร้างศิลปะสมัยใหม่ชนิดใหม่ ท้ายที่สุดแล้วมีศิลปินจำนวนมากที่ใช้ชีวิตส่วนใหญ่สำหรับพีซีสร้างภาพหน้าจอที่สวยงามจากเกมและพวกเขายังไม่มีเครื่องมือที่สะดวกสำหรับสิ่งนี้

Ansel ช่วยให้คุณไม่เพียงแค่จับภาพในเกม แต่เพื่อเปลี่ยนเป็นสิ่งที่จำเป็นในการสร้าง ด้วยเทคโนโลยีนี้คุณสามารถเลื่อนกล้องบนเวทีหมุนและเอียงได้ในทิศทางใดก็ได้เพื่อให้ได้องค์ประกอบเฟรมที่ต้องการ ตัวอย่างเช่นในเกมดังกล่าวเช่นนักกีฬาคนแรกคุณสามารถย้ายผู้เล่นได้เท่านั้นไม่มีอะไรเพิ่มเติมจะเปลี่ยนไปมากขึ้นดังนั้นภาพหน้าจอทั้งหมดจึงน่าเบื่อหน่าย ด้วยกล้องฟรีใน ANSE สคุณสามารถออกจากห้องเกมการเลือกมุมดังกล่าวซึ่งเป็นสิ่งจำเป็นสำหรับภาพที่ประสบความสำเร็จหรือเพื่อจับภาพสเตอริโอ 360 องศาเต็มรูปแบบจากจุดที่ต้องการและในความละเอียดสูง สำหรับการดูในภายหลังใน VR-Helmet

Ansel ใช้งานได้ค่อนข้างง่าย - ด้วยห้องสมุดพิเศษจาก NVIDIA แพลตฟอร์มนี้จะถูกนำเข้าสู่รหัสเกม ในการทำเช่นนี้นักพัฒนาซอฟต์แวร์ต้องการเพิ่มรหัสชิ้นเล็ก ๆ ในโครงการเพื่อให้วิดีโอ NVIDIA ไดรฟ์สกัดกั้นข้อมูลบัฟเฟอร์และ Shaders ใช้งานได้ค่อนข้างเล็กน้อยการแนะนำของ Ansel ในเกมต้องใช้เวลาน้อยกว่าหนึ่งวันในการดำเนินการ ดังนั้นการรวมโอกาสนี้ในเกมพยานที่ครอบครองโค้ดประมาณ 40 แถวและใน Witcher 3 - ประมาณ 150 บรรทัดของรหัส

Ansel จะปรากฏขึ้นพร้อมกับแพ็คเกจการพัฒนาแบบเปิด - SDK สิ่งสำคัญที่ผู้ใช้ได้รับชุดมาตรฐานของการตั้งค่าด้วยการอนุญาตให้เปลี่ยนตำแหน่งและมุมของกล้องเพิ่มเอฟเฟกต์ ฯลฯ แพลตฟอร์ม Ansel ทำงานดังนี้: มันทำให้เกมหยุดชั่วคราวรวมถึงห้องฟรีและ ช่วยให้คุณเปลี่ยนเฟรมเป็นมุมมองที่ต้องการการบันทึกผลลัพธ์ในรูปแบบของหน้าจอปกติสแนปชอต 360 องศาคู่สเตอริโอหรือเพียงแค่พาโนรามาของการอนุญาตครั้งใหญ่

หมายเหตุเดียวเท่านั้น: เกมบางเกมไม่ได้รับการสนับสนุนสำหรับคุณสมบัติทั้งหมดของแพลตฟอร์มการสร้าง สกรีนช็อตเกม ansel นักพัฒนาเกมบางคนด้วยเหตุผลหนึ่งหรืออีกอย่างไม่ต้องการรวมห้องฟรีในเกมของพวกเขา - ตัวอย่างเช่นเนื่องจากความเป็นไปได้ของการใช้ฟังก์ชั่นนี้กับคนขี้โกง หรือพวกเขาต้องการ จำกัด การเปลี่ยนแปลงในมุมของการทบทวนด้วยเหตุผลเดียวกัน - เพื่อที่จะไม่มีใครได้รับความได้เปรียบที่ไม่เป็นธรรม หรือผู้ใช้ไม่เห็นสไปรต์ที่น่าสังเวชในพื้นหลัง ทั้งหมดนี้เป็นความต้องการตามปกติของผู้สร้างเกม

หนึ่งในคุณสมบัติที่น่าสนใจที่สุดของ Ansel คือการสร้างภาพหน้าจอเพียงแค่ได้รับอนุญาตอย่างมาก ไม่สำคัญว่าเกมนี้รองรับสิทธิ์สูงสุด 4K ตัวอย่างเช่นและจอภาพของผู้ใช้และ Full HD การใช้แพลตฟอร์มการกำจัดภาพหน้าจอคุณสามารถจับภาพที่มีคุณภาพสูงกว่ามากโดยปริมาตรและประสิทธิภาพของไดรฟ์ แพลตฟอร์มจับภาพหน้าจอได้อย่างง่ายดายด้วยความละเอียดสูงถึง 4.5 กิกพิกเซลโดยเย็บจาก 3,600 ชิ้น!

เป็นที่ชัดเจนว่าในภาพดังกล่าวคุณสามารถพิจารณารายละเอียดทั้งหมดจนถึงข้อความในหนังสือพิมพ์ที่อยู่ห่างออกไปหากมีรายละเอียดดังกล่าวในหลักการในเกม - Ansel สามารถจัดการและปรับระดับระดับรายละเอียดได้ การเปิดเผยระดับสูงสุดเพื่อให้ได้ภาพที่มีคุณภาพที่ดีที่สุด แต่คุณยังสามารถเปิดการนำเสนอซุปเปอร์ได้ ทั้งหมดนี้ช่วยให้คุณสร้างภาพจากเกมที่สามารถพิมพ์ได้อย่างปลอดภัยบนแบนเนอร์ขนาดใหญ่และสงบสติอารมณ์สำหรับคุณภาพของพวกเขา

ที่น่าสนใจคือรหัสเร่งความเร็วฮาร์ดแวร์พิเศษที่ใช้กับ CUDA ใช้เพื่อเย็บภาพขนาดใหญ่ ท้ายที่สุดแล้วไม่มีการ์ดวิดีโอจะไม่สามารถชะลอการสร้างภาพหลายวันของทั้งหมด แต่มันสามารถทำมันเป็นชิ้น ๆ ที่คุณเพียงแค่ต้องรวมกันในภายหลังเนื่องจากความแตกต่างที่เป็นไปได้ในแสงสีและสิ่งอื่น ๆ

หลังจากเย็บพาโนรามาดังกล่าวการประมวลผลโพสต์พิเศษใช้สำหรับเฟรมทั้งหมดยังเร่งความเร็วใน GPU และเพื่อจับภาพในช่วงไดนามิกที่เพิ่มขึ้นคุณสามารถใช้รูปแบบภาพพิเศษ - EXR มาตรฐานที่เปิดจากแสงอุตสาหกรรมและเวทมนตร์ค่าสีในแต่ละช่องที่บันทึกไว้ในรูปแบบจุดลอย 16 บิต ( FP16)

รูปแบบนี้ช่วยให้คุณเปลี่ยนความสว่างและช่วงไดนามิกของภาพโดยการประมวลผลหลังนำไปสู่การแสดงผลที่ต้องการในลักษณะเดียวกับที่ทำกับรูปแบบ RAW จากกล้อง ใช่และสำหรับการใช้ฟิลเตอร์โพสต์แปรรูปในภายหลังในโปรแกรมประมวลผลภาพรูปแบบนี้มีประโยชน์มากเนื่องจากมีข้อมูลมากกว่ารูปแบบปกติสำหรับรูปภาพ

แต่แพลตฟอร์ม ANSEL และตัวเองมีตัวกรองจำนวนมากสำหรับการประมวลผลหลังซึ่งมีความสำคัญอย่างยิ่งเนื่องจากการเข้าถึงไม่เพียง แต่ในภาพสุดท้าย แต่ยังรวมถึงบัฟเฟอร์ทั้งหมดที่ใช้โดยเกมเมื่อการแสดงผลซึ่งสามารถใช้กับเอฟเฟกต์ที่น่าสนใจมาก เช่นเดียวกับความลึกของสนาม ในการทำเช่นนี้ ANSE สมี API พิเศษสำหรับการประมวลผลหลังและเอฟเฟกต์ใด ๆ ที่สามารถรวมอยู่ในเกมด้วยการสนับสนุนแพลตฟอร์มนี้

ANSE สของตัวกรองโพสต์รวมถึงตัวกรองเช่น: เส้นโค้งสี, พื้นที่สี, การเปลี่ยนแปลง, desaturation, ความสว่าง / ความคมชัด, เม็ดฟิล์ม, บาน, เลนส์เปลวไฟ, แสงจ้า, ความผิดเพี้ยน, heathaze, fisheye, ความผิดปกติของสี, การทำแผนที่โทนสี, เลนส์, Lightshafts , Vignette, การแก้ไขแกมมา, การสนทนา, เหลา, การตรวจจับขอบ, เบลอ, ซีเปีย, เดนิส, fxaa และอื่น ๆ

สำหรับการเกิดขึ้นของการสนับสนุนของ Ansel ในเกมแล้วมันจะต้องรอสักครู่ในขณะที่นักพัฒนาจะถูกนำไปใช้และทดสอบ แต่ NVIDIA สัญญาการเกิดขึ้นของการสนับสนุนดังกล่าวในเกมที่มีชื่อเสียงเช่นการแบ่งเป็นพยาน, ผู้ทำผิดกฎหมาย, Witcher 3, พารากอน, fortnite, obduction, ไม่มีมนุษย์ "การแข่งขันที่ไม่จริงและอื่น ๆ

กระบวนการทางเทคโนโลยีใหม่ของการเพิ่มประสิทธิภาพ Finfet และสถาปัตยกรรมแบบใหม่ที่ได้รับอนุญาตการ์ดวิดีโอ GeForce GTX 1080 ขึ้นอยู่กับหน่วยประมวลผลกราฟิก GP104 เพื่อให้บรรลุความถี่นาฬิกาสูง 1.6-1.7 GHz แม้ในรูปแบบการอ้างอิงและทำงานที่ความถี่สูงสุดในเกม รับประกันรุ่นใหม่เทคโนโลยี GPU Boost พร้อมกับจำนวนบล็อกผู้บริหารที่เพิ่มขึ้นการปรับปรุงเหล่านี้สร้างความแปลกใหม่ไม่เพียง แต่เป็นเพียงการ์ดวิดีโอความบริสุทธิ์แบบเดียวที่มีประสิทธิภาพสูงที่สุดตลอดเวลา แต่ยังเป็นโซลูชั่นที่ประหยัดพลังงานมากที่สุดในตลาด

รุ่น GeForce GTX 1080 ได้กลายเป็นการ์ดแสดงผลแรกที่ถือหน่วยความจำกราฟิก GDDR5X ชนิดใหม่ - ชิปความเร็วสูงรุ่นใหม่ซึ่งทำให้สามารถบรรลุความถี่การส่งข้อมูลที่สูงมาก ในกรณีของการปรับเปลี่ยน GeForce GTX 1080 หน่วยความจำประเภทนี้ทำงานด้วยความถี่ที่มีประสิทธิภาพ 10 GHz เมื่อใช้ร่วมกับอัลกอริธึมการบีบอัดข้อมูลที่ได้รับการปรับปรุงใน FrameBuple จะนำไปสู่การเพิ่มประสิทธิภาพ แบนด์วิดธ์ หน่วยความจำสำหรับโปรเซสเซอร์กราฟิกนี้คือ 1.7 เท่าเมื่อเทียบกับรุ่นก่อนหน้าในหน้าของ GeForce GTX 980

NVIDIA ตัดสินใจอย่างรอบคอบที่จะไม่ปล่อยสถาปัตยกรรมใหม่อย่างรุนแรงในกระบวนการทางเทคนิคใหม่ที่สมบูรณ์สำหรับตัวเองเพื่อไม่ให้เกิดปัญหาเพิ่มเติมในการพัฒนาและการผลิต แต่พวกเขาปรับปรุงอย่างจริงจังและสถาปัตยกรรม Maxwell ที่ดีและมีประสิทธิภาพมากเพิ่มความเป็นไปได้บางอย่าง เป็นผลให้กับการผลิตของ GPU ใหม่ทุกอย่างเรียบร้อยดีและในกรณีของ GeForce GTX รุ่น 1080 วิศวกรได้รับศักยภาพความถี่สูงมากในการโอเวอร์คล็อกจากพันธมิตรความถี่ GPU คาดว่าจะสูงถึง 2 GHz! ความถี่ที่น่าประทับใจดังกล่าวได้กลายเป็นจริงต้องขอบคุณกระบวนการที่สมบูรณ์แบบและงานที่ทำอย่างรอบคอบของวิศวกร NVIDIA เมื่อพัฒนาโปรเซสเซอร์กราฟิก Pascal

และแม้ว่า Pascal ได้กลายเป็นผู้ติดตามโดยตรงของคดี Maxwell และสถาปัตยกรรมกราฟิกเหล่านี้ขึ้นอยู่กับความแตกต่างของตนเองมากเกินไป NVIDIA ได้เปิดตัวการเปลี่ยนแปลงและการปรับปรุงมากมายรวมถึงความสามารถในการแสดงภาพบนจอแสดงผลการเข้ารหัสเครื่องยนต์และวิดีโอ เครื่องยนต์ถอดรหัสปรับปรุงการดำเนินการแบบอะซิงโครนัสของการคำนวณประเภทต่าง ๆ ใน GPU ทำให้การเปลี่ยนแปลงการเรนเดอร์มัลติฟังก์ชั่นและใช้วิธีการซิงโครไนซ์ใหม่ของการซิงค์ที่รวดเร็ว

มันเป็นไปไม่ได้ที่จะไม่เน้นเทคโนโลยี MultiProying แบบหลายฉายพร้อมกันซึ่งช่วยเพิ่มผลผลิตในระบบความเป็นจริงเสมือนได้รับการแสดงผลที่ถูกต้องมากขึ้นของฉากในระบบ domuclear ที่ถูกต้องและใช้เทคนิคการเพิ่มประสิทธิภาพประสิทธิภาพใหม่ แต่ความเร็วที่เพิ่มขึ้นมากที่สุดจะได้รับแอปพลิเคชัน VR เมื่อรองรับเทคโนโลยี MultiProying ซึ่งช่วยในการบันทึกทรัพยากร GPU เมื่อประมวลผลข้อมูลทางเรขาคณิตและหนึ่งครั้งครึ่ง - ด้วยการคำนวณพิกเซล

ท่ามกลางการเปลี่ยนแปลงซอฟต์แวร์ที่บริสุทธิ์แพลตฟอร์มที่เน้นโดยเฉพาะอย่างยิ่งสำหรับการสร้างสกรีนช็อตในเกมที่เรียกว่า Ansel - ลองใช้ในกรณีที่จะน่าสนใจไม่เพียง แต่จะเล่นมาก แต่ยังสนใจในกราฟิก 3 มิติคุณภาพสูง ความแปลกใหม่ช่วยให้คุณสามารถส่งเสริมศิลปะการสร้างและตกแต่งภาพหน้าจอไปยังระดับใหม่ เช่นเดียวกับแพ็คเกจของพวกเขาสำหรับนักพัฒนาเกมเช่นนักเล่นเกมและ VRWorks NVIDIA ยังคงปรับปรุงทีละขั้นตอนอย่างต่อเนื่องดังนั้นในช่วงหลังมีความเป็นไปได้ที่น่าสนใจของ Soundcard คุณภาพสูงของเสียงโดยคำนึงถึงการสะท้อนคลื่นเสียงจำนวนมาก ใช้ร่องรอยฮาร์ดแวร์ของรังสี

โดยทั่วไปในรูปแบบของการ์ดวิดีโอ NVIDIA GeForce GTX 1080 ผู้นำที่แท้จริงได้รับการปล่อยตัวในตลาดมีคุณสมบัติที่จำเป็นทั้งหมดสำหรับสิ่งนี้: ประสิทธิภาพสูงและการทำงานที่กว้างรวมถึงการสนับสนุนคุณสมบัติและอัลกอริทึมใหม่ ผู้ซื้อรายแรกของการ์ดแสดงผลนี้จะสามารถประเมินข้อได้เปรียบเหล่านี้ได้ทันทีทันทีและความเป็นไปได้อื่น ๆ ของการแก้ปัญหาจะถูกเปิดเผยในภายหลังเมื่อการสนับสนุนที่กว้างจากส่วนต่างๆจะปรากฏขึ้น ซอฟต์แวร์. สิ่งสำคัญคือ GeForce GTX 1080 กลายเป็นเรื่องที่รวดเร็วและมีประสิทธิภาพมากและบางส่วนของปัญหา (การคำนวณแบบอะซิงโครนัสเดียวกัน) เนื่องจากเราหวังว่า NVIDIA จะแก้ไขได้

GeForce GTX 1070 ตัวเร่งกราฟิก

พารามิเตอร์ค่า
ชิปชื่อรหัสGP104
เทคโนโลยีการผลิต16 nm finfet
จำนวนทรานซิสเตอร์7.2 พันล้าน
นิวเคลียสสแควร์314 mm²
สถาปัตยกรรมแบบครบวงจรพร้อมโปรเซสเซอร์ทั่วไปสำหรับการสตรีมชนิดข้อมูลจำนวนมาก: จุดยอด, พิกเซล, ฯลฯ
รองรับฮาร์ดแวร์ DirectXDirectX 12 พร้อมรองรับระดับฟีเจอร์ 12_1
บัสหน่วยความจำ256- บิต: ตัวควบคุมหน่วยความจำ 32 บิตอิสระแปดตัวพร้อมรองรับหน่วยความจำ GDDR5 และ GDDR5X
ความถี่ของตัวประมวลผลกราฟิก1506 (1683) MHz
บล็อกคอมพิวเตอร์15 การใช้งาน (จาก 20 ในชิป) สตรีมมิ่งมัลติโปรเซสเซอร์ประกอบด้วยสเกลาร์ ALU สำหรับการคำนวณจุดลอยตัวภายใต้มาตรฐาน IEEE 754-2008;
บล็อกพื้นผิวบล็อกที่ใช้งานอยู่ที่ 120 (จาก 160 ในชิป) บล็อกของการจัดการพื้นผิวและการกรองด้วยการสนับสนุนคอมโพเนนต์ FP16- และ FP32 ในพื้นผิวและการสนับสนุนสำหรับการกรอง Trilinear และ Anisotropic สำหรับรูปแบบพื้นผิวทั้งหมด
บล็อกของการดำเนินงานแรสเตอร์ (ROP)8 บล็อก ROP กว้าง (64 พิกเซล) พร้อมการรองรับโหมดการทำให้เรียบต่าง ๆ รวมถึงโปรแกรมและที่ FP16 หรือ FP32 Frame Format บล็อกประกอบด้วยอาร์เรย์ของ ALU ที่กำหนดค่าได้และมีหน้าที่รับผิดชอบในการเปรียบเทียบรุ่นและเชิงลึกหลายอย่างและการผสม
รองรับการตรวจสอบการสนับสนุนแบบบูรณาการสำหรับจอภาพมากถึงสี่จอเชื่อมต่อกับอินเตอร์เฟส Dual Link DVI, HDMI 2.0B และ DisplayPort 1.2 (1.3 / 1.4 พร้อม)

ข้อมูลจำเพาะของการ์ดอ้างอิงวิดีโอ GeForce GTX 1070
พารามิเตอร์ค่า
ความถี่ของนิวเคลียส1506 (1683) MHz
จำนวนโปรเซสเซอร์สากล1920
จำนวนบล็อกพื้นตา120
จำนวนบล็อกที่ทำผิดพลาด64
ความถี่หน่วยความจำที่มีประสิทธิภาพ8000 (4 × 2000) MHz
ประเภทหน่วยความจำGDDR5
บัสหน่วยความจำ256 บิต
หน่วยความจำ8 GB
แบนด์วิดธ์หน่วยความจำ256 gb / s
ประสิทธิภาพการคำนวณ (FP32)ประมาณ 6.5 teraflops
ความเร็วสูงสุดทางทฤษฎีสูงสุด96 กิกพิกเซล / ด้วย
พื้นผิวตัวอย่างการสุ่มตัวอย่างเชิงทฤษฎี181 goldexels / กับ
ยางPCI Express 3.0
ตัวเชื่อมต่อหนึ่งเชื่อมต่อ Dual Link DVI หนึ่ง HDMI และสาม DisplayPort
การใช้พลังงานมากถึง 150 วัตต์
อาหารเพิ่มเติมขั้วต่อ 8 พินหนึ่งตัว
จำนวนสล็อตที่ครอบครองในกรณีของระบบ2
แนะนำราคา$ 379-449 (USA), 34 990 (Russia)

การ์ดวิดีโอ GeForce GTX 1070 ยังได้รับชื่อโลจิคัลคล้ายกับโซลูชันเดียวกันจากชุด GeForce ก่อนหน้า มันแตกต่างจากรุ่นก่อนหน้าของ GeForce GTX 970 ที่ได้รับการดัดแปลงโดยตรง ความแปลกใหม่กลายเป็นในบรรทัดปัจจุบันของ บริษัท ที่จะลงล่างโซลูชันยอดนิยมในปัจจุบัน GeForce GTX 1080 ซึ่งได้กลายเป็นเรือธงชั่วคราวของซีรีย์ใหม่ในการเปิดตัวโซลูชั่นใน GPU พลังที่ยิ่งใหญ่กว่า

ราคาที่แนะนำสำหรับวันหยุดวิดีโอ NVIDIA ยอดนิยมใหม่คือ $ 379 และ $ 449 สำหรับพันธมิตร NVIDIA รุ่นปกติและรุ่นพิเศษของ Edition ของผู้ก่อตั้งตามลำดับ เมื่อเทียบกับรุ่นยอดนิยมมันเป็นราคาที่ดีมากที่ GTX 1070 ด้อยกว่าของเธอประมาณ 25% ในกรณีที่เลวร้ายที่สุด และในช่วงเวลาของการประกาศและการเปิดตัว GTX 1070 กลายเป็นทางออกที่ดีที่สุดในชั้นเรียน เช่นเดียวกับ GeForce GTX 1080 รุ่น GTX 1070 ไม่มีคู่แข่งโดยตรงจาก AMD และเป็นไปได้ที่จะเปรียบเทียบยกเว้น Radeon R9 390X และ Fury

หน่วยประมวลผลกราฟิก GP104 ในการปรับเปลี่ยน GeForce GTX 1070 ตัดสินใจที่จะออกจากบัสหน่วยความจำ 256 บิตเต็มแม้ว่าจะใช้หน่วยความจำ GDDR5X ชนิดใหม่ แต่ GDDR5 ที่รวดเร็วมากซึ่งทำงานที่ความถี่ที่มีประสิทธิภาพสูง 8 GHz ปริมาตรของการ์ดวิดีโอหน่วยความจำที่มียางรถยนต์ดังกล่าวสามารถเท่ากับ 4 หรือ 8 GB และเพื่อให้แน่ใจว่าประสิทธิภาพสูงสุดของโซลูชันใหม่ในการตั้งค่าสูงและการแสดงผลการแสดงผลรุ่นการ์ดวิดีโอ GeForce GTX 1070 ยังมาพร้อมกับ 8 GB หน่วยความจำวิดีโอเป็นพี่สาวของมัน โวลุ่มนี้เพียงพอที่จะเปิดแอปพลิเคชัน 3D ใด ๆ ที่มีการตั้งค่าคุณภาพสูงสุดเป็นเวลาหลายปี

รุ่นพิเศษ GeForce GTX 1070 ผู้ก่อตั้ง Edition

ด้วยการประกาศ GeForce GTX 1080 ในช่วงต้นเดือนพฤษภาคมการ์ดแสดงผลพิเศษที่เรียกว่า Founders Edition ซึ่งมีราคาสูงกว่าเมื่อเทียบกับการ์ดวิดีโอทั่วไปของพันธมิตรของ บริษัท เช่นเดียวกับความแปลกใหม่ ในเนื้อหานี้เราจะบอกอีกครั้งเกี่ยวกับรุ่นพิเศษของการ์ดวิดีโอ GeForce GTX 1070 ที่เรียกว่า Founders Edition เช่นเดียวกับในกรณีของรุ่นเก่า NVIDIA ตัดสินใจที่จะปล่อยการ์ดอ้างอิงรุ่นนี้ของผู้ผลิตในราคาที่สูงขึ้น พวกเขายืนยันว่าผู้เล่นหลายคนและผู้ที่ชื่นชอบการซื้อการ์ดวิดีโอระดับบนสุดที่มีราคาแพงต้องการผลิตภัณฑ์ที่มีสปีชีส์ "พรีเมี่ยม" ที่สอดคล้องกันและความรู้สึกจากมัน

ดังนั้นจึงเป็นไปอย่างแม่นยำสำหรับผู้ใช้ดังกล่าวในตลาดการ์ดวิดีโอรุ่น GeForce GTX 1070 จะถูกปล่อยออกมาซึ่งได้รับการออกแบบและทำโดย NVIDIA วิศวกรจากวัสดุและส่วนประกอบระดับพรีเมี่ยมเช่นฝาครอบอลูมิเนียม GeForce GTX 1070 รุ่น เช่นเดียวกับแผ่นด้านหลังที่มีรายละเอียดต่ำครอบคลุมด้านรากของแผงวงจรพิมพ์และเป็นที่นิยมในหมู่ผู้ที่ชื่นชอบ

อย่างที่คุณเห็นในรูปถ่ายของบอร์ด, GeForce GTX 1070 ผู้ก่อตั้งฉบับสืบทอดการออกแบบอุตสาหกรรมเดียวกันโดยมีอยู่ในรุ่นอ้างอิงของ GeForce GTX 1080 Founders Edition ในทั้งสองรุ่นพัดลมเรเดียลถูกนำมาใช้การขว้างอากาศอุ่นออกไปด้านนอกซึ่งมีประโยชน์มากทั้งในกรณีเล็ก ๆ และการกำหนดค่า SLI มัลติมิเตอร์ที่มีพื้นที่ทางร่างกายที่ จำกัด การเป่าลมอุ่นออกไปด้านนอกแทนที่จะไหลเวียนของมันในกรณีนี้จะลดการโหลดอุณหภูมิเพิ่มผลการโอเวอร์คล็อกและขยายอายุการใช้งานของส่วนประกอบของระบบ

ภายใต้หน้าปกของระบบระบายความร้อนอ้างอิง GeForce GTX 1070 ถูกซ่อนด้วยหม้อน้ำอลูมิเนียมชนิดพิเศษที่มีสามท่อความร้อนในตัวจากทองแดงการถอดความร้อนออกจากตัวประมวลผลกราฟิกเอง ความร้อนที่กำหนดโดยท่อความร้อนจากนั้นกระจายไปโดยใช้หม้อน้ำอลูมิเนียม แผ่นโลหะที่มีรายละเอียดต่ำที่ด้านหลังของบอร์ดยังได้รับการออกแบบเพื่อให้คุณลักษณะอุณหภูมิที่ดีขึ้น นอกจากนี้ยังมีส่วนที่หดได้สำหรับการเคลื่อนไหวของอากาศที่ดีขึ้นระหว่างการ์ดวิดีโอหลายตัวในการกำหนดค่า SLI

สำหรับระบบจ่ายไฟรุ่น GeForce GTX 1070 Edition มีระบบโภชนาการสี่เฟสที่ปรับให้เหมาะสมสำหรับการจัดหาพลังงานที่มั่นคง NVIDIA รับรองว่าการใช้ส่วนประกอบพิเศษในรุ่น GTX 1070 ผู้ก่อตั้งทำให้เป็นไปได้ที่จะเพิ่มประสิทธิภาพการจัดหาพลังงานความเสถียรและความน่าเชื่อถือเมื่อเทียบกับ GeForce GTX 970 ให้ประสิทธิภาพที่ดีขึ้นในระหว่างการเร่งความเร็ว ในการทดสอบของตัวเองของ บริษัท GeForce GTX 1070 การ์ดนั้นเหนือกว่า 1.9 GHz ซึ่งอยู่ใกล้กับผลลัพธ์ของรุ่น GTX 1080 รุ่นเก่า

การ์ดวิดีโอ NVIDIA GeForce GTX 1070 จะวางจำหน่ายในร้านค้าปลีกที่เริ่มตั้งแต่วันที่ 10 มิถุนายน ราคาที่แนะนำสำหรับ GeForce GTX 1070 ผู้ก่อตั้ง Edition และโซลูชั่นของพันธมิตรนั้นแตกต่างกันและนี่เป็นคำถามที่สำคัญที่สุดสำหรับสิ่งพิมพ์พิเศษนี้ หากพันธมิตร NVIDIA กำลังขายการ์ดวิดีโอ GeForce GTX 1070 ในราคาตั้งแต่ $ 379 (ในตลาดสหรัฐ) ผู้ก่อตั้งรุ่นของการออกแบบอ้างอิง NVIDIA จะมีราคา $ 449 มีผู้ที่ชื่นชอบมากมายพร้อมที่จะจ่ายเงินมากเกินไปพูดตรงๆที่น่าสงสัยข้อดีของตัวเลือกอ้างอิง? เวลาจะบอก แต่เราเชื่อว่าค่าธรรมเนียมอ้างอิงนั้นน่าสนใจยิ่งขึ้นเป็นตัวเลือกสำหรับการซื้อในช่วงเริ่มต้นของการขายและต่อมาความหมายของการซื้อกิจการ (แม้ในราคาที่มีขนาดใหญ่!) มันลดลงเป็นศูนย์แล้ว

มันยังคงเพิ่มค่าธรรมเนียมอ้างอิงของการอ้างอิง GeForce GTX 1070 คล้ายกับการ์ดวิดีโอรุ่นเก่าและทั้งสองแตกต่างจากบอร์ดก่อนหน้าของ บริษัท มูลค่าของนวัตกรรมทั่วไปสำหรับความแปลกใหม่คือ 150 วัตต์ซึ่งน้อยกว่าค่าสำหรับ GTX 1080 เกือบ 20% และใกล้เคียงกับการใช้พลังงานของ GeForce GTX 970 รุ่นก่อนหน้านี้การ์ดอ้างอิง NVIDIA มีชุดเชื่อมต่อที่คุ้นเคยอยู่แล้ว ในการแนบอุปกรณ์เอาต์พุตรูปภาพ: Dual-Link DVI หนึ่งเครื่องหนึ่ง HDMI และสาม DisplayPort นอกจากนี้การสนับสนุนของ HDMI รุ่นใหม่และ DisplayPort ปรากฏขึ้นซึ่งเราเขียนเกี่ยวกับภาพรวมรุ่น GTX 1080

การเปลี่ยนแปลงทางสถาปัตยกรรม

การ์ดวิดีโอ GeForce GTX 1070 ขึ้นอยู่กับชิป GP104 ซึ่งเป็นเตียงแรกของสถาปัตยกรรมกราฟิก NVIDIA รุ่นใหม่ - Pascal สถาปัตยกรรมนี้ขึ้นอยู่กับวิธีการแก้ปัญหาที่ยังคงใช้ไปใน Maxwell แต่ยังมีความแตกต่างในการทำงานบางอย่างเกี่ยวกับที่เราเขียนรายละเอียดในรายละเอียด - ในส่วนที่ทุ่มเทให้กับการ์ดวิดีโอ GeForce GTX 1080

การเปลี่ยนแปลงหลักในสถาปัตยกรรมใหม่คือกระบวนการทางเทคโนโลยีที่โปรเซสเซอร์กราฟิกใหม่ทั้งหมดจะดำเนินการ การประยุกต์ใช้กระบวนการทางเทคนิคของ FinFET 16 NM ในการผลิต GP104 ทำให้สามารถเพิ่มความซับซ้อนของชิปได้อย่างมีนัยสำคัญในขณะที่รักษาพื้นที่ที่ค่อนข้างต่ำและค่าใช้จ่ายและชิปสถาปัตยกรรมปาสคาลแรกมีบล็อกผู้บริหารจำนวนมากที่เห็นได้ชัด ฟังก์ชั่นใหม่เมื่อเทียบกับชิป Maxwell ตำแหน่งที่คล้ายกัน

ชิปวิดีโอ GP104 บนอุปกรณ์คล้ายกับโซลูชันที่คล้ายกันของสถาปัตยกรรม Maxwell และข้อมูลรายละเอียดบนอุปกรณ์ของ GPU ที่ทันสมัยที่คุณสามารถหาได้ในความคิดเห็นของเราเกี่ยวกับ NVIDIA โซลูชั่นก่อนหน้า เช่นเดียวกับโปรเซสเซอร์กราฟิกก่อนหน้าชิปสถาปัตยกรรมใหม่จะมีการกำหนดค่าที่แตกต่างกันของคลัสเตอร์การประมวลผลกราฟิกคลัสเตอร์คลัสเตอร์คลัสเตอร์คลัสเตอร์การสตรีมม้วนมัลติโปรเซสเซอร์สตรีมมิ่งมัลติโปรเซสเซอร์ (SM) และหน่วยความจำควบคุมและใน GeForce GTX 1070 การเปลี่ยนแปลงบางอย่างเกิดขึ้นแล้ว - ส่วนหนึ่งของชิปมี ถูกบล็อกและไม่ใช้งาน (ไฮไลต์สีเทา):

แม้ว่าหน่วยประมวลผลกราฟิก GP104 จะรวมถึงกลุ่ม GPC สี่ตัวและมัลติโปรเซสเซอร์ 20 SM ในเวอร์ชันสำหรับ GeForce GTX 1070 แต่ได้รับการดัดแปลงที่ตัดแต่งด้วยฮาร์ดแวร์ที่ปิดการใช้งานโดยหนึ่ง GPC Cluster เนื่องจากแต่ละคลัสเตอร์ของ GPC มีเครื่องยนต์ Rasterization ที่เฉพาะเจาะจงและรวมถึง Multiprocessors SM ห้าตัวและแต่ละมัลติโปรเซสเซอร์ประกอบด้วย 128 CUDA-NUCLEI และบล็อกพื้นผิว TMU แปดบล็อกในรุ่นนี้ของ GP104 1920 CUDA-NUCLEI และบล็อก 120 TMU จากการสตรีมมิ่ง 2560 160 บล็อกพื้นผิวที่มีอยู่ทางร่างกาย

ตัวประมวลผลกราฟิกซึ่งขึ้นอยู่กับการ์ดวิดีโอ GeForce GTX 1070 มีตัวควบคุมหน่วยความจำ 32 บิตแปดตัวที่ให้บัสหน่วยความจำรวม 256 บิต - ตรงกับรุ่นของรุ่น GTX 1080 รุ่นเก่าระบบย่อยหน่วยความจำไม่ได้รับ ตัดแต่งเพื่อให้แน่ใจว่าหน่วยความจำแบนด์วิดธ์สูงเพียงพอที่มีเงื่อนไขสำหรับการใช้หน่วยความจำ GDDR5 ใน GeForce GTX 1070 ไปยังตัวควบคุมหน่วยความจำแต่ละตัวจะถูกผูกติดกับบล็อก ROP แปดและ 256 KB ของแคชระดับที่สองดังนั้นชิป GP104 และในนี้ การปรับเปลี่ยนยังมี 64 rop และระดับหน่วยความจำเงินสด 2048 KB

ด้วยการเพิ่มประสิทธิภาพสถาปัตยกรรมและกระบวนการใหม่ตัวประมวลผลกราฟิก GP104 ได้กลายเป็นหน่วยประมวลผลกราฟิกที่ประหยัดพลังงานมากที่สุดในขณะนี้ วิศวกร NVIDIA สามารถเพิ่มความถี่ของนาฬิกาได้มากกว่าที่คำนวณเมื่อเปลี่ยนเป็นกระบวนการทางเทคนิคใหม่ซึ่งพวกเขาต้องทำงานได้ดีตรวจสอบอย่างละเอียดและเพิ่มประสิทธิภาพคอขวดทั้งหมดของโซลูชั่นก่อนหน้านี้ที่ไม่อนุญาตให้ทำงานที่ความถี่ที่สูงขึ้น . ดังนั้น GeForce GTX 1070 ยังทำงานในความถี่สูงมากสูงกว่าค่าอ้างอิงมากกว่า 40% สำหรับ GeForce GTX 970

เนื่องจากรุ่น GeForce GTX 1070 อยู่ในสาระสำคัญเพียงแค่ GTX 1080 ที่มีประสิทธิภาพน้อยกว่าเล็กน้อยพร้อมกับหน่วยความจำ GDDR5 รองรับเทคโนโลยีทั้งหมดที่เราอธิบายไว้ในส่วนก่อนหน้านี้ เพื่อรับรายละเอียดเพิ่มเติมเกี่ยวกับสถาปัตยกรรม Pascal เช่นเดียวกับเทคโนโลยีไอทีที่ได้รับการสนับสนุนเช่นบล็อกที่ได้รับการปรับปรุงของเอาต์พุตและประมวลผลข้อมูลวิดีโอการสนับสนุนสำหรับการคำนวณแบบอะซิงโครนัสการคำนวณแบบอะซิงโครนัส Async เทคโนโลยีแบบมัลติโปรเจคชั่นหลายเครื่องและ การซิงค์การซิงโครไนซ์แบบใหม่ที่รวดเร็วมันคุ้มค่าที่จะทำความคุ้นเคยกับส่วน GTX 1080

หน่วยความจำ GDDR5 ประสิทธิภาพสูงและการใช้งานอย่างมีประสิทธิภาพ

เราเขียนเกี่ยวกับการเปลี่ยนแปลงในระบบย่อยหน่วยความจำที่หน่วยประมวลผลกราฟิก GP104 ซึ่งขึ้นอยู่กับรุ่น GeForce GTX 1080 และ GTX 1070 - ตัวควบคุมหน่วยความจำในองค์ประกอบของ GPU นี้จะได้รับการดูแลเป็นหน่วยความจำวิดีโอ GDDR5X ชนิดใหม่ซึ่งเป็น เขียนรายละเอียดในการตรวจสอบ GTX 1080 และหน่วยความจำ GDDR5-GRAD ที่ดีเก่าแก่เราเป็นเวลาหลายปีแล้ว

ในการที่จะไม่ลดการสูญเสียมากเกินไปในแบนด์วิดธ์หน่วยความจำในรุ่นที่อายุน้อยกว่า GTX 1070 เมื่อเทียบกับ GTX 1080 รุ่นเก่ามันถูกทิ้งให้ใช้ตัวควบคุมหน่วยความจำ 32 บิตทั้งแปดตัวที่ได้รับอินเตอร์เฟสหน่วยความจำวิดีโอทั่วไป 256 บิตเต็มรูปแบบ นอกจากนี้การ์ดวิดีโอยังมาพร้อมกับหน่วยความจำ GDDR5-Memory ความเร็วสูงสุดซึ่งมีให้เฉพาะในตลาดเท่านั้น - ด้วยความถี่ในการทำงานที่มีประสิทธิภาพ 8 GHz ทั้งหมดนี้ให้ PSP ใน 256 GB / s ซึ่งแตกต่างจาก 320 GB / s ที่โซลูชันอาวุโส - ประมาณจำนวนเดียวกันและความสามารถในการคำนวณถูกตัดดังนั้นจึงมีการตรวจสอบความสมดุล

อย่าลืมว่าแม้ว่าแบนด์วิดท์เชิงทฤษฎียอดเป็นสิ่งสำคัญสำหรับประสิทธิภาพของโปรเซสเซอร์กราฟิกคุณต้องใส่ใจกับประสิทธิภาพของการใช้งาน ในกระบวนการของการเรนเดอร์คอขวดที่แตกต่างกันจำนวนมากอาจ จำกัด ประสิทธิภาพโดยรวมโดยไม่ต้องให้การใช้ PSP ที่มีอยู่ทั้งหมด เพื่อลดจำนวนที่นั่งแคบ ๆ ตัวประมวลผลกราฟิกใช้การบีบอัดข้อมูลพิเศษโดยไม่สูญเสียปรับปรุงประสิทธิภาพการอ่านและการเขียน

ในสถาปัตยกรรม Pascal รุ่นที่สี่ของการบีบอัดข้อมูลบัฟเฟอร์ของบัฟเฟอร์ที่สี่ได้รับการแนะนำให้ใช้ GPU ให้ใช้ความสามารถของหน่วยความจำวิดีโอที่มีอยู่ได้อย่างมีประสิทธิภาพมากขึ้น ระบบย่อยหน่วยความจำใน GeForce GTX 1070 และ GTX 1080 ใช้เทคนิคการบีบอัดข้อมูลเก่าและใหม่ที่ได้รับการปรับปรุงโดยไม่สูญเสียออกแบบมาเพื่อลดข้อกำหนดสำหรับ PSP สิ่งนี้จะช่วยลดจำนวนข้อมูลที่บันทึกในหน่วยความจำปรับปรุงประสิทธิภาพของการใช้แคช L2 และลดจำนวนข้อมูลที่ส่งระหว่างจุด GPU ที่แตกต่างกันเช่น TMU และ Freimbuple

GPU Boost 3.0 และคุณสมบัติการเร่งความเร็ว

พันธมิตร NVIDIA ส่วนใหญ่ได้ประกาศการตัดสินใจจากโรงงานจาก GeForce GTX 1080 และ GTX 1070 และผู้ผลิตการ์ดวิดีโอจำนวนมากยังสร้างยูทิลิตี้โอเวอร์คล็อกพิเศษเพื่อใช้ฟังก์ชั่นเทคโนโลยี GPU Boost 3.0 ใหม่ ตัวอย่างหนึ่งของยูทิลิตี้ดังกล่าวคือ EVGA Precision Xoc ซึ่งรวมถึงสแกนเนอร์อัตโนมัติเพื่อกำหนดอัตราส่วนแรงดันไฟฟ้าและเส้นโค้งความถี่ - ในโหมดนี้สำหรับแต่ละค่าแรงดันไฟฟ้าโดยใช้การเปิดตัวการทดสอบเสถียรภาพมีความถี่ที่มั่นคงที่ GPU ให้ประสิทธิภาพการเพิ่มขึ้น อย่างไรก็ตามเส้นโค้งนี้สามารถเปลี่ยนแปลงได้ด้วยตนเอง

เรารู้เทคโนโลยี GPU Boost ในการ์ดวิดีโอ NVIDIA ก่อนหน้านี้ ในโปรเซสเซอร์กราฟิกพวกเขาใช้คุณสมบัติฮาร์ดแวร์นี้มีวัตถุประสงค์เพื่อเพิ่มความถี่นาฬิกาการทำงานของ GPU ในโหมดเมื่อยังไม่ถึงการใช้พลังงานและขีด จำกัด การปล่อยความร้อน ในโปรเซสเซอร์กราฟิกของ Pascal อัลกอริทึมนี้มีการเปลี่ยนแปลงหลายประการที่สำคัญของการติดตั้งความถี่เทอร์โบที่ละเอียดยิ่งขึ้นขึ้นอยู่กับแรงดันไฟฟ้า

หากก่อนหน้านี้ความแตกต่างระหว่างความถี่พื้นฐานและความถี่เทอร์โบได้รับการแก้ไขแล้วใน GPU Boost 3.0 เป็นไปได้ที่จะติดตั้งการกำจัดความถี่เทอร์โบสำหรับแต่ละแรงดันไฟฟ้าแยกต่างหาก ตอนนี้ความถี่เทอร์โบสามารถติดตั้งสำหรับแต่ละค่าแรงดันไฟฟ้าแต่ละค่าซึ่งช่วยให้คุณสามารถบีบความเป็นไปได้ทั้งหมดของการโอเวอร์คล็อกจาก GPU เราเขียนรายละเอียดเกี่ยวกับโอกาสนี้ใน รีวิว GeForce GTX 1080 และสำหรับสิ่งนี้คุณสามารถใช้ EVGA Precision Xoc และ MSI Afterburner Utilities

ตั้งแต่ในวิธีการโอเวอร์คล็อกด้วยการเปิดตัวของการ์ดวิดีโอด้วยการสนับสนุนของ GPU Boost 3.0 รายละเอียดบางอย่างมีการเปลี่ยนแปลง NVIDIA ต้องทำการอธิบายเพิ่มเติมในคำแนะนำในการโอเวอร์คล็อกผลิตภัณฑ์ใหม่ มีเทคนิคการเร่งความเร็วที่แตกต่างกันกับตัวแปรต่าง ๆ ที่มีผลต่อผลลัพธ์สุดท้าย สำหรับแต่ละระบบเฉพาะอาจดีกว่าที่จะเข้าใกล้วิธีการเฉพาะบางอย่าง แต่พื้นฐานมักจะเหมือนกันเสมอ

นักโอเวอร์คล็อกหลายคนในการตรวจสอบความเสถียรของระบบใช้เกณฑ์มาตรฐาน UNIGINE สวรรค์ 4.0 ซึ่งโหลดโปรเซสเซอร์กราฟิกที่มีงานมีการตั้งค่าที่ยืดหยุ่นและสามารถเรียกใช้ในโหมดหน้าต่างด้วยหน้าต่างยูทิลิตี้สำหรับการโอเวอร์คล็อกและตรวจสอบใกล้เช่น EVGA ความแม่นยำหรือ MSI Afterburner อย่างไรก็ตามการตรวจสอบดังกล่าวเพียงพอสำหรับการโจมตีครั้งแรกเท่านั้นและเพื่อยืนยันความเสถียรของการโอเวอร์คล็อกที่แข็งแกร่งเท่านั้นมันจะต้องได้รับการตรวจสอบในแอปพลิเคชั่นเกมหลายเกมเนื่องจากเกมที่แตกต่างกันแนะนำให้โหลดที่แตกต่างกันในบล็อกการทำงาน GPU ต่างๆ: คณิตศาสตร์, พื้นผิว, เรขาคณิต . สวรรค์ 4.0 เกณฑ์มาตรฐานยังสะดวกสำหรับงานโอเวอร์คล็อกเพราะมีโหมดการใช้งานที่มีการทำงานที่สะดวกในการเปลี่ยนการตั้งค่าการโอเวอร์คล็อกและมีเกณฑ์มาตรฐานเพื่อประเมินความเร็วของความเร็ว

NVIDIA แนะนำเมื่อโอเวอร์คล็อกการ์ดวิดีโอ GeForce GTX 1080 และ GTX 1070 ใหม่เพื่อรันหน้าต่าง Xoc ที่มีความแม่นยำ 4.0 และ EVGA ด้วยกัน ก่อนอื่นขอแนะนำให้เพิ่มความเร็วในการหมุนของพัดลมทันที และสำหรับการโอเวอร์คล็อกที่ร้ายแรงคุณสามารถกำหนดค่าของความเร็วได้ทันที 100% ซึ่งจะทำให้การ์ดวิดีโอทำงานด้วยเสียงดังมาก แต่การระบายความร้อนสูงสุดของ GPU และส่วนประกอบที่เหลือของการ์ดแสดงผลลดอุณหภูมิให้ ระดับต่ำสุดที่เป็นไปได้ป้องกันการเคลื่อนที่ (การลดความถี่เนื่องจากการเติบโตของอุณหภูมิ GPU สูงกว่าค่าที่แน่นอน)

ถัดไปคุณต้องติดตั้งค่าพลังงานเป้าหมาย (เป้าหมายพลังงาน) ยังสูงสุด การตั้งค่านี้จะให้โปรเซสเซอร์กราฟิกที่มีปริมาณพลังงานสูงสุดเท่าที่จะเป็นไปได้เพิ่มระดับการใช้พลังงานและอุณหภูมิ GPU เป้าหมาย (เป้าหมาย Temp GPU) สำหรับวัตถุประสงค์บางอย่างค่าที่สองสามารถแยกออกจากการเปลี่ยนแปลงเป้าหมายพลังงานจากนั้นการตั้งค่าเหล่านี้สามารถกำหนดค่าได้ทีละรายการเพื่อให้ได้ความร้อนขนาดเล็กของชิปวิดีโอตัวอย่างเช่น

ขั้นตอนต่อไปคือการเพิ่มมูลค่าของการเพิ่มความถี่ของชิปวิดีโอ (Offset Clock GPU) - หมายความว่าความถี่เทอร์โบขนาดใหญ่คือเมื่อทำงาน ค่านี้เพิ่มความถี่สำหรับค่าแรงดันไฟฟ้าทั้งหมดและนำไปสู่ประสิทธิภาพที่มากขึ้น ตามปกติเมื่อการโอเวอร์คล็อกคุณต้องตรวจสอบความเสถียรเมื่อเพิ่มความถี่ของ GPU ในขั้นตอนเล็ก ๆ จาก 10 MHz ถึง 50 MHz ขั้นตอนหนึ่งก่อนที่คุณจะแขวนข้อผิดพลาดของคนขับหรือแอปพลิเคชันหรือแม้กระทั่งสิ่งประดิษฐ์ภาพ เมื่อถึงขีด จำกัด ดังกล่าวมีความจำเป็นต้องลดค่าความถี่ในการก้าวลงและตรวจสอบเสถียรภาพและประสิทธิภาพเมื่อโอเวอร์คล็อก

นอกจากความถี่ GPU แล้วคุณยังสามารถเพิ่มความถี่หน่วยความจำวิดีโอ (ออฟเซ็ตนาฬิกาหน่วยความจำ) ซึ่งมีความสำคัญอย่างยิ่งในกรณีของ GeForce GTX 1070 พร้อมกับหน่วยความจำ GDDR5 ซึ่งมักจะเร่งได้ดี กระบวนการในกรณีของความถี่ของหน่วยความจำซ้ำแล้วซ้ำอีกสิ่งที่กำลังทำอยู่เมื่อค้นหาความถี่ GPU ที่เสถียรความแตกต่างเพียงอย่างเดียวคือขั้นตอนสามารถทำได้มากขึ้น - เพื่อเพิ่ม 50-100 MHz ในครั้งเดียวกับความถี่ฐาน

นอกเหนือจากขั้นตอนที่อธิบายไว้ข้างต้นคุณสามารถเพิ่มขีด จำกัด แรงดันไฟฟ้า (overvoltage) เนื่องจากความถี่ที่สูงขึ้นของโปรเซสเซอร์กราฟิกมักจะประสบความสำเร็จด้วยแรงดันไฟฟ้าที่เพิ่มขึ้นเมื่อทำงานชิ้นส่วนที่ไม่เสถียรของ GPU ได้รับพลังงานเพิ่มเติม จริงข้อเสียที่อาจเกิดขึ้นของค่านี้คือความเป็นไปได้ของความเสียหายต่อชิปวิดีโอและความล้มเหลวเร่งดังนั้นจึงจำเป็นต้องใช้แรงดันไฟฟ้าที่มีความระมัดระวังอย่างยิ่ง

ผู้ที่ชื่นชอบการโอเวอร์คล็อกใช้เทคนิคต่าง ๆ ที่แตกต่างกันเปลี่ยนพารามิเตอร์ในลำดับที่แตกต่างกัน ตัวอย่างเช่นโอเวอร์คล็อกบางคนแบ่งปันการทดลองในการค้นหาความถี่ GPU ที่เสถียรและหน่วยความจำเพื่อไม่รบกวนซึ่งกันและกันแล้วทดสอบการโอเวอร์คล็อกและชิปวิดีโอและชิปหน่วยความจำ แต่สิ่งเหล่านี้เป็นรายละเอียดที่ไม่เกี่ยวข้องของวิธีการที่ไม่เกี่ยวข้องของแต่ละวิธี

ตัดสินจากความคิดเห็นในฟอรัมและความคิดเห็นต่อบทความผู้ใช้บางคนไม่ได้ลิ้มรสอัลกอริทึม GPU Boost 3.0 ใหม่เมื่อความถี่ GPU ลดลงครั้งแรกที่สูงมากมักจะสูงกว่าความถี่เทอร์โบ แต่ภายใต้อิทธิพลของเทอร์โบ อุณหภูมิของ GPU หรือการใช้พลังงานที่เพิ่มขึ้นดังกล่าวข้างต้นสามารถลดลงได้อย่างมีนัยสำคัญ นี่เป็นเพียงข้อมูลเฉพาะของอัลกอริทึมที่อัปเดตคุณต้องคุ้นเคยกับพฤติกรรมใหม่ของความถี่ GPU ที่เปลี่ยนแปลงแบบไดนามิก แต่มันไม่ได้ส่งผลกระทบเชิงลบใด ๆ

การ์ดวิดีโอ GeForce GTX 1070 ได้กลายเป็นรุ่นที่สองหลังจากรุ่น GTX 1080 ในบรรทัดใหม่ของ NVIDIA ขึ้นอยู่กับโปรเซสเซอร์กราฟิก Pascal กระบวนการทางเทคโนโลยีใหม่ของ FinFET 16 NM และการเพิ่มประสิทธิภาพของสถาปัตยกรรมทำให้การ์ดแสดงผลแสดงให้เห็นถึงความถี่นาฬิกาที่มีความถี่สูงซึ่งจะช่วยให้เทคโนโลยี GPU Boost รุ่นใหม่ได้ แม้จะมีจำนวนบล็อกการทำงานที่ถูกตัดแต่งในรูปแบบของการสตรีมโปรเซสเซอร์และโมดูลพื้นผิว แต่จำนวนของพวกเขายังคงเพียงพอเพื่อให้ GTX 1070 กลายเป็นโซลูชันที่มีประสิทธิภาพที่สุดและประหยัดพลังงาน

การติดตั้งสำหรับการเปิดตัวรุ่นที่อายุน้อยกว่าของการ์ดวิดีโอ NVIDIA ในหน่วยความจำ GDDR5 GP104 GP104 ชิปซึ่งแตกต่างจากประเภท GDDR5X ใหม่ซึ่งมีลักษณะโดย GTX 1080 ไม่ได้ป้องกันจากการบรรลุตัวบ่งชี้ประสิทธิภาพสูง ครั้งแรกที่ NVIDIA ตัดสินใจที่จะไม่ตัดรถบัสหน่วยความจำของรุ่น GeForce GTX 1070 และประการที่สองมันถูกติดตั้งบนหน่วยความจำ GDDR5 ที่เร็วที่สุดพร้อมความถี่ที่มีประสิทธิภาพ 8 GHz ซึ่งอยู่ต่ำกว่า 10 GDDR5X รุ่นเก่า เมื่อพิจารณาถึงอัลกอริทึมการบีบอัดเดลต้าที่ดีขึ้นความจุแบนด์วิดท์ที่มีประสิทธิภาพของโปรเซสเซอร์กราฟิกได้กลายเป็นเหนือพารามิเตอร์เดียวกันในรูปแบบที่คล้ายกันของ GeForce GTX 970 ก่อนหน้านี้

GeForce GTX 1070 ดีเพราะมีประสิทธิภาพสูงมากและรองรับคุณสมบัติและอัลกอริทึมใหม่ในราคาที่น้อยกว่าอย่างมีนัยสำคัญเมื่อเทียบกับรุ่นเก่าประกาศก่อนหน้านี้เล็กน้อย หากการเข้าซื้อกิจการของ GTX 1080 เป็นเวลา 55,000 คนสำหรับตัวเองสามารถอนุญาตให้หน่วยของผู้ที่ชื่นชอบได้รับ 35,000 เพียงหนึ่งในสี่การตัดสินใจที่มีประสิทธิผลน้อยลงอย่างราบรื่นด้วยโอกาสเดียวกันสามารถมีผู้ซื้อที่มีศักยภาพมากขึ้น มันเป็นการรวมกันของราคาที่ค่อนข้างต่ำและประสิทธิภาพสูงทำให้ GeForce GTX 1070 บางทีการเข้าซื้อกิจการที่ทำกำไรได้มากที่สุดในเวลาที่ปล่อย

GeForce GTX 1060 ตัวเร่งกราฟิค

พารามิเตอร์ค่า
ชิปชื่อรหัสGP106
เทคโนโลยีการผลิต16 nm finfet
จำนวนทรานซิสเตอร์4.4 พันล้าน
นิวเคลียสสแควร์200 mm²
สถาปัตยกรรมแบบครบวงจรพร้อมโปรเซสเซอร์ทั่วไปสำหรับการสตรีมชนิดข้อมูลจำนวนมาก: จุดยอด, พิกเซล, ฯลฯ
รองรับฮาร์ดแวร์ DirectXDirectX 12 พร้อมรองรับระดับฟีเจอร์ 12_1
บัสหน่วยความจำ192 - bit: ตัวควบคุมหน่วยความจำ 32 บิตอิสระหกตัวพร้อมรองรับหน่วยความจำ GDDR5
ความถี่ของตัวประมวลผลกราฟิก1506 (1708) MHz
บล็อกคอมพิวเตอร์10 การสตรีมมัลติโปรเซสเซอร์ประกอบด้วย Scalar 1280 Scalar Alu สำหรับ Semicolons ลอยอยู่ในมาตรฐาน IEEE 754-2008;
บล็อกพื้นผิว80 บล็อกของการจัดการกับพื้นผิวและการกรองด้วยการรองรับคอมโพเนนต์ FP16- และ FP32 ในพื้นผิวและการรองรับการกรอง Trilinear และ Anisotropic สำหรับทุกรูปแบบพื้นผิว
บล็อกของการดำเนินงานแรสเตอร์ (ROP)6 บล็อก ROP กว้าง (48 พิกเซล) พร้อมการสนับสนุนโหมดการทำให้เรียบต่าง ๆ รวมถึงโปรแกรมและที่รูปแบบบัฟเฟอร์เฟรม FP16 หรือ FP32 บล็อกประกอบด้วยอาร์เรย์ของ ALU ที่กำหนดค่าได้และมีหน้าที่รับผิดชอบในการเปรียบเทียบรุ่นและเชิงลึกหลายอย่างและการผสม
รองรับการตรวจสอบการสนับสนุนแบบบูรณาการสำหรับจอภาพมากถึงสี่จอเชื่อมต่อกับอินเตอร์เฟส Dual Link DVI, HDMI 2.0B และ DisplayPort 1.2 (1.3 / 1.4 พร้อม)

ข้อมูลจำเพาะของการ์ดแสดงผล GeForce GTX 1060
พารามิเตอร์ค่า
ความถี่ของนิวเคลียส1506 (1708) MHz
จำนวนโปรเซสเซอร์สากล1280
จำนวนบล็อกพื้นตา80
จำนวนบล็อกที่ทำผิดพลาด48
ความถี่หน่วยความจำที่มีประสิทธิภาพ8000 (4 × 2000) MHz
ประเภทหน่วยความจำGDDR5
บัสหน่วยความจำ192 บิต
หน่วยความจำ6 gb
แบนด์วิดธ์หน่วยความจำ192 gb / s
ประสิทธิภาพการคำนวณ (FP32)ประมาณ 4 teraflops
ความเร็วสูงสุดทางทฤษฎีสูงสุด72 กิกพิกเซล / ด้วย
พื้นผิวตัวอย่างการสุ่มตัวอย่างเชิงทฤษฎี121 golatexels / ด้วย
ยางPCI Express 3.0
ตัวเชื่อมต่อหนึ่งเชื่อมต่อ Dual Link DVI หนึ่ง HDMI และสาม DisplayPort
การใช้พลังงานทั่วไป120 ว.
อาหารเพิ่มเติมขั้วต่อ 6 พินหนึ่งตัว
จำนวนสล็อตที่ครอบครองในกรณีของระบบ2
แนะนำราคา$ 249 ($ 299) ในสหรัฐอเมริกาและ 18,990 ในรัสเซีย

การ์ดแสดงผล GeForce GTX 1060 ยังได้รับชื่อคล้ายกับโซลูชันเดียวกันจากชุด GeForce ก่อนหน้านี้แตกต่างจากชื่อของรุ่นก่อนของ GeForce GTX 960 เพียงการเปลี่ยนรุ่นแรกที่เปลี่ยนไป ความแปลกใหม่ได้กลายเป็นบรรทัดปัจจุบันของ บริษัท ที่จะขั้นตอนด้านล่างโซลูชั่น GeForce GTX 1070 ที่เปิดตัวก่อนหน้านี้ซึ่งเป็นความเร็วเฉลี่ยในซีรีส์ใหม่

ราคาที่แนะนำสำหรับ บริษัท วิดีโอการ์ดใหม่ NVIDIA คือ $ 249 และ $ 299 สำหรับคู่ค้าของ บริษัท และรุ่นพิเศษของผู้ก่อตั้งฉบับพิเศษตามลำดับ เมื่อเทียบกับรุ่นอาวุโสสองรุ่นนี่เป็นราคาที่ดีมากเนื่องจากรุ่น GTX 1060 ใหม่นั้นต่ำกว่าการชำระเงินสูงสุด แต่ไม่มากเท่าที่ราคาถูกกว่า ในช่วงเวลาของการประกาศความแปลกใหม่ได้อย่างสมบูรณ์แบบกลายเป็นสิ่งที่ดีที่สุดในแง่ของประสิทธิภาพในชั้นเรียนและหนึ่งในข้อเสนอที่ทำกำไรได้มากที่สุดในช่วงราคานี้

รูปแบบการ์ดวิดีโอของตระกูล NVIDIA ของ NVIDIA ตระกูลได้ออกมาเพื่อต่อต้านการแก้ปัญหาล่าสุดของ บริษัท คู่แข่งของ AMD ซึ่งก่อนหน้านี้เปิดตัวตลาด Radeon RX 480 เพื่อเปรียบเทียบนวนิยาย NVIDIA กับการ์ดวิดีโอนี้แม้ว่ามันจะเป็น ไม่แตกต่างกันโดยตรงทั้งหมดเนื่องจากพวกเขายังคงแตกต่างกันมากในราคา. GeForce GTX 1060 มีราคาแพงกว่า ($ 249-299 กับ $ 199-229) แต่ก็เห็นได้ชัดว่าคู่แข่งอย่างรวดเร็ว

หน่วยประมวลผลกราฟิก GP106 มีบัสหน่วยความจำ 192 บิตดังนั้นปริมาณของหน่วยความจำที่ติดตั้งบนการ์ดแสดงผลด้วยยางรถยนต์ดังกล่าวสามารถเป็น 3 หรือ 6 GB ค่าเล็ก ๆ น้อย ๆ ในสภาพที่ทันสมัยนั้นไม่เพียงพอและโครงการเกมมากมายแม้ในความละเอียด Full HD จะพักในการขาดแคลนหน่วยความจำวิดีโอซึ่งจะส่งผลกระทบต่อความราบรื่นของการเรนเดอร์อย่างจริงจัง เพื่อให้แน่ใจว่าประสิทธิภาพสูงสุดของโซลูชันใหม่ในการตั้งค่าสูงโมเดลการ์ดวิดีโอ GeForce GTX 1060 มาพร้อมกับหน่วยความจำวิดีโอ 6 GB ซึ่งเพียงพอที่จะเริ่มแอปพลิเคชัน 3D ใด ๆ ด้วยการตั้งค่าคุณภาพใด ๆ ยิ่งไปกว่านั้นวันนี้ไม่มีความแตกต่างระหว่าง 6 ถึง 8 GB และเงินบางอย่างจะช่วยประหยัดโซลูชันดังกล่าว

มูลค่าของนวัตกรรมทั่วไปสำหรับความแปลกใหม่คือ 120 วัตต์ซึ่งน้อยกว่าค่าสำหรับ GTX 1070 โดย 20% และเท่ากับการใช้พลังงานของการ์ดวิดีโอ GeForce GTX 960 รุ่นก่อนหน้าซึ่งมีประสิทธิภาพและความสามารถน้อยกว่ามาก บอร์ดอ้างอิงมีชุดเชื่อมต่อที่คุ้นเคยสำหรับการติดตั้งอุปกรณ์เอาต์พุตภาพ: DWI ลิงค์ DVI หนึ่งตัวหนึ่ง HDMI และสาม DisplayPort นอกจากนี้ HDMI และ DisplayPort รุ่นใหม่ที่ปรากฏขึ้นซึ่งเราเขียนเกี่ยวกับรุ่น GTX 1080

ความยาวค่าธรรมเนียมอ้างอิง GeForce GTX 1060 คือ 9.8 นิ้ว (25 ซม.) และจากความแตกต่างจากตัวเลือกอาวุโสแยกต่างหากทราบว่า GeForce GTX 1060 ไม่รองรับการกำหนดค่าของ SLI หลายการแสดงผลและไม่มีช่องเสียบพิเศษสำหรับสิ่งนี้ เนื่องจากคณะกรรมการใช้พลังงานน้อยกว่ารุ่นเก่าให้ติดตั้งขั้วต่อ PCI-E Power Power Supply 6 พินหนึ่งตัวพร้อมกับค่าธรรมเนียม

การ์ดวิดีโอ GeForce GTX 1060 ปรากฏในตลาดตั้งแต่ประกาศผลิตภัณฑ์ของ บริษัท : ASUS, EVGA, Gainward, GIGABYTE, Innovision 3D, MSI, Palit, Zotac รุ่นพิเศษของรุ่นผู้ก่อตั้ง GeForce GTX 1060 ที่ผลิตโดย NVIDIA จะได้รับการปล่อยตัวในจำนวนที่ จำกัด ซึ่งจะขายในราคา $ 299 โดยเฉพาะบนเว็บไซต์ของ NVIDIA และอย่างเป็นทางการในรัสเซียจะนำเสนอ รุ่นของผู้ก่อตั้งเป็นลักษณะที่ทำจากวัสดุและส่วนประกอบคุณภาพสูงรวมถึงกล่องอลูมิเนียมและใช้ระบบทำความเย็นที่มีประสิทธิภาพรวมถึงโซ่พาวเวอร์ซัพพลายต้านทานต่ำและหน่วยงานกำกับดูแลแรงดันไฟฟ้าการออกแบบพิเศษ

การเปลี่ยนแปลงทางสถาปัตยกรรม

การ์ดวิดีโอ GeForce GTX 1060 ขึ้นอยู่กับโปรเซสเซอร์กราฟิกใหม่อย่างแน่นอนของรุ่น GP106 ซึ่งไม่ทำงานที่แตกต่างจากสถาปัตยกรรมปาสคาลคนแรกเกิดในรูปแบบของชิป GP104 ซึ่งอธิบายรุ่น GeForce GTX 1080 และ GTX 1070 ที่อธิบายไว้ข้างต้น สถาปัตยกรรมนี้มีพื้นฐานมาจากการแก้ปัญหาในการทำงานในยัง Maxwell แต่มีความแตกต่างในการทำงานบางอย่างที่เราเขียนรายละเอียดก่อนหน้านี้

ชิปวิดีโอ GP106 บนอุปกรณ์นั้นคล้ายกับชิป Pascal Top และโซลูชั่นที่คล้ายกันของสถาปัตยกรรม Maxwell และคุณสามารถค้นหาข้อมูลรายละเอียดเกี่ยวกับอุปกรณ์ GPU ที่ทันสมัยในความคิดเห็นของเราของ NVIDIA เช่นเดียวกับโปรเซสเซอร์กราฟิกก่อนหน้าชิปของสถาปัตยกรรมใหม่มีการกำหนดค่าที่แตกต่างกันของคลัสเตอร์ประมวลผลกราฟิกคลัสเตอร์การประมวลผลคลัสเตอร์การสตรีมมัลติโปรเซสเซอร์สตรีมมัวไหลมัลติโปรเซสเซอร์ (SM) และหน่วยความจำควบคุม:

หน่วยประมวลผลกราฟิก GP106 มีกลุ่ม GPC สองตัวที่ประกอบด้วย 10 การสตรีมมัลติโปรเซสเซอร์ (การสตรีมมัลติโปรเซสเซอร์ - SM) นั่นคือครึ่งหนึ่งของ GP104 ที่มีอยู่เดิม เช่นเดียวกับใน GPU อาวุโสแต่ละเครื่องกรองแต่ละเครื่องมีนิวเคลียสคอมพิวเตอร์ 128 บล็อก TOMU 8 บล็อก 256 KB หน่วยความจำลงทะเบียนหน่วยความจำที่ใช้ร่วมกัน 96 KB และแคชระดับแรก 48 KB เป็นผลให้ GeForce GTX 1060 มีนิวเคลียสคอมพิวเตอร์จำนวน 1280 ตัวและโมดูลพื้นผิว 80 ตัว - เล็กกว่า GTX 1080 สองเท่า

แต่ระบบย่อยหน่วยความจำ GeForce GTX 1060 ไม่ได้ถูกตัดแต่งโดยลดลงครึ่งหนึ่งที่สัมพันธ์กับโซลูชันยอดนิยมมันมีตัวควบคุมหน่วยความจำ 32 บิตหกตัวที่ให้หน่วยความจำรวม 192 บิต ด้วยความถี่ที่มีประสิทธิภาพของหน่วยความจำ GDDR5-Video สำหรับ GeForce GTX 1060 เท่ากับ 8 GHz แบนด์วิดท์ถึง 192 GB / S ซึ่งเป็นสิ่งที่ดีมากที่จะแก้ปัญหาราคานี้โดยเฉพาะอย่างยิ่งเมื่อพิจารณาถึงประสิทธิภาพสูงใน Pascal แปดของ ROP และ 256 KB ของบล็อกแคชระดับที่สองเชื่อมโยงกับตัวควบคุมหน่วยความจำแต่ละตัวดังนั้นโดยทั่วไปแล้วเวอร์ชันเต็มของหน่วยประมวลผลกราฟิก GP106 เต็มรูปแบบมี 48 บล็อกของ ROP และ 1536 CB L2-Cache

เพื่อลดแบนด์วิดท์หน่วยความจำและการใช้งานที่มีประสิทธิภาพมากขึ้นของปาสคาลที่มีอยู่ในสถาปัตยกรรมปาสกาลการบีบอัดข้อมูลโดยไม่สูญเสียเพิ่มขึ้นนอกจากนี้ยังมีความสามารถในการบีบอัดข้อมูลในบัฟเฟอร์เพิ่มประสิทธิภาพและประสิทธิภาพการทำงานที่เพิ่มขึ้น โดยเฉพาะอย่างยิ่งวิธีการใหม่ของการบีบอัดเดลต้าที่มีอัตราส่วน 4: 1 และ 8: 1 ถูกเพิ่มเข้าไปในชิปของตระกูลใหม่ที่มีอัตราส่วน 4: 1 และ 8: 1 ให้เพิ่มประสิทธิภาพเพิ่มเติม 20% ของ PSP เมื่อเทียบกับโซลูชันก่อนหน้าของตระกูล Maxwell

ความถี่พื้นฐานของ GPU ใหม่เท่ากับ 1506 MHz - ความถี่ไม่ควรสืบเชื้อสายมาจากหลักการด้านล่างเครื่องหมายนี้ ความถี่เทอร์โบทั่วไป (Boost Clock) จะสูงขึ้นมากและเท่ากับ 1708 MHz เป็นค่าเฉลี่ยของความถี่ที่แท้จริงซึ่งชิปกราฟิก GeForce GTX 1060 ทำงานในชุดเกมขนาดใหญ่และแอปพลิเคชัน 3D ความถี่ Boost ที่แท้จริงขึ้นอยู่กับเกมและเงื่อนไขที่ทดสอบการทดสอบ

เช่นเดียวกับส่วนที่เหลือของโซลูชั่นครอบครัว Pascal รุ่น GeForce GTX 1060 ไม่เพียง แต่ทำงานกับความถี่ของนาฬิกาที่มีประสิทธิภาพสูง แต่มีอัตรากำไรขั้นสูงเช่นเดียวกับการโอเวอร์คล็อก การทดลองครั้งแรกพูดถึงความเป็นไปได้ในการบรรลุความถี่ของการสั่งซื้อ 2 GHz ไม่น่าแปลกใจที่พันธมิตรของ บริษัท จัดทำขึ้นรวมถึงการกระจายตัวแปรจากโรงงานการ์ด GTX 1060

ดังนั้นการเปลี่ยนแปลงหลักในสถาปัตยกรรมใหม่คือกระบวนการทางเทคโนโลยีของ FinFET 16 NM การใช้งานในการผลิตของ GP106 ทำให้สามารถเพิ่มความซับซ้อนของชิปได้อย่างมีนัยสำคัญในขณะที่รักษาพื้นที่ค่อนข้างต่ำใน 200 mm²ดังนั้นนี้ ชิปสถาปัตยกรรม Pascal มีจำนวนบล็อกผู้บริหารจำนวนมากที่เห็นได้ชัดเมื่อเทียบกับชิป Maxwell ตำแหน่งที่คล้ายกันที่ผลิตโดยใช้กระบวนการทางเทคนิคของ 28 นาโนเมตร

หาก GM206 (GTX 960) ที่มีพื้นที่ 227 มม. มีต่ำกว่า 3 พันล้านทรานซิสเตอร์และ 1024 ALU, 64 TMU, 32 ROP และรถบัส 128- บิตจากนั้น GPU ใหม่ได้รองรับใน 200 mm²แล้ว 4.4 พันล้านทรานซิสเตอร์แล้ว 1280 ALU, 80 TMU และ 48 ROP พร้อมรถบัส 192 บิต ใช่มีเกือบหนึ่งครั้งครึ่งครั้งที่มีความถี่สูงกว่า: 1506 (1708) กับ 1126 (1178) MHz และนี่คือการใช้พลังงานเดียวกัน 120 W! เป็นผลให้หน่วยประมวลผลกราฟิก GP106 ได้กลายเป็นหนึ่งในโปรเซสเซอร์กราฟิกที่ประหยัดพลังงานมากที่สุดพร้อมกับ GP104

ใหม่ NVIDIA Technologies

หนึ่งในเทคโนโลยีที่น่าสนใจที่สุดของ บริษัท ที่ได้รับการสนับสนุนจาก GeForce GTX 1060 และการแก้ปัญหาอื่น ๆ ของตระกูล Pascal คือเทคโนโลยี NVIDIA พร้อมกันหลายฉาย. เราได้เขียนเกี่ยวกับเทคโนโลยีนี้แล้วในการตรวจสอบ GeForce GTX 1080 ช่วยให้คุณใช้เทคนิคใหม่ ๆ หลายอย่างสำหรับการเพิ่มประสิทธิภาพการเรนเดอร์ โดยเฉพาะอย่างยิ่งการฉายภาพ VR พร้อมกันในครั้งเดียวสำหรับสองดวงตาในบางครั้งการเพิ่มประสิทธิภาพในการใช้ GPU ในความเป็นจริงเสมือนจริง

เพื่อรองรับ SMP ในโปรเซสเซอร์กราฟิกทุกตัวตระกูล Pascal มีเครื่องยนต์พิเศษซึ่งตั้งอยู่ในเครื่องยนต์ Polymorph ในตอนท้ายของลำเลียงเรขาคณิตต่อหน้าหน่วย Rasterization ด้วยความช่วยเหลือของมัน GPU สามารถฉายภาพแบบเรขาคณิตในเชิงเรขาคณิตสำหรับการประมาณการหลายอย่างจากจุดหนึ่งในขณะที่การคาดการณ์เหล่านี้อาจเป็นสเตอริโอ (I.e. ได้รับการสนับสนุนประมาณ 16 หรือ 32 ชิ้นในเวลาเดียวกัน) คุณสมบัตินี้ช่วยให้โปรเซสเซอร์กราฟิก Pascal ทำซ้ำพื้นผิวโค้งอย่างแม่นยำสำหรับการเรนเดอร์ VR และเอาท์พุทภาพไปยังระบบ Domuclear ได้อย่างถูกต้อง

เป็นสิ่งสำคัญที่เทคโนโลยีหลายโครงการพร้อมกันได้รวมเข้ากับเครื่องยนต์เกมยอดนิยม (Unreal Engine และ Unity) และเกมและวันนี้การสนับสนุนของเทคโนโลยีได้รับการกล่าวถึงมากกว่า 30 เกมในการพัฒนารวมถึงโครงการที่รู้จักกันดีเช่น ทัวร์นาเมนต์ Unreal, VR phropnation, Everest VR, Obduction, ADR1FT และข้อมูลดิบ ที่น่าสนใจแม้ว่าการแข่งขันจริงไม่ได้เล่น VR แต่ใน SMP นั้นใช้เพื่อให้ได้ภาพที่ดีขึ้นและปรับปรุงประสิทธิภาพการทำงาน

อีกหนึ่งเทคโนโลยีที่รอคอยมานานกลายเป็นเครื่องมือที่มีประสิทธิภาพในการสร้างภาพหน้าจอในเกม Nvidia Ansel. เครื่องมือนี้ช่วยให้คุณสร้างภาพหน้าจอที่ผิดปกติและคุณภาพสูงจากเกมด้วยความสามารถที่ไม่สามารถเข้าถึงได้ก่อนหน้านี้ทำให้พวกเขามีความละเอียดสูงมากและเสริมเอฟเฟกต์ต่าง ๆ และแบ่งปันผลงานของคุณ ANSE สช่วยให้คุณสร้างภาพหน้าจออย่างแท้จริงในขณะที่ศิลปินต้องการติดตั้งกล้องด้วยพารามิเตอร์ใด ๆ กับจุดใดก็ได้ของฉากกำหนดให้กับตัวกรองโพสต์ที่มีประสิทธิภาพของภาพหรือแม้กระทั่งสแน็ปช็อต 360 องศาเพื่อดูในหมวกนิรภัยเสมือนจริง

NVIDIA ได้มาตรฐานการรวมส่วนต่อประสานผู้ใช้ ANSEL ไปยังเกมและมันง่ายมากที่จะเพิ่มลงในรหัสหลายบรรทัด คุณไม่จำเป็นต้องรอการปรากฏตัวของโอกาสนี้ในเกมคุณสามารถประเมินความสามารถของ ANSEL ในขณะนี้ใน Game Mirror's Edge: ตัวเร่งปฏิกิริยาและในภายหลังมันจะมีอยู่ใน Witcher 3: Wild Hunt นอกจากนี้ในการพัฒนามีหลายโครงการเกมที่รองรับ Ansel รวมถึงเกมเช่น Fortnite, Paragon และ Unreal Tournament, Obduction, พยาน, กฎหมาย, Tom Clancy's the Division, No Sky และคนอื่น ๆ

นอกจากนี้หน่วยประมวลผลกราฟิก GeForce GTX 1060 ใหม่รองรับแพ็คเกจเครื่องมือ nvidia vrworksสนับสนุนนักพัฒนาเพื่อสร้างโครงการที่น่าประทับใจสำหรับความเป็นจริงเสมือนจริง แพคเกจนี้มีโปรแกรมอรรถประโยชน์และเครื่องมือมากมายสำหรับนักพัฒนารวมถึง VRWorks Audio ช่วยให้คุณสามารถคำนวณการสะท้อนของคลื่นเสียงจากวัตถุที่เกิดเหตุโดยใช้การติดตามเรย์บน GPU แพคเกจรวมถึงการรวมใน VR และเอฟเฟกต์ทางกายภาพทางกายภาพเพื่อให้แน่ใจว่าพฤติกรรมที่ถูกต้องทางร่างกายของวัตถุในฉาก

หนึ่งในเกมเสมือนจริงที่ฉลาดที่สุดที่ได้รับประโยชน์จาก VRWorks กลายเป็น VR Funhouse - เกมในความเป็นจริงเสมือนจริงของ NVIDIA ซึ่งมีให้ฟรีในบริการไอน้ำวาล์วฟรี เกมนี้ขึ้นอยู่กับเครื่องยนต์ Unreal Engine 4 (เกมมหากาพย์) และใช้งานได้กับการ์ดวิดีโอ GeForce GTX 1080, 1070 และ 1060 ในมัดด้วย HTC Vive VR Helmets ยิ่งไปกว่านั้นซอร์สโค้ดของเกมนี้จะเปิดเผยต่อสาธารณะซึ่งจะช่วยให้นักพัฒนารายอื่นใช้แนวคิดและรหัสสำเร็จรูปแล้วใน VR Rides เชื่อเราในพระวจนะนี่เป็นหนึ่งในการสาธิตที่น่าประทับใจที่สุดของความเป็นไปได้ของความเป็นจริงเสมือนจริง

รวมถึงเทคโนโลยี SMP และ VRWorks การใช้โปรเซสเซอร์กราฟิก GeForce GTX 1060 ในแอปพลิเคชัน VR ให้ผลผลิตเพียงพอสำหรับระดับเริ่มต้นและ GPU ที่เป็นปัญหาสอดคล้องกับระดับฮาร์ดแวร์ขั้นต่ำที่จำเป็นรวมถึง SteamVR กลายเป็นหนึ่งในการเข้าซื้อกิจการที่ประสบความสำเร็จมากที่สุด สำหรับใช้ในระบบที่มีการสนับสนุนอย่างเป็นทางการ VR

เนื่องจากรุ่น GeForce GTX 1060 ขึ้นอยู่กับชิป GP106 ซึ่งไม่ด้อยกว่าหน่วยประมวลผลกราฟิก GP104 ซึ่งได้กลายเป็นพื้นฐานสำหรับการปรับเปลี่ยนที่เก่ากว่านั้นสนับสนุนเทคโนโลยีทั้งหมดที่อธิบายไว้ข้างต้นอย่างแน่นอน

การ์ดวิดีโอ GeForce GTX 1060 ได้กลายเป็นรุ่นที่สามในบรรทัดใหม่ของ NVIDIA ขึ้นอยู่กับโปรเซสเซอร์กราฟิก Pascal กระบวนการทางเทคโนโลยีใหม่ของ FinFET 16 NM และการเพิ่มประสิทธิภาพของสถาปัตยกรรมอนุญาตให้การ์ดวิดีโอใหม่ทั้งหมดสามารถบรรลุความถี่และสถานที่นาฬิกาสูงใน GPU บล็อกที่ใช้งานได้มากขึ้นในรูปแบบของโปรเซสเซอร์สตรีมมิ่งโมดูลพื้นผิวและอื่น ๆ เมื่อเทียบกับชิปวิดีโอของ รุ่นก่อนหน้า นั่นคือเหตุผลที่รุ่น GTX 1060 ได้กลายเป็นวิธีการแก้ปัญหาที่มีประสิทธิภาพและประหยัดพลังงานและในชั้นเรียน

เป็นสิ่งสำคัญอย่างยิ่งที่ GeForce GTX 1060 มีประสิทธิภาพสูงเพียงพอและสนับสนุนคุณสมบัติและอัลกอริทึมใหม่ในราคาที่น้อยกว่าอย่างมีนัยสำคัญเมื่อเทียบกับโซลูชันที่เก่ากว่าใน GP104 ชิปกราฟิก GP106 ที่ใช้ในรุ่นใหม่ให้ประสิทธิภาพที่ดีที่สุดและประสิทธิภาพการใช้พลังงานในชั้นเรียน รุ่น GeForce GTX 1060 ได้รับการออกแบบมาเป็นพิเศษและเหมาะสำหรับทุกเกมที่ทันสมัยในการตั้งค่ากราฟิกที่สูงและสูงสุดในความละเอียด 1920x1080 และแม้จะมีการปรับให้เรียบแบบเต็มหน้าจอด้วยวิธีการต่าง ๆ (FXAA, MFAA หรือ MSAA)

และสำหรับผู้ที่ต้องการประสิทธิภาพที่สูงขึ้นในการปรากฏตัวของจอแสดงผลความละเอียดสูงพิเศษ NVIDIA มีการ์ดรุ่นยอดเยี่ยม GeForce GTX 1070 และ GTX 1080 ซึ่งเป็นสิ่งที่ดีมากในแง่ของประสิทธิภาพและประสิทธิภาพการใช้พลังงาน อย่างไรก็ตามการรวมกันของราคาที่ต่ำและประสิทธิภาพที่เพียงพอนั้นมีความโดดเด่นอย่างมากจาก GeForce GTX 1060 กับพื้นหลังของโซลูชั่นอาวุโส เมื่อเทียบกับการแข่งขัน Radeon RX 480 โซลูชัน NVIDIA นั้นค่อนข้างเร็วกว่าด้วยความซับซ้อนและพื้นที่ GPU ที่เล็กลงและมีประสิทธิภาพการใช้พลังงานที่ดีขึ้นอย่างมีนัยสำคัญ จริงมันขายค่อนข้างแพงกว่าดังนั้นการ์ดวิดีโอแต่ละใบจึงมีช่องของตัวเอง