Gtx 690 тесты в современных играх

Чуть больше недели назад мы получили посылку от NVIDIA , в которой находился ломик-гвоздодёр. Если данный шаг подразумевался как первый аккорд в грядущем анонсе GeForce GTX 690, то PR-отдел Nvidia - просто молодцы. Удивительно, но наперекор своим традициям Nvidia на своём мероприятии в Шанхае приоткрыла завесу тайны над видеокартой GeForce GTX 690 даже раньше NDA, причём привела технические спецификации. Конечно, по поводу GeForce GTX 690 ходили бесчисленные слухи, но Nvidia выбрала такой оригинальный "выход с ломиком". Между тем наша тестовая лаборатория уже получила образец GeForce GTX 690, с результатами тестов которого вы сможете ознакомиться в статье.

На мероприятии NVIDIA Gaming Festival 2012 в Шанхае (Китай) Джен-Хсун Хуанг (Jen-Hsun Huang), главный исполнительный директор Nvidia, лично представил видеокарту GeForce GTX 690. Весь процесс вы можете посмотреть на 20-минутном ролике ниже:

GeForce GTX 690 - первая видеокарта Nvidia на двух GPU, базирующаяся на новой архитектуре "Kepler". Она использует два графических процессора GK104, то есть GeForce GTX 690 можно рассматривать как "бутерброд" из двух видеокарт GeForce GTX 680, правда, на одной плате. Если вам интересны подробности по поводу архитектуры Kepler, то мы рекомендуем обратиться к нашей статье и тестам GeForce GTX 680 . Ниже мы рассмотрим детали новой видеокарты GeForce GTX 690.

В Европе уже появились первые видеокарты по цене 829 евро. Так что стартовый уровень цен должен быть ниже отметки 1000 евро. Сама Nvidia рекомендует цену 35 999 рублей для России и 9 899 гривен для Украины.

Технические спецификации приведены в следующей таблице:

NVIDIA GeForce GTX 680 NVIDIA GeForce GTX 690
Розничная цена около 475 евро в Европе
18,3 тыс. рублей в России
около 999 евро в Европе
Сайт производителя Страница продукта NVIDIA Страница продукта NVIDIA
Технические спецификации
GPU GK104 2x GK104
Техпроцесс 28 нм 28 нм
Число транзисторов 3,54 млрд. 2x 3,54 млрд.
Тактовая частота GPU 1006 МГц + Boost (1058 МГц) 915 МГц + Boost (1019 МГц)
Тактовая частота памяти 1502 МГц 1502 МГц
Тип памяти GDDR5 GDDR5
Объём памяти 2048 Мбайт 2x 2048 Мбайт
Ширина шины памяти 256 бит 2x 256 бит
Пропускная способность памяти 192,2 Гбайт/с 192,2 Гбайт/с
Версия DirectX 11.1 11.1
Потоковые процессоры 1536 (1D) 2x 1536 (1D)
Текстурные блоки 128 2x 128
ROP 32 2x 32
Пиксельная скорость заполнения 32,2 Гпиксель/с 2x 29,3 Гпиксель/с
Минимальное энергопотребление 15 Вт 15 Вт
Максимальное энергопотребление 195 Вт 300 Вт
SLI/CrossFire SLI SLI

Для GeForce GTX 590 NVIDIA пошла на снижение тактовой частоты GPU с 772 до 608 МГц, что составляет чуть больше 21 процента. Архитектурные детали не изменились, то есть видеокарта предлагает два полноценные GPU Fermi. Что касается памяти, то Nvidia решила снизить частоту 1002 МГц до уровня 854 МГц - почти на 15 процентов. Для новой видеокарты GeForce GTX 690 NVIDIA постаралась лучше соответствовать конфигурации их двух GTX 680 в SLI. NVIDIA снизила тактовую частоту до 915 МГц, но по сравнению с начальной планкой 1006 МГц мы получили замедление всего на девять процентов. Частота памяти была оставлена прежней - 1502 МГц. Всё это позволило Nvidia заявить о практически полной производительности двух графических процессоров GeForce GTX 680. Конечно, всё это стало возможным благодаря более эффективной архитектуре GPU и меньшему техпроцессу. Во многих обзорах отмечалось, что GeForce GTX 680 работает намного эффективнее поколения "Fermi".

Впрочем, NVIDIA всё равно пришлось смириться с наличием двух GPU, поэтому тепловой пакет (TDP) GeForce GTX 690 был увеличен до 300 Вт. Видеокарта GeForce GTX 590, напомним, была выпущена с тепловым пакетом (TDP) 365 Вт, а у AMD Radeon HD 6990 тепловой пакет составлял все 375 Вт (450 Вт в режиме OC). Для обеспечения питания у GeForce GTX 690 используются два 8-контактных гнезда, которые способны подавать вместе со слотом PCI Express более чем 375 Вт энергии. Если для GeForce GTX 680 была достаточна 4-фазная система питания, то в данном случае NVIDIA GeForce GTX использует 10-фазную систему питания для GPU (пять фаз на GPU и по одной на память), то есть мы получаем питание 10+2.

С помощью технологии "GPU Boost"оба GPU видеокарты могут увеличивать тактовую частоту, по крайней мере, до планки 1019 МГц, то есть почти в два раза больше в абсолютном значении, чем составляет прирост у GeForce GTX 680. В некоторых тестах мы даже зафиксировали прирост тактовой частоты до 1071 МГц. Но NVIDIA урезала максимальный порог "Power Target", его можно выставлять только на прирост в 35 процентов. Заявленные 300 Вт теплового пакета соответствуют энергопотреблению с полным приростом Boost. При работе на штатных тактовых частотах 915 МГц видеокарта потребляет 263 Вт, то есть "Power Target" составляет около 405 Вт.

Ниже мы детально рассмотрим новую видеокарту GeForce GTX 690.

Когда речь заходит об игровых видеокартах класса high-end, первое, что приходит на ум любого человека, разбирающегося в видеоускорителях - это чипсет 690 GTX. Почему именно он, ведь рынок переполнен новинками, имеющими большую производительность? Всё дело в потенциале видеоадаптера, который сумел своими характеристиками привлечь внимание пользователей, стать для них безотказным устройством, которое гарантированно справится с любой нагрузкой.

В фокусе данной статьи - легенда игрового рынка, видеокарта GeForce 690 GTX от производителя Nvidia. Потенциальный покупатель познакомится с характеристиками чипа, увидит обзор популярных устройств на компьютерном рынке и узнает, что думают о видеоадаптере его владельцы. Изучив отзывы ИТ-специалистов, любой человек сможет для себя решить, стоит ли ему приобретать устройство или нет.

Двойной тариф

Представленный мировому сообществу графический ускоритель Nvidia GeForce GTX 690 есть не что иное, как связка двух чипов очень популярного и не менее быстрого видеоадаптера GTX 680, построенного на ядре GK 104. Соответственно, не составит труда увидеть, какими характеристиками обладает новинка.

  • количество транзисторов 7 миллиардов штук (680 чип имеет их ровно половину - 3,5 млрд);
  • технический процесс 28 нанометров;
  • количество потоковых процессоров 2х1536;
  • блоков ROP 2х32;
  • частота ядра 915 МГц (немного занижена, по сравнению с 1006 МГц у 680 чипа);
  • шина памяти составляет честные 512 бит (у 680 было 256 бит);
  • память работает на идентичной частоте 6000 МГц, а её пропускная способность составляет 192,2 Гб/с;
  • тип памяти GDDR 5;
  • естественно, 690 GTX увеличен вдвое и составляет 4 Гб;
  • пиксельная скорость заполнения 58,6 гигапиксель в секунду (против 32,2 Гп/с у 680 чипа);
  • максимальное потребление энергии 300 Вт (у 680 модели было 195 Вт);
  • стандартная поддержка SLI, DirectX 11.1 у обоих чипсетов одинакова.

Странности с энергопотреблением

Судя по отзывам владельцев видеоадаптера на базе GTX 680, много вопросов возникает к официальным заявлениям производителя насчёт максимального потребления электрической энергии. Многие видеокарты в пиковых нагрузках показывали явный перебор в режиме Boost. Поэтому заявленные 300 Вт для нового чипа 690 GTX выглядят очень подозрительно, ведь для питания двух графических ядер используется 10-фазная система питания. Не стоит забывать и о модулях памяти, которые энергию берут не из воздуха - получается 10+2 фазы.

Не вдаваясь в подробности, можно сказать следующее: производитель Nvidia полностью изменил систему энергопотребления видеоадаптера. Для работы в штатном режиме, в пиковых нагрузках, электропотребление составляет 260 Вт (подогнано под большинство стандартных компьютерных систем не игрового класса). Для любителей разгона, в БИОСе чипсета установлен отсекатель, который не позволит разогнать адаптер более чем на 35% (в таких случаях мощность потребления составляет 399 Вт). Тут есть над чем подумать оверлокерам и новаторам, которые в разгоне используют жидкий азот, ведь блокировку на уровне контроллера снять не каждому под силу.

Почувствуй себя Гордоном Фрименом

Найти оригинальный экземпляр GeForce GTX 690 от самой Nvidia не так-то просто, как кажется. Ведь рынок переполнен продуктами известных мировых брендов, которые предпочитают использовать собственное оформление коробочного варианта с устройством. Однако тем, кому повезёт приобрести видеокарту в заводском исполнении, предстоит испытать массу новых и очень приятных ощущений от знакомства с продуктом. Речь идёт об оригинальной упаковке, которая выполнена в форме деревянного ящика.

Судя по отзывам владельцев, почувствовать себя героем знаменитого Half-Life Гордоном Фрименом довольно-таки приятно. Ведь открыть деревянный ящик, в котором хранится жизнь для игрового компьютера, без ломика нереально. Масса положительных эмоций обеспечена любому покупателю. Да и окружающие просто обзавидуются, увидев эксклюзивную упаковку от самой Nvidia. Изъяв устройство из упаковки, владельцы быстро найдут применение деревянному кейсу: хранение интерфейсных кабелей, винтиков и прочей компьютерной мелочи. Да и в качестве сейфа для хранения денежных купюр ящик подходит лучше всего.

Уникальный внешний вид

GTX 690 в заводском исполнении имеет поистине уникальный и безупречный вид - само совершенство! Видимо, так же решили многие представители чипсетов на мировом рынке, так как не стали устанавливать собственные системы охлаждения на этот замечательный адаптер.

Традиционный пластик кожуха технологами компании Nvidia был заменён хромированным алюминием. Причём верхняя крышка не является цельной: имеются поликарбонатные окна, через которые видны пластины радиатора. Посредине кожуха разместился один кулер. И если поначалу его мощность и эффективность обдува вызывают сомнения, то после запуска пользователь ощутит всю мощь турбовентилятора. Благодаря плотно закрытым боковым граням, воздух с огромной силой забирается с задней части видеоадаптера и, проходя по граням радиатора, сильным потоком выходит с другой стороны наружу.

Радиатор представляет собой однородную платформу, которая с помощью специальных подставок касается каждого чипа на печатной плате. Сверху платформы, по разные стороны от кулера, размещены две никелированные алюминиевые пластины, через которых и отводится тепло.

Качество сборки

Когда речь заходит о качестве изготовления комплектующих в производстве видеоадаптеров, у многих людей появляется улыбка на лице. По сути, видеоускоритель - обычный расходный материал. Но судя по отзывам владельцев, данное правило не работает, если стоимость устройства на рынке под 1000 у. е.

Выполнена безукоризненно: нет лишних дорожек, установлены только твердотельные конденсаторы и современные чипы. Радует, что с обратной стороны платы нет никаких силовых компонентов, которым нужно дополнительное охлаждение. Кожух радиатора состыкован с охлаждающей платформой идеально. Даже после демонтажа пользователю не нужно ничего подгонять с помощью теплопроводных пластин или подпружиненных винтов, как это часто бывает с бюджетными устройствами. Есть негатив к решётке радиатора со стороны, где расположены интерфейсы. Она ничем не отличается от дешёвых моделей - те же острые углы и острая кромка, которой запросто можно порезать палец при установке видеокарты GeForce GTX 690 в системный блок.

Первый!

Уже ни для кого не является секретом, что компания Nvidia тесно сотрудничает с корпорацией Gigabyte, поэтому и неудивительно, что игровую видеокарту на мировом рынке первым представил тайваньский производитель. Выйдя на рынок, новинка покорила сердца всех поклонников высокопроизводительных игр, ведь потенциал видеоадаптера не смог раскрыть даже четырёхъядерный процессор Core i7 (речь идёт о первом поколении кристаллов, продаваемом на момент анонса видеоплаты), а значит, ускоритель однозначно выполнен с запасом на будущее. А вот ярые поклонники тайваньского бренда особого восторга не получили от Gigabyte GeForce GTX 690.

Дело в том, что один из лучших отказался от установки на свой продукт фирменной системы охлаждения, посчитав, что в заводском исполнении адаптер и так неплохо обдувается турбированным вентилятором. По сути, взять готовый продукт, наклеить на него фирменную этикетку и упаковать в красивую коробку может каждый производитель на рынке компьютерных устройств. Технические характеристики карты не были изменены. Довольно странное решение от тайваньского производителя.

Рынок доступных по цене устройств

Странности на рынке видеоплат только начинаются. Видеоадаптер Asus GTX 690, который позиционируется как недорогое устройство, повысил штатную частоту графических ядер устройства до 1019 МГц и представил свой продукт для пользователей по очень привлекательной цене (до 950 у. е.). Судя по отзывам владельцев, компания предоставила в комплекте к видеоускорителю фирменную утилиту ASUS GPU Tweak, которая позволяет производить контролируемый разгон на уровне BIOS. Никаких видоизменений по системе охлаждения технологами компании предпринято не было. Это ещё раз подчёркивает, что в заводском исполнении Nvidia имеет огромный потенциал к разгону. Выходит, что всем желающим сэкономить на покупке видеоускорителя GTX 690 нужно смотреть в сторону продукта от компании ASUS.

Лучик света на рынке видеокарт

Занавес с внешним видом видеоадаптера Nvidia GeForce GTX 690 приоткрыли маркетологи компании EVGA. Оказывается, производитель наложил запрет на видоизменение дизайна видеокарты. С чем это связано, догадаться нетрудно - пиар за чужой счёт для компании Nvidia не в новинку (хотя бы вспомнить 3D-очки, которые тоже нельзя было видоизменять). Но что-то явно изменилось на рынке, если под брендом EVGA мир увидел двухъядерную новинку в новом дизайнерском исполнении. Видеокарта GeForce GTX 690 с водоблоком носит гордое название Hydro Copper и имеет рекомендуемую розничную цену в пределах 1100 у. е.

Понятно, что новинка от EVGA изначально позиционируется для любителей разгона. И в синтетических тестах с аналогами, выполненными в заводском исполнении, у неё не будет ни одного конкурента. Об этом даже свидетельствует предварительный разгон от производителя: 1050 МГц по каждому графическому ядру и 6300 МГц для памяти. И это далеко не предел.

Старт дан

Естественно, после анонса продукта от EVGA в погоне за потенциальным покупателем захотелось поучаствовать и компании ASUS, у которой до этого были «связаны руки» договорённостью с Nvidia. Так мир увидел легендарную видеоплату Asus MARS III GTX 690, характеристики которой подверглись изменением конечного производителя. В первую очередь стоит отметить, что видеоадаптер позиционируется не во всех странах. Продажи её разрешены только на азиатском и американском рынке, однако приобрести её через интернет-аукционы российским гражданам не составит труда.

Вторым аспектом является «доработка до ума» объёма видеопамяти, который был увеличен добавлением чипов до 8 гигабайт. Плата, соответственно, получила 16-фазное питание и стала более прожорливой (360 Вт). Компания ASUS установила собственную систему охлаждения, состоящую из трёх турбовентиляторов, которые великолепно справляются с отводом тепла от радиаторов, плотно прилегающих к печатной плате устройства. Разгонять графические ядра производитель не стал, предоставив эту возможность владельцам. Для этого в комплекте поставки имеется утилита ASUS GPU Tweak.

А остальные производители?

Многим поклонникам продуктов Zotac, судя по их негативным отзывам, крайне не понравилось отношение производителя к покупателям. Пиар видеоадаптера в СМИ явно не привлёк любителей ресурсоёмких игр к данному бренду. Ведь все ожидали, пусть не собственной системы охлаждения, но хотя бы боевой раскраски (чёрный цвет с жёлтой отделкой). Не удивил бренд и производительностью, ведь разгон GTX 690 вполне был возможен. Понятно, что компания Nvidia запретила видоизменять внешний вид, однако с данной проблемой как-то удалось разобраться другим, менее популярным игрокам на рынке компьютерных комплектующих.

Тишина на рынке от известных компаний MSI и Gainward. Хотя в былые времена именно под этими брендами на полках магазинов можно было встретить устройства с пассивным охлаждением. Отзывы ИТ-специалистов сводятся к одному: нет смысла переплачивать за продукты, которые, помимо цены на рынке, ничем не отличаются от заводского экземпляра Nvidia. К тому же вариант с деревянным ящиком вместо картонной упаковки куда более приятен.

Альтернатива от Nvidia

После презентации новинки - одноядерного чипа GTX 980, многие потенциальные покупатели пытаются понять, стоит ли отдать предпочтение видеоадаптеру, который по характеристикам схож с легендарным видеоускорителем GTX 690. На самом деле это два совершенно разных видеоадаптера, которые не только находятся в разных ценовых категориях, а и относятся к разным поколениям. Производительность в играх и одинаковая цена лишь показывают покупателям, что двухъядерный чип имеет огромный запас мощности, который спустя поколение так и не раскроет весь свой потенциал.

Если говорить доступным языком, то нет смысла менять на новинку свой любимый видеоадаптер GTX 690. GTX 980 - видеокарта мощная, поддерживает работу с DirectX 12, ядро работает на частоте 1300 МГц, однако она не имеет достойного потенциала к разгону, ведь предел частот на данном временном отрезке уже достигнут. Для с разрядностью шины в 256 бит ускоритель GTX 690 (512 бит) явно не по зубам. Это политика компании Nvidia: нельзя видеоадаптером среднего класса «побить» представителя high-end, находящегося поколением ниже.

Так хочется сравнений

Поспорить за лидерство с GTX 690 в синтетических тестах вызвалась компания AMD, представив миру свою двухъядерную новинку Radeon R9 295X. Пусть даже объём видеопамяти и составляет 8 Гб, а ширина шины в два раза больше у AMD. Остальные технические характеристики довольно схожи с конкурентом. Поэтому тест между видеокартами происходит на уровне технологий. И если в синтетических тестах видеокарта GTX 690 немного вырывается вперёд, то в играх Nvidia явно проигрывает. Специалисты уверяют, что прирост производительности связан с пропускной способностью шины памяти и даже разгон видеоадаптера GeForce существенных изменений не принесёт. Однако данное сравнение явно показывает пользователям всю силу графического ускорителя, который способен справиться с динамическими играми, как в настоящее время, так и в ближайшем будущем.

В заключение

Как показывает практика, лучше накопить финансы и приобрести достойную видеоплату из ниши high-end, нежели из года в год довольствоваться бюджетными устройствами. Пусть потенциальных покупателей не смущает заявленная производителем цена 690 GTX. Видеоадаптер полностью окупаем. Каждый человек для себя решает сам, что для него важно: качественная картинка на максимальных настройках или низкая стоимость. Главное - помнить о том, что достойные вещи всегда имеют соответствующую цену.

Чуть больше месяца назад мы рассказывали о новой линейке видеокарт NVIDIA . Представленная GeForce GTX 680 сумела оторваться от Radeon HD 7970 и завоевать звание самой быстрой видеокарты в мире. После анонса мы, как обычно, ожидали скорого появления младших представителей серии, однако «зеленые» неожиданно выпустили еще один топ — двуядерную GeForce GTX 690 .

Сюрприз

В том, что у NVIDIA не будем проблем с созданием двухпроцессорного образца, мы не сомневались. Кристалл GK104 потребляет смешные для топа 190 Вт. По сравнению с SLI-связкой GTX 690 потеряла совсем немного: базовая частота упала с 1006 до 915 МГц. При этом GPU Boost может вывести процессоры на 1019 МГц. В остальном характеристики соответствуют удвоенной GTX 680. Количество потоковых ядер - 3072 штуки, текстурников - 256 TMU, блоков растеризации - 64 ROP. Памяти теперь не 2, а 4 ГБ GDDR5, работающих на 6008 МГц.

Коммутация платы стандартна для двуядерных моделей. Фактически на одном куске текстолита расположена пара независимых карт, соединенных мостом SLI (PLX). Единственное, что есть у установленных GPU общего, - десятифазная система питания. GTX 690 требует 300 Вт, обеспечиваемых двумя вилками PCIe 8-pin.

Роскошь

Обычно мы не обсуждаем внешний вид видеокарт, но для GTX 690 придется сделать исключение. Это настоящее произведение искусства. Внутренности защищены мощным алюминиевым корпусом со множеством скосов. Центральная часть выкрашена в черный цвет, боковые покрыты тусклым хромом и оснащены прозрачными окошками из оргстекла. Ближе к панели ввода/вывода проштамповано «GTX 690». На левой грани разместилась светящаяся зеленым надпись «GeForce GTX».

Система охлаждения по сравнению с GTX 680 усилилась. Никаких простых кулеров на тепловых трубках - взамен стоят привычные испарительные камеры, дополненные никелированными алюминиевыми радиаторами. Активный элемент один - 90-мм вертушка по центру, с крыльчаткой необычной формы, понижающей уровень шума. Набор видеовыходов странный. Есть три DVI и только один Mini DisplayPort - места для HDMI не нашлось.

Приехали

Для тестирования новинки мы собрали тестовый стенд на материнской плате Gigabyte GA-X58A-UD3R , воткнули в нее процессор Intel Core i7-920 и накрыли его кулером Cooler Master V6 . Оперативной памяти у нас было три планки Kingston HyperX DDR3-1666 МГц по 2 ГБ каждая. Операционную систему Windows 7 Ultimate 64-bit и пакет программ установили на твердотельный накопитель Kingston SSDNow объемом 64 ГБ.

В качестве конкурентов взяли всю компанию флагманов: GTX 680 , 580 , 590 и Radeon HD 7970 c HD 6970 . Сравнивали мы видеокарты в синтетических 3DMark 11 и Unigine Heaven Benchmark 2.5 , а также в трех играх: Aliens vs. Predator , DiRT2 и Total War: Shogun 2 . С настройками не стеснялись: все на максимум, разрешение от 1680х1050, сглаживание - от 4x MSAA.

То, что GTX 690 окажется заметно быстрее соперников, мы понимали, но то, что в первом же бенчмарке - Unigine Heaven Benchmark 2.5 - он принесет своему однокристальному брату 69%, было, мягко говоря, неожиданно. В то время как GTX 680 показывала 43,7 fps, GTX 690 выдавала ошеломляющие 74,2 fps. Следующим шоком стали результаты Aliens vs. Predator - 105,5 против 57,7 кадра в секунду. Существенно прибавила NVIDIA и в Total War: Shogun 2. В самом тяжелом режиме скорость увеличилась с 23,2 до 53,9 fps!

К сожалению, DiRT 2 не увидела двух GPU и работала с картой как с обычной GTX 680, но с пониженными частотами. Та же ситуация у нас сложилась и с GTX 590. Печально, но это особенность самой игры: в сочетании с определенным оборудованием она отказываются нормально загружать второй GPU.

* * *

Если с GeForce GTX 680 мы еще сомневались, называть ли NVIDIA новым королем видеокарт, то с выходом GTX 690 мы можем твердо сказать: компания выпускает самые быстрые платы в мире. Стоят они, конечно, от 35 999 рублей за штуку, но если вы не хотите стеснять себя в настройках и разрешениях, это единственный выбор.

Таблица 1
Технические характеристики
Характеристика NVIDIA GeForce GTX 690 NVIDIA GeForce GTX 680 AMD Radeon HD 7970 AMD Radeon HD 6970 NVIDIA GeForce GTX 580 NVIDIA GeForce GTX 590
Ядро Kepler Kepler Thaiti Cayman GF110 2x GF110
Количество транзисторов 2x 3,54 млрд 3,54 млрд 4,31 млрд 1,95 млрд 3 млрд 2x 3 млрд
Техпроцесс 28 нм 28 нм 28 нм 40 нм 40 нм 40 нм
Количество потоковых процессоров 2х 1536 шт. 1536 шт. 2048 шт. 1536 шт. 512 шт. 2х 512 шт.
Частота графического ядра 915 МГц 1006 МГц 925 МГц 880 МГц 772 МГц 607 МГц
Частота потоковых процессоров 915 МГц 1006 МГц 925 МГц 880 МГц 1544 МГц 1214 МГц
Тип, объем памяти GDRR5, 4 ГБ GDDR5, 2 ГБ GDDR5, 3 ГБ GDDR5, 2 ГБ GDDR5, 1,5 ГБ GDDR5, 3 ГБ
Частота памяти 6008 МГц 6008 МГц 5500 МГц 5500 МГц 4008 МГц 3414 МГц
Шина данных 2х 256 бит 256 бит 384 бит 256 бит 384 бит 2х 384 бит
Количество текстурных блоков 2х 128 шт. 128 шт. 128 шт. 96 шт. 64 шт. 2х 64 шт.
Количество блоков растеризации 2х 32 шт. 32 шт. 32 шт. 32 шт. 46 шт. 2х 46 шт.
Энергопотребление 300 Вт 195 Вт 250 Вт 250 Вт 244 Вт 365 Вт
Длина платы 280 мм 250 мм 270 мм 270 мм 267 мм 280 мм
Интерфейс PCIe 3.0 x16 PCIe 3.0 x16 PCIe 3.0 x16 PCIe 2.0 x16 PCIe 2.0 x16 PCIe 2.0 x16
Цена на январь 2012 года 35 999 рублей 17 500 рублей 16 000 рублей 10 000 рублей 12 500 рублей 23 500 рублей
Таблица 2
Синтетические тесты
3DMark 11
Модель видеокарты Graphics Physics Score %
NVIDIA GeForce GTX 690 16 588 5308 10 635 100%
NVIDIA GeForce GTX 680 9659 5286 7930 74%
7326 5210 6603 62%
VTX Radeon HD 6970 5506 5200 5367 50%
6182 4653 5746 54%
9729 5287 7922 74%
Unigine Heaven Benchmark 2.5
Модель видеокарты FPS Score %
NVIDIA GeForce GTX 690 74,2 1868 100%
NVIDIA GeForce GTX 680 43,7 1102 59%
XFX R7970 Double Dissipation (925/5500 МГц) 32,6 822 44%
VTX Radeon HD 6970 24,1 606 32%
Zotac GeForce GTX 580 AMP! Edition (772/4008 МГц) 29,6 747 40%
Point of View GeForce GTX 590 46,9 1181 63%
Таблица 3
Игровые тесты (кадров в секунду)
Aliens vs. Predator (DX11)
Настройки NVIDIA GeForce GTX 690 NVIDIA GeForce GTX 680 XFX R7970 Double Dissipation (925/5500 МГц) VTX Radeon HD 6970 Zotac GeForce GTX 580 AMP! Edition (772/4008 МГц) Point of View GeForce GTX 590
VeryHigh, 1680x1050, AF 16x, AA 2x 146,3 69,5 76,6 61,1 63 94,3
VeryHigh, 1680x1050, AF 16x, AA 4x 118,9 64 65,9 57,7 53,3 81,3
VeryHigh, 1920x1080, AF 16x, AA 2x 128,7 71,8 68,9 55,1 56,7 85,4
VeryHigh, 1920x1080, AF 16x, AA 4x 105,5 57,7 59,2 51,1 48 73,5
% 100% 53% 54% 45% 44% 67%
DiRT 2 (DX11)
Настройки NVIDIA GeForce GTX 690 NVIDIA GeForce GTX 680 XFX R7970 Double Dissipation (925/5500 МГц) VTX Radeon HD 6970 Zotac GeForce GTX 580 AMP! Edition (772/4008 МГц) Point of View GeForce GTX 590
116,4 124,1 98 78,5 125,2 117,8
101,5 119,9 89,1 75,5 116,3 122,9
104,2 121,5 89 76 117,5 119,2
102,9 121 83,5 73,7 109,9 121
% 100% 114% 85% 71% 110% 113%
Total War: Shogun 2 (DX11)
Настройки NVIDIA GeForce GTX 690 NVIDIA GeForce GTX 680 ASUS HD 7970 DirectCU II Top (925/5500 МГц) VTX Radeon HD 6970 Zotac GeForce GTX 580 AMP! Edition (772/4008 МГц) Point of View GeForce GTX 590
Ultra, 1680x1050, AF 16x, AA 4x 53,5 42,8 42,1 39,7 39 59,6
Ultra, 1680x1050, AF 16x, AA 8x 52,6 27,8 28,6 29,9 30 57,2
Ultra, 1920x1080, AF 16x, AA 4x 54 36,9 34,3 34,9 34,4 53,6
Ultra, 1920x1080, AF 16x, AA 8x 53,9 23,2 24,9 26 29,3 41,3
% 100% 61% 61% 61% 62% 99%

Ни для кого не является секретом, что компания NVIDIA задержалась с анонсом своих новых решений серии GeForce GTX 600. Ключевой особенностью данного поколения видеокарт является переход на более тонкий 28 нанометровый технологический процесс. Основной конкурент AMD представил свои новинки в начале текущего года и за квартал до анонса новых видеокарт от NVIDIA успел представить множество различных новинок и продать не малое количество видеокарт. Компания NVIDIA старается компенсировать оставание от основного конкурента и представляет свои новинки нового поколения серии GeForce GTX 600.
В начале марта были представлены видеокарты NVIDIA GTX 680, которые призваны конкурировать с видеокартами AMD Radeon HD 7970. Следует отметить, что новика NVIDIA оказалась более интересной, нежели новинка от AMD. Графическое ядро GeForce GTX 680 содержит меньше транзисторов, имеет меньшую площадь и умудряется демонстировать более высокий уровень производительности, нежели продукт от AMD. Настоящим подарком для пользователей оказался тот факт, что NVIDIA предлагает свою новую одночиповую видеокарту по стоимости дешевле, нежели конкурирующий продукт AMD Radeon HD 7970.

Естественно, признание решения NVIDIA GeForce GTX 680 пользователями не могло не сказаться на планах производителя, и он решил представить рынку двухчиповую видеокарту GeForce GTX 690, которая является в два раза увеличенной видеокартой GeForce GTX 680. Следует отметить, что двухчиповые видеокарты имеются в каждой линейке видеокарт как AMD, так и NVIDIA. Спрос на них не высок, как правило, покупателями данных решений являются энтузиасты. Выпуск двухчиповых видеокарт значительно увеличивает количество бракованной продукции, поэтому стоимость двухчиповых решений всегда находится на высоком уровне.

Картинка кликабельна --


Новая видеокарта GeForce GTX 690 хоть и является практически удвоенной видеокартой GeForce GTX 680 на одной плате, реальная производительность данных решений никогда не достигает удвоенного уровня. Видеокарта основана на двух ядрах Kepler. Производительности видеокарты на одном чипе Kepler вполне достаточно для большинства пользователей для прохождения практически любых игр. Например, назвать игру, требования которой не позволяют с комфортом в нее играть при установленной видеокарте GeForce GTX 680 - мы не знаем. Среди пользователей популярны синтетические тесты, которые измеряют производительность видеокарт в "попугаях". В сети существуют рейтинги, естественно, большинство пользователей стремяться оказатья на верхней строчке данных рейтингов, а для этого необходима установка двухчиповой видеокарты GeForce GTX 690, а лучше устанавливать данные видеокарты в режим NVIDIA SLI.

При усилении графической подсистемы компьютера необходимо понимать, что остальные компоненты также должны соответствовать высокому уровню. В первую очередь речь идет о центральном процессоре, возможностях материнской платы и наборе оперативной памяти. Итоговая стоимость данных конфигураций переваливает за сотню тысяч рублей, а уровень энергопотребления достигает в тысячу и более ватт, поэтому данные персональные компьютеры необходимо считать роскошью, непредназначенной для обычной офисной работы.

Естественно, уровень продаж подобных решений нельзя назвать сверхвысоким. Как правило, уровни продаж двухчиповых видеокарт составляют несколько процентов от итоговых финансовых результатов компаний. Поэтому компания AMD никогда не спешит с выпуском топовых двухчиповых решений, делая упор на массовый средний ценовой диапазон. Тем не менее, звание "самая быстрая видеокарта" является имидживой, что способно увеличить уровень продаж видеокарт других ценовых диапазонов.

Картинка кликабельна --


Видеокарты GeForce GTX 690 основаны на двух чипах GK104, которые имеют по 1536 потоковых процессора на ядро. Каждый чип работает с памятью по шине 256 бит, поэтому ее можно назвать сдвоенной. Размещение двух чипов на одной плате значительно увеличивает энергопотребление видеокарты, что затрудняее ее охлаждения. Как правило, производители справляются с данной задачей не только путем установки высокоэффективной системы охлаждения, но и путем снижения уровня рабочего напряжения с одновременным снижением рабочей частоты. Аналогичная учесть постигла рассматриваемую видеокарту GeForce GTX 690.

Рекомендованная стоимость новинки для США достигает 999 долларов, для нашей страны это будет цифра равная 1100 долларам. Данную стоимость нельзя назвать низкой, так как многие неплохие домашние игровые конфигурации можно уложить в стоимость одной новинки GeForce GTX 690. Снижения стоимости данной видеокарты в ближайшее время ждать не приходится, так как конкурент AMD еще не представил свое двухчиповое решение на базе ядра Tahiti. Естественно, анонсы конкурента заставят маркетологов AMD поторопиться с анонсом решения AMD Radeon HD 7990.

Картинка кликабельна --


На новой видеокарте GeForce GTX 690 распаяно четыре гигабайта видеопамяти типа GDDR5. При этом указывать, что на плате 4 Гб видеопамяти в общем является не правильным. Видеокарта имеет по 2 Гб памяти на каждое ядро, без права заимствования части видеопамяти ядрами друг у друга.

Рабочей частотой ядра нового решения является цифра 915 Мгц, что примерно на десять процентом меньше, чем у видеокарты GeForce GTX 680. Увеличение рабочей частоты графического ядра в рамках GPU Boost позволяет снизить данный разрыв до четырех процентов, так как средней рабочей частотой оказывается цифра равная 1019 Мгц. Следует понимать, что уровень повышения рабочей частоты зависит от многих факторов. Самыми значимыми для GPU Boost является уровень энергопотребления и уровень рабочей температуры блоков ядра. Данная технология реализована на аппаратном уровне.

Картинка кликабельна --


Видеокарта имеет два восьмипиновых коннектора дополнительного питания PCI-Express. Максимальный уровень энергопотребления в данном случае составляет 375 ватт. По заявлении NVIDIA и установленным настройкам GPU Boost средний уровень энергопотребления новой видеокарты составляет 263 ватта. Поэтому запас по уровню энергопотреблению новая видеокарта имеет, что положительно скажется на возможностях ее разгона. Проблемой предыдущих двухчиповых видеокарт NVIDIA являлся уровень энергопотребления, который не давал добиться какого-либо адекватного уровня разгона. Видеокарта GeForce GTX 690 данным недостатком не обладает, поэтому может считаться полноценной альтернативой двум видеокартам GeForce GTX 680 в режиме SLI. Тем более, при выборе в пользу GeForce GTX 690 вы занимаете всего один слот PCI-Express 16x в материнской плате и получаете возможность создания конфигурации Quad SLI.

Картинка кликабельна --


Новая видеокарта имеет три видеовыхода DVI и один порт mini-DisplayPort. Отсутствие HDMI порта будет компенсировано соответствующим переходником. Насколько адекватен отказ от распайки HDMI порта в данном случае - решат сами пользователи. По нашему мнению, в эпоху рассвета LED панелей данный подход мы считаем не совсем адекватным.

В свете отсутствия конкурирующего решения от AMD, компания NVIDIA приводит сравнение уровня производительности и энергоэффективности новой видеокарты по сравнению с предыдущим топовым решение GeForce GTX 590.

Картинка кликабельна --


В большинстве случаем компания отмечает рост производительности более чем на сорок процентов, а снижение энергопотребления более чем на семьдесят процентов. Учитывая сочетание двух еще недавно взаимоисключающих факторов в одной видеокарте GeForce GTX 690 ее можно считать достаточно прогрессивным продуктом. Компании AMD придется постараться при создании чего-либо аналогичного в рамках ядра Tahiti.

Видеокарта GeForce GTX 690 поддерживает прогрессивные технологии в виде 3D Vision Surround и NVIDIA PhysX. Первая технология позволяет выводить стереоскопическое изображение сразу на несколько мониторов, а вторая позволяет улучшить физические эффекты в играх, которые поддерживают ее. Большинство современных игр поддерживают физическое ускорение PhyxX, поэтому при наличии двух ядер на видеокарте данная опция не будет лишней.

Картинка кликабельна --


Новая видеокарта запомниться нам еще тем, что именно в ней впервые производитель попытался решить проблему фризов при использовании мультиграфических конфигураций. Видеокарту GeForce GTX 690 наделили обязанностями по контролю частоты кадров в играх, что значительно снижает вероятность возникновения пресловутого эффекта micro-stuttering, который можно уловить только человеческим глазом. Насколько аппаратная реализация контроля частоты кадров позволит решить проблему фризов - покажет практика. Планирует ли что-либо подобное внедрять AMD пока не ясно, так как проблема фризов характерна для продукции и от данного производителя. Заключение
Новая видеокарта NVIDIA GeForce GTX 690 получилась интересным продуктом для энтузиастов и оставило за NVIDIA позицию лидера по уровню производительности в графическом сегменте решений. Конкуренции в двухчиповом сегменте топовых решений на сегодняшний день NVIDIA не испытывает и за более производительный и менее прожорливый продукт она просит порядка 36 тысяч рублей, что делает продукт доступным далеко не для каждого геймера нашей страны.

В ближайшее время на нашем портале Мега Обзор будут представлены результаты тестирования и разгона новой видеокарты.

  • Часть 2 — Практическое знакомство
  • Часть 3 — Результаты игровых тестов (производительность)

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов.

Плата

  • GPU: 2 x Geforce GTX 680 (GK104)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 915-1019 МГц (номинал — 915-1019 МГц)
  • Частота работы памяти (физическая (эффективная)): 1500 (6000) МГц (номинал — 1500 (6000) МГц)
  • Ширина шины обмена с памятью: 2x256 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 2x8/915-1019 МГц (номинал — 2x8/915-1019 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 2x1536
  • Число блоков текстурирования: 2x128 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 2x32
  • Размеры: 285×100×35 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 299-310/85/62 Вт
  • Выходные гнезда: 3×DVI (Dual-Link/VGA/HDMI), 1×mini-DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)

Nvidia Geforce GTX 690 2x2048 МБ 2x256-битной GDDR5 PCI-E

Карта имеет 2x2048 МБ памяти GDDR5 SDRAM, размещенной в 16 микросхемах на лицевой сторонe PCB.

Карта требует дополнительного питания, причем двумя 8-контактными разъемами.

О системе охлаждения.

Nvidia Geforce GTX 690 2x2048 МБ 2x256-битной GDDR5 PCI-E

Про систему охлаждения особый разговор. В данном случае инженеры Nvidia постарались максимально возможно увеличить эффективность кулера при минимальном уровне шума. Основой СО являются два радиатора, каждый из которых базируется на испарительной камере из медного сплава (это как мини-водяная система охлаждения: жидкость нагревается от ядра, испаряется и снова конденсируется на другой стороне испарительной камеры, которая более холодная). Каждая из камер имеет припаянный к ней радиатор, покрытый никелевым сплавом.

В центре конструкции между радиаторами установлен большой вентилятор, также особо спроектированный, чтобы поток воздуха, прогоняемый через радиаторы, был максимально большим при соблюдении минимальной скорости вращения самого вентилятора. Для уменьшения шума и повышения обтекаемости гнездо, где сидит вентилятор, покрыто напыленным магниевым сплавом, который используется в двигателях F22 Raptor.

Все устройство сидит на массивном плате, которая является также радиатором для микросхем памяти и силовых транзисторов, и на ней сделаны специальные направленные канавки для потоков воздуха. Кожух кулера покрыт напыленным алюминиевым сплавом и имеет пластиковые окна, через которые видны радиаторы (для контролирования их запыленности). В качестве дополнительного декоративного элемента кожух имеет подсвеченную надпись «Geforce GTX».

Как результат, СО получилась крайне хорошо сбалансированной, малошумной (уровень шума примерно в 1.5 раза меньше, чем у двух GTX 680).

Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Nvidia Geforce GTX 690 2x2048 МБ 2x256-битной GDDR5 PCI-E

Как мы видим, после 6-ти часов прогона карты температура не превысила 84 градусов, что для супер-топового ускорителя просто прекрасный результат! Отметим, что вентилятор достигал 66% от максимальных оборотов, что составило почти 2500 оборотов в минуту, при этом шум был минимальным, хотя по идее должен быть более ощутим. Вышеотмеченные внедренные технологии работают на деле.

Видеокарта прибыла к нам без упаковки и комплекта (маркетинговый деревянный ящик мы не учитываем, потому как в нем серийные карты поставляться не будут), потому вопрос комплектации мы опускаем.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Enermax Platimax 1200 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 12.4; Nvidia версии 301.33/301.24

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org .
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка .
  • RightMark3D 2.0 с кратким описанием: под Vista без SP1 , под Vista c SP1 .

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) .

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 690 GTX 690 )
  • Geforce GTX 680 SLI — две видеокарты Geforce GTX 680 в режиме SLI со стандартными параметрами (далее GTX 680 SLI )
  • Geforce GTX 680 со стандартными параметрами (далее GTX 680 )
  • Radeon HD 7970 со стандартными параметрами (далее HD 7970 )
  • Radeon HD 6990 со стандартными параметрами (далее HD 6990 )

Для сравнения результатов рассматриваемой сегодня двухчиповой видеокарты Nvidia Geforce GTX 690 эти модели были выбраны по следующим причинам. Geforce GTX 680 является старшей одночиповой моделью текущего поколения Kepler, а две такие видеокарты в конфигурации Nvidia SLI являются аналогичной новинке видеоподсистемой на базе двух чипов GK104.

Выбранная пара видеокарт от конкурирующей компании AMD была взята нами для синтетических тестов потому, что Radeon HD 7970 является наиболее производительным решением AMD, хотя эта видеокарта и основана на одном GPU. Так как эта компания пока что не анонсировала своё двухчиповое решение нового поколения, в тесты была взята и Radeon HD 6990 — как предыдущая топовая модель от AMD, имеющая два видеочипа. Понятно, что реальным конкурентом для Geforce GTX 690 будет двухчиповый аналог на двух графических процессорах Tahiti, но он ещё не анонсирован.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим ниже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, и она очень проста для современных видеочипов.

Производительность в этих тестах на современных GPU зачастую упирается в скорость текстурирования или филлрейт. Поэтому тесты показывают далеко не все возможности современных видеочипов, но интересны с точки зрения аналогов устаревших 3D приложений, которых до сих пор довольно много среди игр.

Судя по предыдущим нашим сравнениям, производительность новых видеокарт в этих тестах ограничена чаще всего филлрейтом, хотя и влияние скорости текстурных модулей тоже прослеживается. Но оно неявное, так как Geforce GTX 680 не стал победителем, уступив конкуренту от AMD и не так сильно обогнав предшествующую модель GTX 580.

В этих тестах сильнее всего или система на двух GTX 680 или топовая двухчиповая видеоплата компании AMD из предыдущего поколения. А вот небольшой прирост от двух GPU у двухчипового GTX 690 в простых тестах немного смущает, особенно на фоне результатов двух GTX 680 в SLI. Возможно, мы наблюдаем разницу в программных оптимизациях в драйвере или нехватку пропускной способности слота PCI-E для двух графических процессоров новинки.

Но в целом, здесь GTX 690 выступила неплохо, в половине тестов на уровне GTX 680 SLI и HD 6990. Хотя понятно, что по-хорошему сравнивать новинку нужно бы с реальным конкурентом в виде двухчиповой модели серии Radeon HD 7000, но его пока что не анонсировали. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

В этих тестах мы видим ещё более загадочную разницу между двумя двухчиповыми системами от Nvidia. Тест Cook-Torrance более интенсивен вычислительно, разница в нём примерно соответствует разнице в количестве ALU и их частоте, и от скорости TMU она также зависит. Но почему GTX 690 с большим преимуществом обогнала две GTX 680? Кроме программных оптимизаций под GTX 690, других мыслей в голову не приходит.

Вообще, этот тест лучше подходит графическим решениям компании AMD, и двухчиповый Radeon седьмой серии, скорее всего, станет лучшим. Но последние видеокарты Nvidia сильно подтянули производительность в этой части синтетики, и именно Geforce GTX 690 стала победителем.

Во втором, больше зависящем от скорости текстурирования, тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому видеокарты в нём располагаются по скорости текстурирования. И в этом «текстурном» тесте новая модель GTX 690 показала результат почти на уровне двух GTX 680, уступив им только из-за немного сниженных частот. Зато видеокарты AMD остались позади и их двухчиповый вариант выше GTX 690 не прыгнет.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье .
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Результаты теста показывают, что в устаревших задачах архитектура AMD продолжает опережать GPU производства Nvidia.

Производительность лучшей из одночиповых видеокарт AMD в тесте «Frozen Glass» значительно выше, чем у новинки, и даже двух GTX 680 в SLI. Удивительно, но GTX 690 в этом тесте показала явно аномальный результат, говорящий о каких-то программных проблемах или нехватке пропускной способности PCI-E, что менее вероятно.

Во втором тесте «Parallax Mapping» новая видеокарта Nvidia показала более высокую производительность, по сравнению с двумя одночиповыми аналогами, что ещё раз убеждает нас в том, что разница между GTX 690 и GTX 680 SLI объясняется различными оптимизациями в видеодрайвере для SLI-конфигураций и конкретно модели Geforce GTX 690.

В любом случае, решения Nvidia в этом тесте не смогли догнать двухчиповую плату от AMD даже предыдущего поколения. Да и Radeon HD 7970 отстала совсем немного, так что двухчиповый вариант точно будет сильнее. Вероятно, новая архитектура Radeon просто эффективнее в подобных задачах. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В целом положение плат с GPU производства Nvidia стало чуть лучше, и Geforce GTX 690 почти догнала старый двухчиповый Radeon HD 6990. Эффективность SLI в этих тестах очень низкая, и особенно это касается SLI-конфигурации на базе двух GTX 680. Новинка Nvidia чувствует себя лучше, и в этом явно виноваты программные оптимизации в драйвере, так как его версия для систем Nvidia была одинаковой. И всё же, двухчиповый Radeon на база пары Tahiti должен стать сильнее представленной сегодня платы конкурента. Так что вывод о том, что современные чипы AMD в этих задачах эффективнее, подтвердился в очередной раз.

Но это были устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики .
  • Fur — процедурный шейдер, визуализирующий мех.

В самых сложных DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia всегда были весьма сильны, в отличие от других тестов этого пакета, хотя в последней архитектуре компании AMD избавились от некоторых недостатков, сильно подтянув производительность архитектуры GCN в PS 3.0 сравнении.

Данные тесты уже не ограничены производительностью лишь текстурных выборок, а больше всего зависят от эффективности исполнения шейдерного кода. Новый чип AMD чуть лучше справляется со сложными шейдерами, по сравнению с GK104, особенно если сравнивать их в тесте продвинутого параллакс маппинга. Вероятно, так получается из-за большего количества регистров на потоковый процессор.

Но и сегодняшний герой обзора показал неплохой результат, став лидером по этой паре тестов. Удивительно, но и тут Geforce GTX 690 обогнал пару GTX 680 с большущим запасом — примерно в полтора раза! Но Radeon HD 7970 эффективнее выполняет одну из этих тяжёлых задач и поэтому двухчиповый вариант будет ещё сильнее. Ну а пока что и в «Fur» и в «Steep Parallax Mapping» он показывает лучший результат среди всех протестированных решений.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит в большей степени от количества и эффективности блоков TMU, но также влияет и эффективность выполнения сложных программ. В варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти (в меньшей степени). Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

Как и в аналогичных DX9 тестах, в задачах процедурной визуализации меха с большим количеством текстурных выборок, решения Nvidia раньше были заметно сильнее, но за пару поколений GPU компания AMD не только сократила разницу, но и вовсе вырвалась вперёд. И теперь мы видим Radeon HD 7970 в лидерах таких сравнений, что говорит о высокой эффективности выполнения им сложных пиксельных программ.

Рассматриваемая сегодня Geforce GTX 690 показала результат чуть хуже, чем у пары одночиповых GTX 680, что объясняется немного пониженными частотами в случае двухчиповой платы. Но в целом, преимущество над одиночной GTX 680 неплохое, хотя одночиповая Radeon HD 7970 выглядит очень сильно, и соответствующий Radeon на двух таких GPU должен будет перехватить инициативу.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В этом варианте разница между GTX 680 и двухчиповыми конфигурациями стала ещё более заметной. GTX 680 SLI и GTX 690 идут почти вровень в тяжёлых условиях, а в лёгких двухчиповая плата немного отстаёт. К сожалению, при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, результаты решений Nvidia в целом ухудшились, по сравнению с показателями видеокарт от AMD.

И теперь протестированная двухчиповая новинка Nvidia лишь немного опережает одночиповую Radeon HD 7970. Топовая плата из серии HD 7000 в этом тесте показывает просто отличный уровень производительности, что явно говорит о будущей победе двухчиповой платы на базе двух графических процессоров Tahiti. Но пока что из одиночных карт GTX 690 стала быстрейшей.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма очень похожа на предыдущую (без включения SSAA), и решения Nvidia в этом тесте не смогли улучшить своё положение. Новая плата Geforce GTX 690 в обновленном D3D10-варианте теста параллакс маппинга без суперсэмплинга в тяжелых условиях опередила две GTX 680, а в лёгких уступила им немного. Преимущество над одночиповой платой приличное, но конкурировать с двухчиповой топовой платой из серии Radeon HD 7000 ей будет сложно. Посмотрим, что изменит включение суперсэмплинга, ведь он обычно вызывает сильное падение скорости на платах Nvidia.

Всё примерно так же, что и в «Fur», но при включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — видеокарты производства AMD явно улучшили относительные показатели, по сравнению с платами на чипах Nvidia.

Кроме Geforce GTX 690. На наше удивление новинка именно здесь оказалась гораздо быстрее, чем две платы GTX 680, совместно работающие над рендерингом. Отличие просто поразительное — она на 25-30% быстрее аналогичной конфигурации, но на двух PCB. Вряд ли тут виновато использование чипа-коммутатора на одной плате, больше всего похоже на программные оптимизации, специфичные именно для GTX 690.

В итоге Geforce GTX 690 стала явным лидером, хотя и временным — до выхода двухчиповой платы AMD из нового семейства. Понятно, что такой Radeon будет далеко впереди, так как даже HD 7970 показал отличные результаты. Последние решения AMD отлично справляются со сложными «шейдерными» задачами, заметно лучше даже самых новых плат Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов обычно более-менее соответствуют разнице в частотах и количестве вычислительных блоков, но с небольшим влиянием разной эффективности их использования. Предыдущие архитектуры AMD нескольких последних лет в таких случаях имели значительное преимущество над конкурирующими видеокартами Nvidia, но именно в Kepler число потоковых процессоров и пиковая математическая производительность значительно возросли и ситуация изменилась.

Результаты видеокарт расположились на диаграмме почти соответственно теории, хотя эффективность SLI в таком случае явно далека от 100%. Даже GTX 690 не смогла показать близкое к двукратному превосходству над GTX 680, не говоря уже о паре таких плат. Видимо, недостаток программных оптимизаций не позволил двухчиповым решениям Nvidia показать то, на что они способны в реальности.

А вот GTX 680 вполне себе на уровне лучшего одночипового решения конкурента. Но, судя по эффективности CrossFire на двухчиповой плате HD 6990, при выходе новинки серии Radeon HD 7000 на базе двух топовых GPU, именно она захватит лидерство, и виновата в этом не пиковая производительность, а лучшие программные оптимизации.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В этот раз относительный результат плат Nvidia оказался немного ниже, и одночиповая GTX 680 уступила Radeon HD 7970 столько, сколько должна по теории. Система на базе двух Geforce GTX 680 в SLI также показала неэффективную работу в тесте, став второй с конца. А вот рассматриваемый сегодня GTX 690 снова показал результат на уровне старого двухчипового Radeon HD 6990, что в целом не так уж и плохо.

Строгого соответствия теоретическим цифрам пиковой производительности нет и в этот раз, но результаты большинства решений к ним несколько ближе, чем в предыдущем тесте. Скорость рендеринга в данном тесте ограничена исключительно производительностью шейдерных блоков и их эффективностью, поэтому платы Radeon показывают сильные результаты. Но хотя решения AMD до сих пор выигрывают математические сражения, разница между конкурирующими платами не такая существенная, как в предыдущих поколениях.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, их производительность соответствует количеству точек, и с каждым шагом падение FPS почти двукратное. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена или скоростью обработки геометрии или пропускной способностью памяти.

Разница между платами Nvidia и AMD тут огромна. Если в предыдущих шейдерных тестах платы AMD показали себя явно лучше, то в первом же тесте геометрии мы видим совершенно иную расстановку сил. Плата Geforce GTX 680 укрепила позиции Nvidia, а Geforce GTX 690 и вовсе вдвое быстрее, ровно как и две платы GTX 680, работающие в режиме SLI — эти две конфигурации показали сравнимые результаты, со скидкой на разность в частотах.

Сравнение новой платы компании Nvidia даже с ещё не вышедшим конкурентом от AMD простое — изделие калифорнийцев точно окажется тут быстрее, так как результат Radeon HD 7970 далёк от скорости Geforce GTX 680. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры всех решений немного улучшились. Видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Geforce GTX 680 всё так же опережает Radeon HD 7970 в полтора раза, поэтому и с двухчиповыми платами будет то же самое. Тем более что эффективность SLI в этом тесте оказалась весьма велика.

К сожалению, «Hyperlight» —следующий тест геометрических шейдеров, который предполагает большую нагрузку именно на геометрические шейдеры и демонстрирующий использование сразу нескольких техник, на всех многочиповых решениях исполняется некорректно, показывая аномальные результаты на обеих SLI-конфигурациях Nvidia и двухчиповой плате Radeon HD 6990. Поэтому смысла в его анализе нет никакого, и мы переходим сразу к тестам вершинных шейдеров.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти, особенно в лёгком режиме. А результаты видеокарт Nvidia зачастую ограничены ещё чем-то неизвестным. И в целом, между схожими по классу платами разница в этом тесте получается очень маленькая.

И в этот раз анализировать результаты очень непросто. Radeon HD 7970 оказалась быстрее своей соперницы Geforce GTX 680, а двухчиповая GTX 690 заметно менее эффективно выполнила задачу, по сравнению с системой на базе двух плат GTX 680. Сказалось или ограничение пропускной способности PCI-E интерфейса или разность в оптимизациях для SLI конфигураций. Но в целом, решения выступили слишком близко друг к другу, все двухчиповые конфигурации очень похоже ведут себя в этом тесте.

Новая двухчиповая плата семейства GTX 600 с такой производительностью в тесте вряд ли сможет конкурировать с будущим аналогом Radeon HD 7970 на базе двух GPU. Но более всего непонятно отставание новинки от пары плат GTX 680 в SLI. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось в основном за счёт того, что новая плата Nvidia почти не потеряла скорости рендеринга в тяжёлых режимах, в отличие от остальных решений. Особенно плат AMD, которые немного сдали. И теперь результаты GTX 690 приблизились к показателям двух GTX 680, что явно говорит о разнице в программной части, хотя драйверы были идентичными. О сравнении с будущим конкурентом можно сказать то же самое, что и в прошлый раз — скорее всего, будущий двухчиповый аналог от AMD покажет тут более высокую скорость рендеринга.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» привычно не похожи на то, что мы видели на предыдущих диаграммах. Хотя для Geforce GTX 690 всё стало ещё печальнее — к сожалению, в этом тесте новая видеокарта Nvidia показала очень низкую эффективность двухчипового рендеринга, особенно в тяжёлых условиях. При высоком количестве обрабатываемых полигонов её скорость немногим выше производительности одиночной платы GTX 680.

Интересно, что лучшей стала старая Radeon HD 6990, а пара GTX 680 уступила ей лишь немного. А там и Radeon HD 7970 недалеко. Поэтому двухчиповый Radeon HD 7000 явно будет сильнейшим в тесте текстурных выборок из вершинных шейдеров, осталось лишь его дождаться. Рассмотрим второй вариант этого же теста:

Некоторые видеокарты немного ухудшили свои результаты, но не Geforce GTX 690. Это позволило новой плате Nvidia немного улучшить положение, приблизившись к результатам Radeon, но всё же из-за низкой эффективности SLI именно на этой плате (у пары GTX 680 всё более-менее в порядке, как ни странно) в тяжёлых режимах она хуже даже одночиповой Radeon. Так что тесты вершинного текстурирования остаются скорее показателем драйверной оптимизации, чем аппаратных возможностей.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой двухчиповой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Тест компании Futuremark не показывает теоретически возможного уровня производительности текстурных выборок, но эффективность видеокарт от AMD и Nvidia в нём достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Представленная сегодня двухчиповая модель Geforce GTX 690 показала неплохую эффективность SLI-рендеринга в этом тесте, хотя и не 100%-ную. Разница между одноплатной GTX 690 и двумя GTX 680 в SLI составила примерно 10%.

Ранние видеокарты Nvidia в этом тесте были весьма слабы из-за малого количества TMU, а теперь всё стало намного лучше. Учитывая чуть большую производительность Radeon HD 7970 в этом тесте, по сравнению с GTX 680, а также неплохую эффективность CrossFire в таких тестах, можно предположить, что несмотря на несколько худшие теоретические показатели, будущее двухчиповое решение AMD должно немного опередить новинку Nvidia. Но пока что из всех видеокарт лидирует именно она, прилично обгоняя двухчиповую Radeon HD 6990 предыдущего поколения.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Взаимное расположение плат в тесте производительности блоков ROP почти такое же. Как мы определили ранее, цифры этого подтеста из 3DMark Vantage хоть и показывают производительность блоков ROP, но с огромным влиянием величины пропускной способности видеопамяти (т.н. «эффективный филлрейт»). Тест часто измеряет скорее пропускную способность памяти, чем производительность ROP.

В прошлой статье мы отметили, что в Kepler явно видны улучшения в эффективности работы этих блоков. И новая двухчиповая модель Geforce GTX 680 неплохо справилась с задачей, показав результат на одном уровне с двумя платами GTX 680 и почти вдвое выше, чем показала одиночная GTX 680. Так что двухчиповому аналогу Radeon HD 7970 будет тяжело обогнать Geforce GTX 690, хотя эта плата явно будет иметь значительно более высокую пропускную способность памяти.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от всех проведённых нами выше тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от всего сразу. А для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

Интересно, что в синтетике из 3DMark Vantage новая плата Geforce показала почти вдвое больший результат, по сравнению с одной Geforce GTX 680, но пара таких карт отработала в этот раз заметно хуже, не догнав даже одиночную Radeon HD 7970. Ну а лидером ожидаемо стала наша сегодняшняя героиня — двухчиповая GTX 690, оказавшаяся быстрее всех. Хотя преимущество над Radeon HD 7970 слишком мало, чтобы удержать лидерство после выхода двухчиповой платы от конкурента. В подобных вычислительных задачах платы серии Radeon всё же более эффективны.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния являются производительность обработки геометрии, эффективность выполнения уже геометрических шейдеров и производительность блоков ROP. Из-за большого влияния геометрических блоков вполне логично, что видеокарты производства Nvidia, имеющие по несколько штук таких устройств, чувствуют себя в этом приложении очень неплохо, а SLI-система на базе двух плат Geforce GTX 680 стала лидером теста. Она справилась с работой явно лучше новой двухчиповой модели GTX 690.

Хотя сильнейшая одночиповая модель конкурента — Radeon HD 7970 — и усилила позиции компании, но даже она не смогла дотянуться до Geforce GTX 680. Но, учитывая лишь полуторакратное ускорение от двух GPU производства Nvidia в этом тесте, двухчиповый Radeon имеет все шансы догнать новинку калифорнийцев.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты этого теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, кроме того, что эффективность двухчипового рендеринга на Geforce GTX 690 несколько увеличилась. В этом тесте чипы с архитектурой Kepler немного уступают последнему представителю архитектуры Fermi из-за меньшего количества блоков ROP и филлрейта, но их скорости хватило, чтобы удержать позиции.

Если сравнивать Geforce GTX 690 с потенциальным конкурентом в виде будущего двухчипового решения серии Radeon HD 7000, то плата Nvidia явно останется сильнее, так как в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, в борьбе Nvidia и AMD есть явный победитель — производитель видеокарт Geforce.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим несколько иное распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета Rightmark. В этом случае производительность решений с диаграммы расходится с тем, что мы видели ранее в математических тестах из нашего тестового пакета.

Видно, что конкурирующая с Kepler архитектура GCN от AMD справляется с данной задачей просто отлично, и видеокарты от AMD всегда показывают лучшие результаты в случаях, когда выполняется простая и интенсивная математика. Топовое одночиповое решение компании AMD обгоняет соответствующий Geforce с большим запасом и нет никаких причин, чтобы помешать сделать это и будущей двухчиповой видеоплате.

Ну а пока что именно Geforce GTX 690 стала временным лидером в данном тесте. Как ни странно, но эффективность SLI-рендеринга в её случае оказалась довольно высокой, в отличие от скорости двух плат GTX 680 в SLI-конфигурации. И всё же, эффективность GK104 в этом тесте сравнительно низка. По какой-то причине платы на первых Kepler не могут показать теоретически возможные результаты, отставая от аналогичных решений конкурента. Вероятно, виновата несколько сниженная эффективность новой архитектуры при выполнении сложных шейдерных программ.

Direct3D 11: Производительность тесселяции

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD. К сожалению, в тестах из DX SDK, использующих вычислительные (Compute) шейдеры, обе двухчиповые конфигурации Nvidia работают некорректно, показывая одинаковый результат во всех условиях, что явно не соответствует действительности.

Поэтому в данном обзоре придётся обойтись без примера HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры, а также расчётной задачи гравитации N тел (N-body) — симуляции динамической системы частиц, на которую воздействуют физические силы. Так что переходим сразу к тестам производительности в задачах тесселяции.

Аппаратная тесселяция считается одним из самых важным нововведений в Direct3D 11. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Мы уже видели ранее, что parallax occlusion mapping (средние столбики на диаграмме) на видеокартах обоих производителей выполняется менее эффективно, чем тесселяция (нижние столбики), а тесселяция не даёт падения производительности в разы. То есть, качественная имитация геометрии при помощи пиксельных расчётов обеспечивает даже меньшую производительность, чем реальная оттесселированная геометрия с displacement mapping.

В тесте простого бампмаппинга видно, что платы могут упираться в ПСП, а эффективность SLI зависит от рассматриваемой конфигурации. В случае двух плат Geforce GTX 680 она достаточно высока, а вот для GTX 690 явно ниже, чем должна быть по теории. В любом случае, судя по сравнительным результатам одночиповых плат AMD и Nvidia, будущий топовый Radeon на двух Tahiti будет победителем этого подтеста.

Второй подтест со сложными пиксельными расчётами показывает, что эффективность выполнения сложных математических вычислений у чипов архитектуры GCN гораздо выше, чем у плат Nvidia. Топовая одночиповая плата семейства Radeon HD 7000 показала отличный результат в тесте parallax mapping, обогнав Geforce GTX 680 более чем на 40%, а значит и в случае двухчиповых плат будет примерно такое же соотношение. Интересно, что в этом случае эффективность SLI выше уже у GTX 690, а пара GTX 680 в SLI работает явно неэффективно.

То же самое касается им самого интересного подтеста тесселяции, где новая модель чуть быстрее пары GTX 680. Печально другое — в этом тесте особого толка от SLI нет ни в одном случае — двухчиповые конфигурации лишь чуть быстрее одиночной GTX 680. Скорее всего виновато ещё и весьма умеренное разбиение треугольников в этом тесте, но и недостатки оптимизации драйверов для SLI очевидны.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере мы видим уже более правдоподобное сравнение геометрической мощи различных решений. Хотя все современные чипы вполне неплохо справляются даже с серьёзной геометрической нагрузкой, но графические процессоры Nvidia остаются непревзойдёнными по этому показателю.

Очень любопытно сравнение GTX 690 и пары GTX 680 в SLI. Такое впечатление, что во втором случае одна из видеокарт просто не работала в тяжёлых режимах, хотя в лёгких разница есть. Но нас сегодня больше интересует двухчиповая Geforce GTX 690, и вот как раз она даже в тяжёлых режимах показала приличную эффективность от SLI. В самом тяжёлом режиме разница между GTX 680 и GTX 690 приближается к двукратной.

Собственно, все чипы архитектур Fermi и Kepler весьма хороши в таких задачах, и хотя чипы архитектуры GCN от AMD в задачах тесселяции заметно увеличили скорость, это не позволило догнать чипы нового поколения Kepler. Так что даже когда выйдет двухчиповая модель на двух чипах из семейства Radeon HD 7000, то в синтетических и псевдоигровых тестах с применением тесселяции представленная сегодня двухчиповая плата Nvidia всё равно останется в лидерах.

Давайте рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности, он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются сразу все блоки GPU, а не только геометрические, как в предыдущем бенчмарке.

Мы протестировали программу при четырёх разных коэффициентах тесселяции, в данном случае настройка называется Dynamic Tessellation LOD. И если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты компании AMD очень сильны, то при усложнении работы платы компании Nvidia вырываются вперёд. При увеличении коэффициента разбиения и сложности сцены производительность любых плат Radeon падает заметно сильнее.

Сравнивать тут платы Nvidia и AMD очень просто — первые всегда быстрее в несколько раз. И никакие двухчиповые Radeon HD 7000 тут не помогут. Поэтому сравним платы семейства Geforce GTX 600, в их результатах есть интересные моменты. Во-первых, удивительно поведение SLI-системы из двух GTX 680. Двухчиповый рендеринг работает в самых лёгких условиях, но скорость быстро «просаживается» при увеличении нагрузки. В случае Geforce GTX 690 всё совсем не так, что снова наводит на мысли о программных оптимизациях, сделанных в драйверах специально для этой модели. По результатам тестирования она оказывается почти до двух раз быстрее, по сравнению с одночиповым аналогом на том же GPU — это отличный результат!

Итог тестов тесселяции неизменен который год — в условиях очень тяжёлой геометрической нагрузки чипы Nvidia заметно производительнее. И хотя AMD в семействе GCN в очередной раз улучшили геометрическую производительность и в реальных применениях их платы практически не уступают решениям Nvidia, то в синтетических они всё ещё проигрывают платам Geforce. Чип GK104 даже в одиночку отлично справляется с такими задачами, не говоря уже о двухчиповой плате Geforce GTX 690, которая ожидаемо стала лучшей в этой категории тестов.

Выводы по синтетическим тестам

Проведённые нами синтетические тесты новой модели видеокарты из серии Geforce GTX 600, основанной на двух графических процессорах GK104, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, позволяют сделать выводы о том, что новое решение Nvidia совершенно точно станет быстрейшим графическим решением на рынке как минимум до выхода двухчипового конкурента.

Собственно, каких-то свежих выводов в обзоре двухчиповой платы сделать невозможно, всё уже описано в базовом обзоре первой видеокарты на базе графического процессора GK104. Чип новой архитектуры Kepler имеет массу улучшений, направленных на увеличение энергоэффективности и ускорение математических расчётов, обработки геометрических данных и текстурирования. Он отлично подошёл и для двухчипового решения — наш набор синтетических тестов показал, что производительность этой видеокарты зачастую почти вдвое выше, чем у Geforce GTX 680 и близка к конфигурации с двумя такими платами, работающими в режиме SLI.

Есть у решения и недостатки, как и у любой другой двухчиповой видеокарты. О них мы уже неоднократно рассказывали, нет смысла повторяться. Плюс к этому, в некоторых тестах сложных пиксельных шейдеров, вроде Parallax Occlusion Mapping и Fur, эффективность новинки явно недостаточна, чтобы сражаться с ожидаемым в скором будущем топовым решением от конкурента, которое явно будет иметь в таких тестах определённое преимущество.

Кроме того, топовую видеоплату Geforce GTX 690 может подвести недостаток пропускной способности видеопамяти и объём видеопамяти в размере лишь 2 ГБ на каждый чип. Ведь у конкурента и ПСП будет явно выше, и объём видеопамяти будет в полтора раза больше. Пусть эти недостатки скажутся в малой части игр и настроек, но именно в тех, которые интересны энтузиастам, готовым выложить большие деньги. Можно предположить, что в некоторых играх эти ограничения не дадут новой плате Nvidia остаться лидером после выхода реального конкурента.

Ну а пока что мы можем отметить то, что в большинстве тестов именно новая плата от Nvidia стала быстрейшим на данный момент решением. Что стало возможным благодаря применению двух новых чипов GK104, отличающихся высокой производительностью и низким потреблением энергии, а также улучшению эффективности технологии многочипового рендеринга в некоторых из наших тестов. Видеокарта Geforce GTX 690 является отличным приобретением для энтузиастов, любящих всё самое лучшее и готовых закрыть глаза на его высокую цену. На сегодняшний день это наиболее производительная видеокарта на рынке. Без каких-либо оговорок.