Характеристики 3090, 3080, 3070
Можно с уверенностью сказать, что серия RTX 20 никогда особо не привлекала игровую и майнинг аудиторию, чего пыталась достичь Nvidia.
Несмотря на то, что архитектура Turing обеспечивает поддержку аппаратного-ускорения трассировки лучей и технологии «Deep Learning Super Sampling» (DLSS) на основе искусственного интеллекта, мы все равно видели относительно скромный выигрыш с точки зрения традиционной производительности – в сочетании с более высокими ценами (на 20-ю линейку) по сравнению с 10 линейкой – означало, что большинство геймеров и майнеров не стремились к обновлению и использовали свои старые видеокарты.
С Ampere Nvidia пытается решить эту проблему. Количество ядер было значительно увеличено по всем направлениям: RTX 3090 может похвастаться невероятными 10496 ядрами CUDA, а RTX 3080 – 8704.
Память также была обновлена до новой GDDR6X от Micron, которая в сочетании с более широким 320-битным интерфейсом памяти обеспечивает почти на 70% более высокую пропускную способность, чем RTX 2080.
Благодаря переходу на 8-нм узел Samsung, GPU RTX 3080 также оснащен впечатляющими 28 миллиардами транзисторов.
Компания также продолжила развивать свои функции RTX, заявляя о значительном улучшении производительности ядер RT и Tensor по сравнению с Turing.
Можно с уверенностью сказать, что прием технологии RTX в целом был довольно прохладным (со стороны потребителей), но с запуском DLSS 2.0 в апреле и ядрами RT 2-го поколения от Nvidia, которые предположительно увеличивают пропускную способность в два раза по сравнению с ядрами первого поколения, Ampere может изменить мнение потребителей.
Все эти улучшения сопровождаются повышенным энергопотреблением, несмотря на то, что Nvidia перешла с 12-нанометрового техпроцесса TSMC на 8-нанометровый технологический узел Samsung в 30-й серии.
Общая графическая мощность или TGP – энергопотребление всей карты – теперь составляет до 320 Вт для RTX 3080, что на 28% больше, чем у флагмана последнего поколения, RTX 2080 Ti.
Несмотря на это, мы также можем отметить, что Clock Speed был немного снижен по сравнению с 20-й серией, при этом RTX 3080 имеет Boost Clock 1710 MHz, по сравнению с Clock Speed 1815 MHz у RTX 2080 Super.
Ampere вносит несколько ключевых изменений в архитектуру GPU и далее мы о них поговорим!
Тесты
Сначала у нас есть Call of Duty: Modern Warfare. Это была явная победа 5700 XT над 2060 Super, поскольку она предлагала на 22% больше кадров при 1440p. Удивительно, но даже по сравнению с RTX 2070 Super 5700 XT является превосходным исполнителем, даже если он составляет всего 5%. Это действительно впечатляющий результат для AMD, учитывая, насколько дешевле Radeon GPU. 2070 Super способен выдвигаться вперед в точке останова Ghost Recon, делая его на 7% быстрее, чем 5700 XT при 1440p. Тем не менее, низкая производительность на 1% у GeForce была немного лучше — на 16% быстрее. 5700 XT и RTX 2070 Super — это шея и шея в Shadow of the Tomb Raider, обеспечивающая в среднем 87 кадров в секунду при 1440p. Оригинальные 2070 и 2060 Super также соответствуют друг другу, и похоже, что повышенная тактовая частота супер ядер 2060 компенсирует их меньшее количество. Производительность была конкурентоспособной в Gears 5, здесь 5700 XT вырвался вперед в 1080p, в то время как 2070 Super удалось с небольшим отрывом выйти на первое место в 1440p. Это еще одна игра, в которой графический процессор Radeon способен пробивать вес выше своей весовой категории.
Переходя к Control, это одна из игр с поддержкой DLSS 2.0, и мы скоро увидим эти результаты. На данный момент вот родная производительность 1080p и 1440p. 5700 XT просто удается превзойти 2060 Super in Control, в то время как 2070 Super на 16% быстрее при 1440p. Это может не полностью оправдывать увеличение цены на 20%, но, возможно, здесь поможет включение DLSS. Далее у нас есть Metro Exodus, и здесь 5700 XT легко превосходит 2060 Super. Настолько, что он может сравниться с 2070 Super. Технически графический процессор Radeon работает лучше в этом названии с более стабильной производительностью по времени кадра, по какой-то причине 2070 Super изо всех сил пытались улучшить результат на 1% ниже, чем у стандартных 2070 и 2060 Super. В Resident Evil 3 модель 2070 Super способна подавить 5700 XT, опередив его на 7% с 1440p. Здесь 5700 XT работает ближе к 2070 Super, чем к 2060 Super, так что это остается хорошим результатом для AMD. Nvidia устраивает гораздо более убедительный бой в Doom Eternal, обойдя 5700 XT с 2070 Super с отрывом в 21%.
Еще одна игра, в которой 5700 XT удалось сопоставить только с 2060 Super, — это Fortnite с использованием режима DX12. Обе графические процессоры по $ 400 в среднем составляют около 90 кадров в секунду, в то время как 2070 Super работает на 17% быстрее, в среднем чуть более 100 кадров в секунду. PUBG — еще одна игра, в которой производительность Radeon немного сомнительна, чуть ниже RTX 2060 Super. Частота кадров для 5700 XT относительно конкурентов GeForce в этом названии намного хуже, здесь RTX 2070 Super на 21% быстрее. Borderlands 3 стал специальным продуктом AMD, очень похожим на то, каким был Forza Horizon 4 в течение достаточно долгого времени. Это серьезный выброс в нашем тестировании, но результаты точные. 5700 XT на 32% быстрее, чем 2060 Super, и на 13% быстрее, чем 2070 Super. Какие бы оптимизации здесь ни проводились, они явно работают.
Наконец, у нас есть Battlefield V, где 5700 XT может соответствовать 2070 Super со средним значением 100 кадров в секунду при 1440p. Это великолепный показатель от графического процессора Radeon за 400 $ и звездной частоты кадров для названия, которое выглядит так хорошо при 1440p.
Тесты DLSS в Deliver us the Moon и Wolfenstein: Youngblood: значительное улучшение качества
Мы уже неоднократно рассматривали работу технологии Deep Learning Super Sampling или DLSS. Первое время пришлось мириться с недостатками качества картинки, особенно артефакты были заметны в Battlefield V. В Metro: Exodus, Anthem или Shadow of the Tomb Raider тоже были проблемы с качеством картинки, особенно в Anthem. И только в Control мы получили существенные улучшения.
Если верить NVIDIA, за прошедшие месяцы и недели были внесены многочисленные оптимизации. И результат мы как раз рассмотрим в статье. Мы протестируем игры Deliver us the Moon и Wolfenstein: Youngblood, оценим качество DLSS и эффектов RTX. Но сначала позвольте привести предыдущие статьи по теме DLSS:
Но сначала позвольте напомнить принцип работы DLSS.
Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).
Как работает DLSS?
Для DLSS тоже используется нейросеть, анализирующая кадры из разных игр. С одной стороны, видеокарта обеспечивает рендеринг кадров (в меньшем разрешении, нежели родное), с другой стороны имеются идеальные кадры. Последние были получены на суперкомпьютере NVIDIA SATURN V с 64x суперсемплингом (64xAA). Через DLSS просчитываются финальные кадры, которые используют на входе как кадры видеокарты с низким разрешением, так и идеальные кадры. За инференс отвечают ядра Tensor архитектуры Turing.
По сути, алгоритм DLSS представляет собой высоко специализированный (и временной) фильтр скейлинга. Конечно, результат уступает по качеству картинке в родном высоком разрешении, но приближается к ней благодаря оптимизациям и тренировке сети глубокого обучения. Чтобы получить такой же результат, как в высоком родном разрешении, сеть глубокого обучения должна обладать бесконечно большим массивом данных, а также тренироваться бесконечное время. Так что DLSS неизбежно приводит к неточностям и артефактам, другой вопрос, насколько они заметны.
Поскольку данные для тренировки доступны с суперсемплингом 64x, кадр 2K с масштабированием до 4K может выглядеть даже лучше, чем кадр в родном разрешении 4K. Но здесь все зависит от тренировки сети глубокого обучения, которая в конечном итоге и дает наилучший результат. Чем больше будет тренировок сети, тем лучше будет работать алгоритм.
На втором этапе внедрения технологии будет работать DLSS 2x, когда в качестве основы для алгоритма будет браться кадр с видеокарты в планируемом выходном разрешении (пока разрешение меньше). После чего будет выполняться такой же процесс инференса. Но на первом этапе кадр берется в меньшем разрешении, всегда выполняется масштабирование. За прошедшие месяцы NVIDIA внесла многочисленные улучшения в работу DLSS. Что впервые стало заметно в игре Control.
Deliver us the Moon – DLSS
Мы начнем с Deliver us the Moon. Игра поддерживает эффекты RTX и DLSS. Перед запуском можно выбрать путь рендеринга игры через DirectX 11 или DirectX 12 API. Эффекты RTX и DLSS доступны только под DirectX 12. В настройках можно выбрать уровень эффектов RTX: отключены, Medium, High и Epic. В зависимости от выбранного уровня, через RTX просчитываются только отражения или еще и эффекты освещения.
В настройках DLSS тоже можно выбрать включение и выключение эффектов, а также качество (Performance, Balanced и Quality). Мы проведем сравнение между выключенным DLSS и настройкой высокого качества (Quality). Отметим, что мы сравниваем скриншоты. При динамичном геймплее разница будет еще менее заметной.
Перейдем к первому сравнению между уровнями DLSS On/Off в Deliver us the Moon:
Улучшения RT и Tensor
Наряду с улучшениями самих тензорных ядер и RT-ядер, Nvidia также представила то, что она называет параллелизмом второго поколения.
С Turing, GPU был ограничен одновременным выполнением конвейеров шейдеров и RT, в то время как любые рабочие нагрузки DLSS (Tensor) должны были идти дальше по конвейеру. С Ampere теперь можно выполнять операции шейдера, RT и DLSS одновременно, повышая производительность для конечного пользователя.
Используя Wolfenstein Youngblood в качестве примера, если бы Ampere попытался отрендерить кадр с трассировкой лучей с помощью программного обеспечения, без использования ядер RT или Tensor, Nvidia утверждает, что мы будем смотреть на время кадра в 37 мс, или около 27 кадров в секунду. Благодаря ядрам RT трассировку лучей значительно проще запускать, чем через программное обеспечение, поэтому время кадра можно сократить до 11 мс.
После добавления DLSS к рабочей нагрузке через ядро Tensor время рендеринга дополнительно сокращается до 7,5 мс.
Nvidia утверждает, что одновременное выполнение всех трех операций повысит производительность еще больше, с временем кадра 6,7 мс, или 149 кадров в секунду.
Что мы узнали
Nvidia проделала огромную работу по переосмыслению того, что такое DLSS и как оно работает. Без сомнения, они прошли долгий путь от этих ужасно размытых первоначальных реализаций , так что им спасибо. Теперь проблема в поддержке игр, нам нужно намного больше, но мы считаем, что вы увидите поддержку DLSS только в спонсируемых Nvidia играх (Nvidia GameWorks), и если это так, не все игры увидят поддержку DLSS. Тот факт, что AMD работает на консолях следующего поколения от Sony и Microsoft, также не является обнадеживающим признаком, но нам просто нужно подождать и посмотреть. Если посмотреть на сегодняшнюю цену, GeForce стоит на 20% больше, так как большинство карт в розничной торговле начинаются с $ 520 и выше , в то время как мы также можем найти множество 5700 XT, доступных по цене $ 400 MSRP [ 19459003] или чуть выше для более оснащенных моделей, которые мы полностью рекомендуем. С точки зрения стоимости, 2070 Super не может достичь уровней Radeon 5700 XT. Но если вы отдадите предпочтение производительности, тогда графический процессор Nvidia может быть лучшим выбором. Для тех, кто хочет играть на 4K, в частности, 2070 Super стоит потратить лишние 100 долларов, поскольку повышение в 9%, которое он предлагает в среднем, обычно приводит к лучшему игровому опыту.
Итог, хотя мы считаем 5700 XT несколько очевидным выбором по сравнению с по аналогичной цене 2060 Super , правильный выбор менее очевиден при сравнении с RTX 2070 Super. Для большинства геймеров, использующих 1080p или 1440p, Radeon RX 5700 XT предлагает лучшее соотношение цены и качества, но если вы ищете максимальную производительность при 1440p или выше, то 2070 Super может стоить потратить немного больше. В любом случае вы не ошибетесь, поскольку оба графических процессора обеспечивают исключительную производительность.