Прощай, Ампер; здравствуй, Ада Лавлейс: Nvidia представила свое новое поколение видеокарт GeForce на ежегодной конференции по графическим технологиям, на которой компания раз в два года обновляет архитектуру графического процессора, на этот раз названную в честь математика и пионера программирования.
Nvidia обещает, что флагман RTX 4090 может работать в два раза лучше в играх с интенсивным использованием растра и в четыре раза быстрее в играх с полной трассировкой лучей, чем прежний флагман RTX 3090 Ti, в то время как RTX 4080 должен быть в три раза быстрее, чем RTX 3080 Ti. RTX 4090 планируется выпустить 12 октября по цене 1599 долларов, в то время как RTX 4080 поступит в продажу в ноябре по цене 899 долларов; последний будет поставляться в двух версиях, 16 ГБ и 12 ГБ.
В дополнение к картам Nvidia Founders Edition версии, использующие графические процессоры, будут доступны у обычных партнеров Nvidia (кроме EVGA), включая Asus, Gigabyte, MSI, PNY и Zotac. RTX 3080, 3070 и 3060 останутся в линейке, и я бы рассчитывал на большие скидки на них в сезон праздничных покупок.
Section 1. Specifications
RTX 4090 | RTX 4080 (16GB) | RTX 4080 (12GB) | |
---|---|---|---|
Memory | 24GB GDDR6X/384 bit | 16GB GDDR6X/256 bit | 12GB GDDR6X/192 bit |
CUDA cores | 16,384 | 9,728 | 7,680 |
Boost clock (GHz) | 2.52 | 2.51 | 2.61 |
PCIe Gen | 4 | 4 | 4 |
Card width | 3 slots | 3 slots | Varies |
Power/PSU requirement | 450W/850W | 320W/700W | 285W/700W |
Availability | Oct. 12 | November | November |
US price | Starts at $1,599 | Starts at $1,199 | Starts at $899 |

Архитектура Ada Lovelace в чипах – неясно, будет ли она называться “Ada”, что короче, или “Lovelace”, в соответствии с традицией, – включает семь обновлений оборудования, некоторые из которых являются производными от ее брата по центру обработки данных, Hopper:
- Построен по 4-нм техпроцессу. Оптимально, если процессы меньшего размера позволяют втиснуть больше кремния в одно и то же пространство, при этом (как правило) повышается мощность и производительность.
- Ядра трассировки лучей третьего поколения удваивают пропускную способность вычислений взаимодействия лучей с полигонами, определяющими изображение, что, по словам Nvidia, увеличивает скорость работы с плавающей запятой до 2,8 раза.
- Тензорные ядра четвертого поколения, которые управляют программным обеспечением для масштабирования DLSS от Nvidia, позволяют DLSS перейти от генерации отдельных пикселей к более эффективным алгоритмам на основе кадров для своего нового DLSS 3. Более 35 игр и приложений подписаны на включение DLSS 3, начиная с октября.
- Обновленные потоковые мультипроцессоры обеспечивают более чем в 2 раза большую пропускную способность Ampere SMs.
- Изменение порядка выполнения шейдеров оптимизирует передачу данных с трассировкой лучей в SMS для растрирования, что, по словам компании, повышает производительность шейдеров до 2 раз и частоту кадров до 25%.
- Optical Flow Accelerator использует данные о движении пикселей в DLSS для генерации новых кадров; Nvidia заявляет, что это повышает производительность в играх с интенсивным использованием процессора (таких как сложные симуляторы, такие как Microsoft Flight Simulator).
- Двойные кодеры AV1 должны улучшить качество обработки видео на лету для стримеров. Ожидается, что OBS выпустит новую версию своего программного обеспечения для потоковой передачи в октябре, а Discord планирует поддержать ее позже в этом году.
В дополнение к новым возможностям обработки данных Nvidia представила несколько новых программных алгоритмов, также повышающих производительность.
- Микрокарты непрозрачности заранее создают и сохраняют маски в объектах мира, поэтому их не нужно воссоздавать.
- Смещенные микросети – это сетки меньших треугольников, которые новые ядра RT могут обрабатывать без необходимости сохранения или предварительной обработки где-либо еще они повышают скорость (до 10 раз, в расчете на Nvidia) и требуют до 20 раз меньше видеопамяти в определенных случаях.