Видеокарты. Тестовая конфигурация, инструментарий и методика тестирования, видеокарты для сравнения. Игровые тесты: The Elder Scrolls IV: Oblivion

Видеокарта ATI Mobility Radeon HD 4870 от AMD - стандартизированный под DirectX 10.1 графический адаптер для ноутбуков класса Hi-End. Технически он основан на HD 4850/4870 GPU для настольных систем, но имеет меньшие тактовые частоты для минимизации энергопотребления. Также как и настольный, этот HD 4870 можно укомплектовать памятью GDDR5.

Производительность ATI Mobility Radeon HD4870 в играх сравнима с настольной HD 4850, что является уже достижением. Большое количество шейдеров и 256-битная шина позволяют запускать любую игру под DirectX 9 на высоких разрешениях и деталях. Требующие DirectX 10 игры, такие как Crysis, могут также запускаться с высокой детализацией.

Mobility HD 4870 основывается на чипе RV770 и предполагает 800-поточный процессор (160 5-мерных шейдерных ядер). Эти ядра выполняют графические вычисления, которыми занимались шейдерные и пиксельные конвейеры на старых GPU. Потоковые процессоры также называются ALU и группируются пяти-направленные модули VLIW. Каждая из пяти инструкций VLIW компонента должна быть независима от остальных и именно поэтому скорость работы зависит от оптимизации драйверов.

Mobility Radeon HD 4870 включает Avivo HD - так называемую видео технологию состоящую из звукового чипа на 7.1 канал через HDMI, или DisplayPort и UVD (Unified Video Decorder) второго поколения. Этот UVD 2 поддерживает полный побитовый декодинг потоков H.264/MPEG-4 AVC и VC-1. В дополнение ко всему поддерживается потоковая обработка дуал-видео, и режима Картинка-в-картинке, что делает UVD полностью совместимым с BD-Live. Упрощенно говоря, технология Avivo HD перехватывает все видео вычисления и задействует GPU для декодинга HD video.

AMD опубликовала некоторые характеристики, по которым энергопотребление HD 4870 находится где-то в области 65 Вт. До сих пор не известно потребляет ли эту цифру исключительно сам чип, либо это потребление всей платы целиком включая память (на которую придется еще порядка 5 вт). В сравнении с настольной ATI Radeon HD 4870 , мобильная 4870 показывает более медленную частоту ядра и, поэтому, должна находиться примерно на том же уровне, на котором сейчас десктопная версия.

Производитель: ATI
Серия: Mobility Radeon HD 4800
Код: M98-XT
Потоки: 800
Тактовая частота: 550/680* МГц
Частота шейдеров: 550* МГц
Частота памяти: 888/700* МГц
Разрядность шины памяти: 256 Бит
Тип памяти: GDDR5
Максимум памяти: 1024 Мб
Общая память: нет
DirectX: DirectX 10.1, Shader 4.1
Транзисторы: 956 млн
Технология: 55 нм
Дополнительно: OpenGL 2.0, PCI-E 2.0 x16, Powerplay, поддержка DisplayPort до 2560x1600, поддержка HDMI до 1920x1080 (вместе с 7.1 AC3 аудио), 1x Dual-Link/Single-Link DVI, поддержка 1x Single-Link DVI (все порты для дисплеев должны поддерживаться производителями ноутбуков)
Размер ноутбука: Большой
Дата выхода: 09.01.2009
Ссылка на производителя: http://ati.amd.com/products/mobilityradeonhd4800/index.html
* Указанные тактовые частоты являются лишь рекомендацией для производителей и могут быть изменены ими.

HIS RADEON HD 4870 512MB PCI-E

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть.

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max - по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max - по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос , с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться .

К сожалению, на настоящий момент утилита RivaTuner (автор А.Николайчук AKA Unwinder) не поддерживает новую серию, и потому мониторинга нет.

Комплектация.

Базовый комплект поставки должен включать в себя: руководство пользователя, диск с драйверами и утилитами, переходник-адаптер DVI-to-VGA, мост CrossFire, DVI-to-HMDI адаптер, адаптер компонентного вывода (TV-out), а также разветвители внешнего питания. Далее мы покажем, что предлагается к карте дополнительно.

Упаковки.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra на чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 8.6; Nvidia версии 175.16 (9ххх серия) и 177.34 (GTX 2xx).

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка .
  • RightMark3D 2.0 с кратким описанием: ,

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 4870 HD4870 )
  • RADEON HD 4850 со стандартными параметрами (далее HD4850 )
  • RADEON HD 3870 X2 со стандартными параметрами (далее HD3870X2 )
  • RADEON HD 3870 со стандартными параметрами (далее HD3870 )
  • Nvidia Geforce GTX 260 со стандартными параметрами (далее GTX260 )
  • Nvidia Geforce 9800 GTX со стандартными параметрами (далее GF9800GTX )

Для сравнения результатов новой видеокарты RADEON HD 4870, были выбраны именно эти модели видеокарт по следующим причинам: с RADEON HD 3870 X2 её будет интересно сравнить, как с двухчиповым решением компании AMD на GPU предыдущей архитектуры, чтобы оценить влияние улучшений архитектуры и разницу в производительности. Сравнительная производительность RADEON HD 4850 интересна для того, чтобы узнать вклад повышенных частот GPU и применения нового типа памяти GDDR5. Geforce 9800 GTX хоть и не является прямым конкурентом, но интересен, как прыдущее поколение чипов Nvidia, да и цена HD 4870 не так далека от его ускоренной версии GTX+. А Geforce GTX 260 выступает уже как прямой конкурент RADEON HD 4870, это сравнение и будет главной битвой.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

Ничего нового и интересного, всё соответствует разнице в частотах. Как обычно, видеокарты не достигают теоретических значений. Результаты синтетики не дотягивают до теории, ближе всего к ним подходит HD 3870, основанная на RV670. Но для всех новых видеокарт Nvidia и AMD, в данном тесте теоретический максимум не достигается. RV770 в нашем тесте выбирает около 26-27 текселей за один такт из 32-битных текстур при билинейной фильтрации, не дотягивая до 40 теоретических. У карт Nvidia эффективность даже ещё ниже — 35-37 текселей за такт при теоретических 64.

Что касается сравнения HD 4870 с прямым конкурентом GTX 260, то они весьма близки в этом тесте, а вот до Geforce 9800 GTX обе не дотягивают. Новая карта AMD значительно опережает старую, и обгоняет младшую модель линейки HD 4800 в соответствии с частотами. Интересно, что в тесте с одной текстурой HD 4870 немного отстаёт от HD 3870, это связано с теоретически большей производительностью блоков ROP у последнего при 32-битном фреймбуфере без антиалиасинга. В случае же с большим количеством текстур на пиксель, способности блоков ROP не мешают показывать более высокие результаты карте на основе RV770. Посмотрим на результаты в тесте филлрейта:

Второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. В случаях с 0 и 1 накладываемыми текстурами у RADEON HD 4870 получается всё тот же чуть более низкий результат, чем у HD 3870, что обусловлено рабочей частотой блоков ROP. Но, как и на предыдущей диаграмме, в ситуациях с большим количеством текстур на пиксель, новая видеоплата выходит вперёд.

Direct3D 9: Тесты Geometry Processing Speed

Рассмотрим пару предельных геометрических тестов, и первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:

Все современные чипы основаны на унифицированных архитектурах, их универсальные исполнительные блоки в этом тесте заняты только геометрической работой, и решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.

Результаты это и показывают — RV670 и RV770 весьма близки при сходных частотах. Результаты решений AMD традиционно более высокие, чем у карт Nvidia. RADEON HD 4870 в этом тесте выигрывает и у обеих карт Nvidia, и у своих собратьев. Так как мы убрали из рассмотрения промежуточные тесты на скорость обработки геометрии с одним источником освещения, то переходим к рассмотрению самой сложной геометрической задачи с тремя источниками света, включающей статические и динамические переходы:

В этом варианте разница между решениями AMD и Nvidia видна лучше, разрыв немного увеличился, видеоплаты производства второй компании «просели». HD 4870 и HD 3870 примерно равны на схожих частотах, они снова ограничены чем-то вроде triangle setup, так как цифры почти не изменились с прошлого теста.

Снова все видеокарты AMD опережают и Geforce 9800 GTX и GTX 260. В реальных приложениях универсальные шейдерные процессоры заняты в основном пиксельными расчетами, к исследованию производительности которых мы и переходим.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.

Хоть тесты слишком просты для современных архитектур и не показывают их истинную силу, их интересно смотреть при смене архитектур. В простых тестах производительность ограничена скоростью текстурных выборок, а в чипе RV770 производительность текстурирования как раз улучшена. Это позволило добиться победы по всем фронтам, HD 4870 опережает обе карты Nvidia во всех рассмотренных задачах и быстрее HD 3870 иногда до двух раз.

В более сложных тестах RADEON HD 4870 также показывает отличные результаты, значительно опережая и предшественника и конкурентов. А вот Geforce GTX 260 из-за меньшей скорости текстурирования не впечатляет, немного выигрывая у 9800 GTX лишь в двух самых сложных тестах. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:

Великолепный результат для RADEON HD 4870! В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water», где используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются по скорости текстурирования, новая модель значительно обгоняет обе карты Nvidia, а разница с HD 3870 просто поразительна.

Второй тест интенсивнее загружает вычислительные блоки, и он лучше подходит для архитектур AMD, обладающих большим количеством потоковых процессоров. В нём новое решение AMD снова показывает лучший результат, быстрее и Geforce GTX 260 и 9800 GTX в 1.5-2 раза! И снова, по сравнению с предыдущим поколением, новая плата ускорилась более чем в два раза. Разница с HD 4850 соответствует разнице в частотах GPU.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это математические тесты, зависящие от частоты шейдерных блоков и скорости текстурирования, тут важен баланс чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок, поэтому старые RADEON показывают самый слабый результат. А вот новые… Смотрите сами, они заметно быстрее предыдущего. А рассматриваемый сегодня HD 4870 вовсе опережает и Geforce 9800 GTX и GTX 260.

Во втором тесте «Parallax Mapping», новинки от AMD ещё сильнее. Если HD 4850 показывает результат чуть выше GTX 260, то HD 4870 значительно опережает обе модели от Nvidia. Улучшения в TMU значительно усилили результаты линейки HD 4800, в этих тестах они стали новыми лидерами. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там результаты могут получиться даже более интересными:

Результаты RADEON HD 4850 и Geforce 9800 GTX весьма близки, но HD 4870 ожидаемо обходит обоих за счёт более высокой частоты чипа. Взаимное положение карт немного изменилось, заметен упор в скорость текстурных блоков. И обе карты на RV770 обгоняют предыдущий одночиповый топ в два и более раза. А вот GTX 260 показал в этом случае весьма слабые результаты, отстав даже от предшественника.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье
  • Fur — процедурный шейдер, визуализирующий мех

Новая архитектура компании AMD в этих тестах показывает себя с лучшей стороны, в отличие от предыдущих решений, которые проигрывали картам Nvidia. HD 4870 с большим запасом опережает всех соперников, разница с HD 3870 просто огромна. Да и Geforce 9800 GTX с Geforce GTX 260 остаются далеко позади.

Снова мы видим отличные результаты переработанной архитектуры AMD в наших DirectX 9 тестах. Но что получится в DX10, ведь в прошлых исследованиях там дела были явно похуже. Сейчас узнаем, сравнив уже с двухчиповой картой предыдущего поколения, так как с одночиповыми RV670 всё давно понятно…

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. Как мы и ожидали, в Direct3D 10 тесты процедурной визуализации меха с большим количеством текстурных выборок ничего особенно не изменилось — всё такое же огромное преимущество решений Nvidia над AMD. Посмотрим, что будет дальше, этот тест карты AMD всегда проваливают.

Хотя HD 4870 и проиграл обеим картам Nvidia, относительно младшей модели линейки он показал преимущество, соответствующее разности частот. Да и двухчиповый RADEON HD 3870 X2 обогнал новое решение HD 4870 только в тяжелом режиме. Очень хороший результат, если не смотреть на цифры Nvidia. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, в этот раз подавляющее преимущество карт Nvidia также никуда не делось, хотя новые видеокарты AMD уже явно ближе к Geforce 9800 GTX. В остальном, с увеличением сложности шейдера и нагрузки на видеочип, разница между HD 4870 и двухчиповым HD 3870 X2 почти та же, они близки друг к другу.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Повторяется взаимное расположение карт из предыдущего теста. Хотя решения AMD были сильны в Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга они не могут справиться с нашей задачей на уровне видеокарт Geforce, ещё и включение самозатенения вызывает на продукции AMD слишком большое падение производительности. Рассматриваемый нами сегодня RADEON HD 4870 отстаёт от обеих видеокарт Geforce и очень близок к двухчиповому HD 3870 X2. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростью разных видеокарт уже другая, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD улучшают свои показатели относительно решений Nvidia. И новые HD 4800 хотя и продолжают отставать от Geforce, но HD 4870 близок к HD 3870 X2 и почти догнал хотя бы Geforce 9800 GTX. До прямого конкурента GTX 260 ему далеко, конечно же.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

При анализе результатов наших синтетических тестов, мы всегда отмечаем, что в вычислительно сложных задачах современные архитектуры AMD показывают себя лучше конкурирующих от Nvidia. Вот и сейчас в Mineral HD 4870 просто разорвал конкурентов. Топовая видеокарта на основе одного чипа RV770 обгоняет карту прошлого поколения на двух RV670, что близко к разнице в количестве и частоте потоковых процессоров. Также новая видеокарта почти в два раза опережает и прямого конкурента Geforce GTX 260, не говоря про Geforce 9800 GTX.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В данном тесте скорость рендеринга ограничена исключительно производительностью шейдерных блоков, и тест очень хорошо подходит архитектурам AMD, что хорошо заметно после исправления ошибки в драйверах AMD. Что тут можно сказать… Полный разгром решений Nvidia. Вдумайтесь, RADEON HD 4870 более чем в два раза быстрее Geforce GTX 260 и быстрее двухчипового HD 3870 X2. Потрясающий результат, в вычислениях RV770 явно сильнейший GPU вообще. Кстати, соотношение скоростей между HD 4870 и HD 4850 точно соответствует разнице в частотах.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, задача ограничена также и ПСП и филлрейтом.

Ну очень интересно получилось, крайне плотные результаты у двухчиповой HD 3870 X2, новой HD 4870 и конкурента GTX 260. Да и в паре HD 4850 с Geforce 9800 GTX очень тесно. Интересно… Возможно, при переносе части вычислений в геометрический шейдер ситуация будет ещё интереснее, посмотрим:

Но нет, разница между рассмотренными вариантами теста невелика, существенных изменений не произошло. Разве что двухчиповый HD 3870 X2 вышел в явные лидеры по достигнутой частоте кадров. Ему проще, алгоритм многочипового рендеринга AFR прощает многое. Видеокарты Nvidia показывают идентичные результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер, а результаты некоторых видеоплат AMD немного выросли. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. В этот раз скорость RADEON 4850 и HD 4870 больше, чем у двухчипового решения на GPU предыдущей архитектуры, но все карты производства AMD отстают от всех решений Nvidia, хотя HD 4870 близок к ним.

Похоже, что на результаты новых карт повлияли улучшенные возможности текстурирования. Впрочем, цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

В этот раз «провалился» только Geforce 9800 GTX, все остальные архитектуры выдержали удар. И в RV770, и в GT200 были сделаны некоторые оптимизации, направленные на улучшение исполнения геометрических шейдеров. И RADEON HD 4870 теперь догнал Geforce GTX 260, кроме самого простого режима. Предыдущее поколение чипов AMD значительно хуже показывает себя в этом тесте, даже двухчиповая видеокарта отстаёт.

Что касается сравнения результатов в разных режимах, тут всё как всегда, видеоплаты AMD при переходе от использования «instancing» к геометрическому шейдеру при выводе, улучшают свои показатели, а старые видеокарты Nvidia теряют в производительности. Карта Geforce на основе чипа G92 может конкурировать только за счёт скорости в «Balanced» режиме, которая почти равна скорости в «Heavy» у RADEON HD 4850. При этом, получаемая в разных режимах картинка не отличается визуально.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Судя по предыдущим исследованиям, на результаты этого теста влияет не только скорость текстурирования, но и производительность ROP и пропускная способность памяти, и чем проще режим, тем большее влияние на скорость они оказывают. Во всех режимах, кроме простого, лидером является топовая модель серии HD 4800, которую мы сегодня рассматриваем. В простом влияет ПСП, да и многочиповый рендеринг показывает себя неплохо. GTX 260 показывает результат лишь на уровне HD 4850. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, но текстурирование влияет на скорость уже сильнее, что видно по паре Geforce. HD 4870 сдала позиции и не является лидером, хотя отстаёт в сложных режимах от Geforce 9800 GTX совсем чуть-чуть. В простом же лидирует GTX 260 с большой ПСП. Интересно, что с ростом сложности геометрии и разница между HD 4870 и HD 3870 X2 изменяется.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Второй тест этого раздела под названием «Waves» благосклоннее к продукции AMD, новая модель семейства RADEON HD 4800 смотрится очень хорошо, на уровне двухчипового предшественника. И также обгоняет видеокарты Nvidia, кроме самого простого, где GTX 260 чуть-чуть впереди. Похоже, что в таких условиях эффективность TMU у RV770 выше, чем у GPU производства Nvidia. Рассмотрим второй вариант этого же теста:

И снова видим совсем мало нового, хотя с увеличением сложности теста результаты видеоплат AMD относительно скорости карт Nvidia улучшились, последние потеряли несколько больше от изменения условий тестирования. В самом лёгком режиме впереди HD 3870 X2 и HD 4870, в остальных двухчиповому HD 3870 X2 нет равных. Ну а среди одночиповых карт лучшим является герой обзора, он опережает своего младшего брата HD 4850 соответственно разнице в частотах. Карты Nvidia остались в этот раз позади.

3DMark Vantage: Feature тесты

В обзор RADEON HD 4870 мы решили включить и синтетические тесты из 3DMark Vantage. Пакет новый, его feature тесты довольно интересны и отличаются от наших. Вероятно, при анализе результатов карт в этом пакете мы сделаем для себя какие-то новые и полезные выводы.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Соотношение результатов в целом схоже с тем, что показывают наши тесты, используются условия, в которых карты Nvidia не получают дополнительного преимущества от большого количества TMU. Старая одночиповая карта AMD сильно отстаёт от всех, зато и двухчиповый HD 3870 X2 и новая модель HD 4870 значительно обгоняют оба решения производства Nvidia. Geforce GTX 260 отстаёт от Geforce 9800 GTX, как и должно быть по теории. Но вот почему карта на основе RV770 обгоняет и G92 и GT200? Видимо, дело в той самой эффективности текстурных модулей, которая выше у карт AMD.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR рендеринг, поэтому такой тест очень своевременен.

Показания этого теста соответствуют тому, что мы получаем в своих синтетических тестах, с учетом того, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-бит с плавающей точкой. Поэтому все цифры в два раза меньше наших.

Эти цифры скорее показывают не только производительность ROP, но и величину пропускной способности памяти (в случае мультичипов — умноженную на число чипов для AFR). Цифры соответствуют теоретическим и зависят, прежде всего, от ширины шины памяти и её частоты. В данном тесте новая модель HD 4870, пользуясь улучшенными возможностями блоков ROP и большой ПСП GDDR5 памяти, показывает лучший результат, выше, чем у двухчиповой HD 3870 X2 и GTX 260 с 448-битной шиной памяти.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест интересен тем, что он не зависит только от шейдерной мощности, эффективности исполнения ветвлений и скорости текстурных выборок, а от всего сразу. То есть, для достижения высокой скорости важен баланс чипа и карты. И больше всего важна эффективность выполнения ветвлений в шейдерах, так называемая гранулярность исполнения.

Старые карты от обоих производителей далеко позади, даже двухчиповый HD 3870 X2 не смог догнать HD 4870, хотя двухчиповый рендеринг этого теста весьма эффективен. И вот тут мы видим интересное расположение RADEON HD 4870 и Geforce GTX 260. Несмотря на то, что в тестах текстурных выборок и математических вычислений решение AMD обычно выигрывало, в тесте POM Geforce сильнее RADEON. И виновата в этом именно лучшая эффективность обработки ветвлений в шейдерах у GT200.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров, и скорость stream out.

В данном тесте традиционно получаются странные результаты у двухчиповых карт, HD 3870 X2 не получает ускорения от своего второго GPU. В остальном, снова видим отставание решений AMD, даже относительно быстрая HD 4870 не дотягивается до Geforce 9800 GTX, не говоря про GTX260. Похоже, что скорость не зависит от шейдерной производительности, а зависит от скорости stream out…

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Тут мы видим почти то же самое, что и в предыдущем случае, только отстал Geforce 9800 GTX, а карты AMD подтянулись повыше. Но всё равно, лидером остаётся Geforce GTX 260, близко к нему следует сегодняшний герой HD 4870. Двухчиповая карта AMD снова не ушла далеко от старой одночиповой и обе расположились в конце списка. И снова предположим, что на скорость влияет производительность stream out, ПСП и текстурная производительность одновременно.

Feature Test 6: Perlin Noise

Этот feature тест можно считать математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он очень сложен математически.

Последний feature тест в Vantage показывает чистую математическую производительность видеочипов. Показанная в нём производительность вполне соответствует тому, что мы видим в наших математических тестах из RightMark 2.0. Видеокарты AMD закономерно выигрывают у своих конкурентов от Nvidia, даже двухчиповый HD 3870 X2 опережает GTX 260. Ну а RADEON HD 4870 является лидером и опережает своего главного конкурента более чем на 25%.

Выводы по синтетическим тестам

На основе результатов проведённых синтетических тестов, мы подтверждаем выводы, сделанные в предыдущей статье. Новые решения компании AMD получились весьма удачными, в чипе RV770 было сделано много изменений, почти во всех синтетических тестах оно в разы опережает по скорости видеокарты предыдущего поколения. Благодаря улучшенной архитектуре RV770, в которой исправили главные недостатки, во многих тестах RADEON HD 4870 обгоняет своего основного конкурента Geforce GTX 260. RV770 стал более эффективным и сбалансированным, что важно для современных и будущих 3D приложений с большим количеством сложных шейдеров.

Чип RV770 обладает большим количеством исполнительных блоков, поддерживает новую память GDDR5, которая позволила выпустить RADEON HD 4870 с высокой ПСП на основе лишь 256-битной шины обмена с памятью. Небольшие вопросы возникают разве что по поводу меньшей эффективности исполнения ветвлений в шейдерных программах, что сказывается на производительности наиболее сложных алгоритмов parallax mapping. Ну и по скорости stream out новые решения AMD уступают конкурирующим от Nvidia. Всё остальное у новой линейки HD 4800 просто отлично! Особенно вычислительная производительность, по которой они далеко впереди.

Следующая часть статьи содержит тесты нового решения компании AMD и других видеокарт в современных игровых приложениях. Игровые результаты должны подтвердить наши выводы. Можно предположить, что в среднем скорость HD 4870 в играх будет примерно на одном уровне с Geforce GTX 260.

Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией

У каждого бренда на рынке электроники существует один уникальный продукт, который принёс славу своему производителю и попал в историю благодаря своим особенностям. У компании ATI таким флагманом является игровой видеоадаптер Radeon HD 4870. Обзор, характеристики, фото, отзывы владельцев в данной статье позволят читателю узнать поближе этот интересный продукт.

Текущее положение дел

Сразу стоит отметить, что некогда популярная и очень высокопроизводительная видеокарта уже несколько лет занимает последние позиции в рейтинге игровых устройств, однако, как показывает практика, сдаваться без боя графический ускоритель не собирается. Если читатель посмотрит на системные требования к самым последним играм, представленным на рынке несколько месяцев назад, то непременно увидит, что для комфортной игры разработчики рекомендуют использовать Radeon HD 4870, характеристики которой отвечают минимальным требованиям.

Понятно, что для игры на высоких разрешениях в ресурсоёмком приложении данный видеоадаптер вряд ли сможет подойти, однако потенциал у графического ускорителя всё-таки имеется, особенно, если речь идёт о двуядерном представителе рынка. Но обо всё по порядку.

Начальный уровень игрового класса

Видеокарта 4870, в отличие от других продуктов 4000-й серии видеоадаптеров ATI, получила новое ядро RV770, а, соответственно, и современный набор инструкций с поддержкой всех существующих на то время технологий. На площади ядра кристалла 256 мм 2 производителю удалось разместить почти 1 миллиард транзисторов. Графический ускоритель имеет 800 универсальных процессоров, 16 блоков растеризации и 40 текстурных блоков. Эта видеокарта одна из первых получила продвинутую 256-битную шину GDDR5, работающую на частоте 900 МГц.

Графическое ядро в заводском исполнении получило заниженную частоту, равную 750 МГц. Однако читателю не стоит обращать на этот показатель внимание, так как конечные продукты, выпущенные под известными брендами, решили вопрос со скоростью работы графического процессора. Обратить внимание лучше на энергопотребление игрового адаптера - 160 Ватт в максимальной нагрузке. Тут есть о чём подумать всем владельцам маломощных блоков питания.

Все известные технологии

Так как для видеоадаптера Radeon HD 4870 характеристики производительности находятся на первом месте, изготовитель просто обязан был снабдить свой продукт актуальными на то время библиотеками DirectX 10.1. Стандарт OpenGL ограничивается показателем 3.1, чем сильно смущает потенциальных покупателей, ведь на момент презентации устройства, был уже анонсирован OpenGL 4.0. Самое интересное, что устройство получило поддержку новых шейдеров версии 4.1. Именно эта технология до сих пор позволяет видеокарте оставаться востребованной на игровом рынке. Видеоадаптер работает с устаревшим интерфейсом PCEex16 версии 2.0. Максимальная степень составляет 16х.

Немаловажной для графического ускорителя является и поддержка популярных выходов видео DisplayPort и HDMI. Интегрированный на видеоадаптере контроллер аудио поддерживает и передачу 7-ми канального звука. Удивительно, что данная технология была реализована на дискретных платформах как для персональных компьютеров, так и для мобильных устройств. Стоит отметить, что аналоговый выход видео ограничивается разрешением 2048х1536 точек на дюйм, а у цифрового интерфейса этот параметр ничем не лучше - 2560х1600 dpi.

Двойной удар

После проведения первых тестов игрового видеоадаптера в лабораторных условиях, технологи пришли к выводу, что видеокарта Radeon HD 4870, характеристики которой можно доработать, может стать флагманом компании ATI. Изменения коснулись в первую очередь системы питания и распределения фаз. Также производитель установил на видеоадаптер два графических ядра RV770. В результате рынок увидел нового чемпиона по производительности в тестах и играх - видеокарту HD 4870 X2.

Все характеристики номинального устройства фактически увеличились вдвое. Даже в лабораторных исследованиях видеоадаптер показывал идентичные результаты базового устройства, работающего в режиме CrossFire X2. Единственное отличие, которое стоит отнести к достоинствам, - это уменьшение энергопотребления устройством. Производителю удалось снизить потребление двух ядер до 280 Ватт. Это выглядит довольно странно. Ведь, по логике, производитель просто обязан был сделать ребрендинг одноядерных чипов с большим электропотреблением.

Куй железо, пока горячо

Игровым графическим ядром заинтересовались и производители ноутбуков, поэтому компания ATI представила рынку и мобильное решение на новом графическом ядре. Так как для чипа Radeon HD 4870 температура и энергопотребление являются критичными показателями, производитель был вынужден снизить частоту работы графического процессора до 550 МГц. Но и этих показателей достаточно, чтобы обеспечивать комфортную игру многим пользователям.

Все параметры, включая используемые технологии, перекочевали на мобильную платформу. Естественно 256-битная шина GDDR5 с объёмом 1 Гб не осталась незамеченной многими потенциальными покупателями. Как и следовало ожидать, многие производители ноутбуков не уделили должного внимания системе охлаждения, из-за чего привлекли к себе много негатива от владельцев мобильных устройств. Из-за массовых недовольств пользователей, производители вскоре отказались от Radeon HD 4870.

Прямой конкурент

Компания AMD затеяла бурную деятельность по созданию игрового решения после того, как на рынке появился продукт конкурента Geforce 9800 GT. Radeon HD 4870 должен был подвинуть лидера рынка в игровом сегменте. Но, как часто это бывает, технологи компании перестарались и превзошли по производительности графический ускоритель Nvidia. Многие эксперты в своих отзывах уверяют окружающих, что именно этот чип и является связывающим звеном между двумя поколениями игровых видеокарт.

А если вернуться к конкуренции, то можно смело сказать, что видеокарта Radeon HD 4870 ускорила появление новых производительных устройств на игровом рынке. Ведь графический ускоритель Nvidia GTX 260 и стал первым представителем нового поколения видеоадаптеров, который должен был превзойти по производительности всех конкурентов.

Внешний вид и качество

Пластиковый защитный корпус и турбовентилятор на графическом ускорителе Radeon HD 4870 (фото устройства можно увидеть в данной статье) свидетельствуют о том, что перед покупателем представитель игрового сегмента. видеокарты создана с использованием красного текстолита, а кожух радиатора и высокочастотный кулер имеют ярко-алый окрас под стать продукту компании AMD.

При детальном изучении размещения микросхем на графическом ускорителе, любому пользователю станет ясно, что производитель не будет продавать свои продукты в розницу, а предоставит эту возможность лидерам компьютерного рынка. Естественно, что в гонке по производительности победит тот бренд, который сможет обеспечить устройство с мощным тепловыделением достойной системой охлаждения.

В погоне за звёздами

Начинать по графическому ускорителю Radeon HD 4870 обзор лучше с самых производительных продуктов от компаний HIS и Sapphire, которые для создания игровых решений задействовали чип 4870 X2 с двумя ядрами. Многие владельцы в своих отзывах отмечают, что на момент анонса у этих видеокарт попросту не было конкурентов на рынке игровых компонентов для компьютера. Помимо высокой производительности, видеоадаптеры имеют и массу других достоинств:

  • уникальная комплектация, включающая в себя набор необходимых переходников и интерфейсных кабелей;
  • полностью видоизменённая система питания на печатной плате с добавлением нескольких фаз;
  • замещение электролитических конденсаторов на твердотельные ёмкости;
  • установлена система охлаждения собственного производства с эффективным отводом тепла как от графического ядра, так и от чипов памяти.

Вернувшись к комплектации продукта HIS, стоит отметить, что производитель снабдил свою видеокарту фирменным устройством, которое сочетает в себе отвёртку, уровень и фонарик. Также в коробке покупатель обнаружит купон на бесплатное скачивание любой лицензионной игры из серии Half-Life.

Доступный по цене продукт

Самым продаваемым видеоадаптером на чипе Radeon HD 4870, сравнение с которым предпочли проводить все энтузиасты мира, является продукт компании ASUS. Производителю удалось достигнуть золотой середины в критерии цена-производительность, заставив многих представителей начального игрового сегмента снизить стоимость своих продуктов, чтобы хоть как-то удержаться на рынке.

Главной особенностью видеокарты является увеличение разработчиком количества фаз для питания цепей печатной платы. Также технологами была разработана эффективная система охлаждения открытого типа. Сердечник и радиатор кулера выполнены из чистой меди и монтируются в устройстве только на графическое ядро. Чипы памяти (объём которых сократился вдвое и составил всего 512 Мб) обдуваются вентилятором поверхностно и не имеют собственных радиаторов для отвода тепла.

Производительность в играх и потенциал к разгону

Многие владельцы в своих отзывах отмечают, что у видеокарты Radeon HD 4870 1 Gb характеристики производительности напрямую зависят от работы графического ядра. Соответственно, для проведения разгона нужно побеспокоиться о наличии мощной системы охлаждения. С модулями памяти у всех продуктов с чипом HD 4870 существуют какие-то проблемы. Преодолеть барьер в 1000 МГц (4000 МГц эффективной частоты) ни один бренд так и не смог. Вывод напрашивается один - печатная плата имеет проблемы при работе с быстрой памятью. Достоинство тут одно - чипы памяти не нагреваются.

Покупатель может смело рассчитывать на производительность игрового адаптера с такими играми, как Crysis 4, World of Tanks и их аналогами, которые используют общую а не делают упор на потенциал графического ускорителя. Как показывает практика, видеокарту Radeon HD 4870 лучше устанавливать с малочастотным двуядерным или 4-ядерным процессором.

Проблемы с драйверами и их решение

После выхода на мировой рынок обновлённой системы Windows 10 у многих любителей игр появились проблемы с установкой драйверов. На официальном сайте производителя отсутствует программная поддержка для всех устройств на базе 4000 серии видеокарт. В очередной раз компания AMD, после обновления операционной системы, отказывается от поддержки своих продуктов (у конкурента Nvidia лояльность к владельцам старых устройств намного выше).

Чтобы правильно произвести по видеокарте Radeon HD 4870 подключение на программном уровне, нужно воспользоваться центром обновления Windows. Не нужно ожидать, что загрузится полный пакет утилит, его, как раз, нужно скачать с официального сайта производителя. Компания Microsoft предоставит лишь один драйвер, который обеспечит совместимость графического ускорителя с материнской платой при подключении. Такой подход производителя AMD к покупателям вызывает много негатива от владельцев всех устройств на базе Radeon.

И снова «Crysis», но уже при использовании DirectX 10. Как видим, только в низком разрешении Radeon HD 4870 может соперничать с конкурентом GeForce, а вот в 1600х1200 уже заметно уступает. Игра на максимальных настройках в DirectX 10 потребляет большой объём видеопамяти, и, похоже, GeForce GTX 260 выигрывает за счёт своих «дополнительных» мегабайтов.

Вывод

В данной статье мы познакомились с современным флагманом от AMD и сравнили его с младшей моделью на этом же графическом чипе и с конкурентом от NVIDIA. Хотя GeForce GTX 260 прямым конкурентом можно назвать с натяжкой, ведь цена этой видеокарты всё же немного выше. Изначально, когда новые модели начали появляться на рынке, различие в цене было ещё больше. Но ценовая политика AMD заставила NVIDIA снижать стоимость своих новинок. И не случайно, ведь во многих тестах Radeon HD 4870 лишь незначительно уступает GeForce GTX 260, а иногда и обгоняет. Но больший объём памяти и хороший разгонный потенциал помогают GeForce GTX 260 уверенно удерживать место лидера во многих приложениях. К дополнительным преимуществам Radeon HD 4870 можно отнести более низкое энергопотребление.

Что же касается соотношения между Radeon HD 4850 и Radeon HD 4870, то иногда мы наблюдаем значительный отрыв старшей модели от младшей. И если разница в частоте чипа у них не столь велика, то, без сомнения, более быстрая память помогает достичь таких показателей. С другой стороны, при разнице в производительности 20-30% младшая карта намного дешевле. Такая ситуация была в своё время и с Radeon HD 3850 и Radeon HD 3870, а потом постепенно разница в цене между этими картами уменьшилась до совсем незначительной суммы. Так что Radeon HD 4850, без сомнения, довольно удачная модель в своей ценовой категории.

Radeon HD 4870 также выигрывает у ближайшего конкурента за счёт цены. Хотя если на смену GeForce GTX 260 придёт новая, чуть более дешёвая и экономичная плата, то все минимальные преимущества Radeon отойдут на второй план. Но пока таких вариантов нет, и Radeon HD 4870 занимает именно свою ценовую нишу. А ответом на сверхбыстрые и горячие видеокарты NVIDIA по заоблачной цене станет Radeon HD 4870 X2 на базе двух RV770. И эта карта, вероятно, по праву займёт место лидера, ведь потенциал у RV770 есть, как мы уже убедились.

Всего пару недель тому назад в мире nVidia всё было тихо и спокойно. Крупнейший производитель видеокарт только что выпустил новые модели GeForce GTX 260 и 280 , которые, несмотря на задержку в шесть месяцев, дальше продвинули унифицированную архитектуру, введённую с GeForce 8, до самых пределов 65-нм техпроцесса с гигантским количеством транзисторов. Производительность по сравнению с предыдущим (теперь уже старым) поколением видеокарт не особо впечатляла (прирост 59% в среднем относительно 9800 GTX), но появление приложений CUDA стало интересным шагом вперёд, да и реального конкурента у nVidia не было. Между тем AMD, казалось, всё больше разочаровывалась в графическом подразделении, которое было не способно конкурировать на high-end сегменте рынка, как когда-то, а существующие high-end видеокарты быстро устаревали. Затем последовал громкий выпуск видеокарты Radeon HD 4850 , которая появилась в тестовых лабораториях раньше анонса, а розничная цена была заявлена на уровне $199.


Да, в лагере AMD случилось чудо. Производительность Radeon HD 4850 удивила всех, включая nVidia. Несмотря на поспешный выпуск видеокарты GeForce 9800 GTX+, которая не появится в розничных каналах раньше середины июля, nVidia всё равно не могла получить такое же великолепное соотношение цена/производительность, как у новинки Radeon, что мы уже демонстрировали в тестах Radeon HD 4850 . Обычно маркетинговые доводы, такие как оптимизация эффективности и выход годных кристаллов, всегда звучавшие неубедительно, получили новое значение, учитывая результаты тестов Radeon HD 4850. Новинка пробудила надежды на ещё более высокую производительность в будущем. Получив (наверное, даже к собственному удивлению) хорошую возможность увеличить число потоковых процессоров с 320 до 800, несмотря на 43% повышение числа транзисторов и прежний техпроцесс, AMD решила не оставаться "на дне", и к лучшему. Был объявлен GPU Radeon HD 4870, основанный на такой же архитектуре, но обеспечивающий более высокую производительность (понятно, что по большей цене), однако появлялся он в тестовых лабораториях весьма неспешно, да и не всё было понятно до последнего момента. По крайней мере, на бумаге эта видеокарта являлась прямым конкурентом новым high-end моделям nVidia, но по существенно меньшей цене. Но что мы получили на деле?

Долгое время nVidia была пионером по внедрению новейших технологий памяти. После использования памяти DDR для GeForce в 2000 году, компания из Санта-Клары оказалась первой, представившей память GDDR2 с видеокартой GeForce FX, затем GDDR3 с моделью GeForce 5700. Но затем лидерство перехватила ATI: GDDR4 впервые появилась вместе с моделью Radeon X1950 XT, а сегодня, два года спустя, ATI представила первую видеокарту с памятью GDDR5: Radeon HD 4870.

С повышением пропускной способности памяти всё понятно: есть два пути. Первый заключается в расширении шины памяти, а второй - в увеличении частоты работы. Первый способ имеет несколько препятствий. Более широкую шину сложно разводить на печатной плате, да и упаковка требует больше контактов. Все эти контакты необходимо подвести к чипу, которому необходимо большее число интерконнектов по периферии кристалла. Поэтому широкая шина требует, чтобы ядро было определённого размера - именно по этой причине долгое время GPU начального уровня были ограничены 128-битной шиной, в то время как их high-end варианты использовали 256- или 384-битную шину. Ещё один недостаток заключается в увеличении энергопотребления чипа.

Поэтому к подобному способу прибегали очень осмотрительно. На самом деле, долгое время для high-end GPU использовалась 128-битная шина, от Riva 128 до Matrox Parhelia, да и ATI Radeon 9700 четыре года назад тоже её использовал. Точно так же 256-битная шина не становилась шире до появления nVidia GeForce 8800 в конце 2006 года. Да, требования по пропускной способности памяти у GPU постоянно увеличиваются, несмотря на технологии экономии пропускной способности, которые оптимизируются с каждым поколением.

Второе решение заключается в ускорении работы памяти. Но это легче сказать, чем сделать, поскольку, как и в случае с любой микросхемой, существует ограничение по тактовой частоте, на которой могут работать чипы памяти. Чтобы обойти эти ограничения, производители прибегают к разным ухищрениям. Память DDR позволяет передавать данные по нарастанию и спаду тактового импульса, удваивая эффективную пропускную способность памяти для прежней частоты. Для этого память DDR использует так называемый двухбитовый prefetch - при каждом обращении к памяти вместо передачи одного бита из prefetch-буферов, память DDR передаёт два. Последующие разработки технологии DDR предусматривали передачу всё большего числа данных на прежней физической частоте памяти, увеличивая ширину prefetch. DDR2 использует 4-битовый prefetch, как и GDDR3. С GDDR4 появился 8-битовый prefetch.

GDDR5

GDDR5 использует 8-битовый prefetch, как и GDDR4, однако отличается несколькими инновациями. Впервые GDDR5 использует две тактовые частоты, CK и WCK, последняя в два раза больше первой. Команды передаются в режиме SDR (стандартная тактовая частота) на частоте CK; адресная информация передаётся в режиме DDR на частоте CK; а данные передаются в режиме DDR на частоте WCK. В случае Radeon HD 4870, который использует память GDDR5 на частоте 900 МГц, команды передаются на частоте 900 МГц SDR, адреса на 900 МГц DDR (эффективная частота 1 800 МГц), а данные - на 1 800 МГц DDR (эффективная частота 3 600 МГц).

Этот подход снижает проблемы, связанные с качеством сигнала во время передачи команд и адресов, обеспечивая очень высокие частоты передачи данных. К сожалению, более высокие частоты также означают более высокую вероятность ошибки. Поэтому, чтобы обеспечить надёжную передачу данных, GDDR5 использует механизм обнаружения ошибок, который применяется в сетях. Если контроллер памяти определит ошибку, то команда, с которой она появилась, будет выполнена повторно.

Итак, AMD и nVidia выбрали весьма разные пути для увеличения пропускной способности памяти для своих GPU, и эти выборы связаны с разным взглядом на графические процессоры. nVidia, приверженная принципу огромного монолитного кристалла, может себе позволить 512-битовую шину памяти, избегая проблем с поставкой чипов, которой неизбежно сопровождается внедрение передовой технологии памяти. Напротив, с появлением RV770 AMD концентрирует свои усилия на GPU со сниженным размером кристалла для high-end видеокарт. Как нам сообщили инженеры AMD, первую версию RV770 предполагалась оснастить не более 480 потоковыми процессорами (АЛУ), но GPU при этом ограничивал число интерконнектов для интерфейсов памяти.

Поэтому AMD смогла предложить GPU, с которым все уже знакомы, с 800 потоковыми процессорами, которые почти что "бесплатны" в отношении площади ядра. У предыдущего поколения GPU nVidia пришлось забыть о 384-битовой шине при переходе с G80 (80 нм) на G92 (65 нм). Поэтому есть все шансы, что такой же шаг произойдёт и с 512-битовой шиной. Однако на этот раз nVidia может опереться на GDDR5, чтобы компенсировать потерю пропускной способности.



СОДЕРЖАНИЕ
Похожие публикации