В сентябре прошлого года компания nVidia обнародовала информацию о своей новой графической архитектуре под кодовым наименованием Fermi. Основное внимание тогда было уделено вычислительным возможностям графического процессора. И вот уже в наступившем году в ходе выставки CES в компании решили раскрыть особенности нового чипа в сравнении с традиционными графическими устройствами. Таким образом, общие черты процессора GF100 (пока он фигурирует под названием Graphics Fermi 100) начинают вырисовываться, но некоторые важные детали так и остались неосвещенными.
Архитектура GF100 заметно отличается от архитектуры современных процессоров nVidia. Естественно, поддерживаются все возможности DirectX 11. Чип разделен на четыре кластера графической обработки (Graphic Processing Cluster, GPC), каждый из них оснащен четырьмя потоковыми мультипроцессорами (Streaming Multiprocessor, SM). Каждый из 16 потоковых мультипроцессоров имеет собственные геометрические настройки и устройство, которое в nVidia называют полиморфной машиной (Polymorph Engine). Оно осуществляет управление выборкой вершин, тесселяцией, преобразованием в экранные координаты, параметрами настройки и выводом геометрических потоков. Потоковый мультипроцессор объединяет 32 графических ядра или процессора CUDA. Внутри кластера четыре потоковых мультипроцессора делят между собой единый блок растеризации. Это самое серьезное организационное изменение в процессоре nVidia -- графические чипы, выпускавшиеся компанией ранее, имели всего один геометрический механизм на весь процессор. Теперь же к одному такому блоку может обращаться группа из 32 графических ядер. Ядра потокового мультипроцессора имеют 64 Кбайт кэш-памяти первого уровня.
Все ядра осуществляют взаимодействие друг с другом через 48 блоков растровых операций, которые подключены к кэш-памяти второго уровня объемом 768 Кбайт. Кэш-память второго уровня нового графического чипа имеет не только больший по сравнению с моделью GT200 объем (ранее он составлял 256 Кбайт), но и ряд дополнительных возможностей, включая полный доступ на чтение и запись. Чип использует большой пул кэш-памяти второго уровня для организации совместного обращения 16 потоковых мультипроцессоров к общим данным. Таким образом, конструкторы отказались от широкой шины и архитектуры с многочисленными перекрестными соединениями. Объем кэш-памяти и количество блоков растровых операций непосредственно связаны с пропускной способностью шины основной памяти. Чип оснащен интерфейсом 384-разрядной памяти GDDR5. На каждые 64 разряда интерфейса памяти приходится 8 блоков растровых операций и 128 Кбайт кэш-памяти. Таким образом, версия графического процессора, оснащенного интерфейсом 256-разрядной памяти, будет иметь 32 блока растровых операций и 512 Кбайт кэш-памяти второго уровня.
Итак, на что же способны платы, построенные на основе процессора GF100, в компьютерных играх? К сожалению, пока об этом ничего не известно. В ряде предварительных тестов плата nVidia по производительности в два раза превосходила Radeon HD 5870 (самую быструю однопроцессорную графическую плату ATI с поддержкой интерфейса DirectX 11). Правда, эти тесты были ориентированы на отрисовку сложных геометрических фигур. В реальных игровых ситуациях производительность в зависимости от конкретной игры и ее установок оказывается на 20-50% выше. Разработчики nVidia обещают существенное увеличение производительности в режимах антиалиасинга с множителем 8x и гораздо менее весомое повышение быстродействия в режимах мультисэмплинга 4x MSAA (здесь скорость выполнения операции примерно соответствует той, которую демонстрируют новейшие графические процессоры ATI). Новым показателем качества должна стать работа в режиме антиалиасинга с множителем x32. Ожидается, что скорость выполнения операций тут окажется вполне приемлемой, но для того, чтобы окончательно утверждать это, нужно дождаться результатов тестирования.
Конечно, для того чтобы завоевать умы и сердца любителей игр, одного лишь опережения новых продуктов ATI по производительности недостаточно. Платы, построенные на основе процессора GF100, должны доказать свою эффективность. Большинство потребителей предпочитают покупать графические платы по цене 200 долл. и меньше, поэтому, если процессор не удастся модифицировать для построения высокопроизводительных плат среднего ценового диапазона, абсолютное лидерство платы стоимостью 400-500 долл. представляет исключительно научный интерес. По нашим оценкам, чип GF100 окажется на 60-70% крупнее процессора Cypress, установленного в плате Radeon HD 5870, а значит -- дороже в производстве. Интерфейс для подключения 384-разрядной памяти тоже способствует существенному повышению стоимости плат. При прочих равных условиях подразделение ATI выпускает модель 5870 уже на протяжении полугода, что дает ему возможность более гибко варьировать цены. nVidia придется продавать платы на основе GF100 по более высоким ценам (по крайней мере, на начальном этапе), тогда как ATI может снижать цены на Radeon HD 5870, повышая свою конкурентоспособность и сохраняя при этом рентабельность.
Неизвестно пока, на какой тактовой частоте будут работать первые графические платы с GF100, сколько различных продуктов производители создадут на основе этого процессора и сколько электроэнергии они будут потреблять. Кроме того, на свой "кусок пирога" претендует и компания ATI, чей чип Cypress лучше работает в некоторых режимах и вполне способен успешно конкурировать с первыми платами GF100. Неизвестно, как сложится ситуация на рынке. Пока можно лишь констатировать, что nVidia только сейчас представила свой флагманский графический процессор с поддержкой DirectX 11, в то время как у ATI графические платы с поддержкой DirectX 11 продаются уже во всем ценовом диапазоне -- начиная от 100 долл. и выше. Кроме того, инженерами ATI разработаны графические процессоры для ноутбуков. Конечно, очень приятно услышать от nVidia новости на эту тему, а процессор GF100 представляет собой весьма интересный чип, однако компании придется приложить немало усилий для того, чтобы добиться успеха на важнейшем для нее рынке графических устройств.