Появление нового семейства процессоров — всегда событие в ИT-отрасли. И каждое из них вызывает определенные чувства. Например, познакомившись с Pentium 4, я был немало разочарован — по производительности он сильно уступал предшественнику. Core 2 меня буквально поразил: до того, как первый экземпляр попал мне в руки, я был уверен, что AMD выжала из архитектуры i86 все. Оказалось — нет. Но больше всего удивило то обстоятельство, что при столь высокой производительности процессор остается практически холодным. А вот сейчас появление Intel Core i7 вызывает стойкое впечатление дежавю, точнее даже déjà vécu (déjà vécu в отличие от déjà vu имеет четкую локализацию во времени и пространстве): почти все появившиеся в данном семействе «новинки» уже в то или иное время применялись в отрасли. Причем в большинстве своем компанией AMD.
Так чем же Core i7 отличается от своего предшественника Core 2? Если последний (в четырехъядерном варианте) представлял собой механическое объединение двух двухъядерных ЦПУ, то новый процессор — по-настоящему четырехъядерный: четыре симметричных ядра на общем кристалле. Это мы уже видели у AMD. В процессоре появилась кэш-память третьего уровня. Конечно, раньше она уже применялась как в серверных процессорах, так и самой Intel в одном из вариантов Extreme Edition, но общий L3 при отдельных L1 и L2 для каждого из ядер — тоже повторение архитектуры AMD Phenom. Правда, если у AMD кэш-память эксклюзивная, то у Intel — инклюзивная, т.е. более низкий уровень кэш-памяти содержит все данные более высокого уровня. С этой архитектурной особенностью связано и различное соотношение объемов кэш-памяти у разных производителей: у AMD — по 64К+64К для команд и данных первого уровня, 512К второго уровня и 2М — третьего уровня, у Intel — по 32К+32К первого уровня, 256К — второго и 8М — третьего.
Теперь у процессора Intel наконец появился встроенный контроллер памяти. AMD такое решение применяет давно — еще с первых моделей Athlon 64. Плюс такого решения — более высокая скорость обмена с памятью, особенно при произвольном доступе. Минус — необходимость выпуска нового процессора для обеспечения работы с каждым новым типом памяти. До сих пор Intel обходилась лишь заменой гораздо более простого НМС. Новый процессор Intel поддерживает единственный тип памяти — DDR3. Другими словами, на дешевую систему, собранную на основе нового процессора, надеяться не стоит. Следует отметить, что НМС Intel X58, предназначенный для работы с новым процессором, хотя и лишился самой сложной своей части — контроллера памяти, но при этом почему-то не стал дешевле. А даже совсем наоборот.
Еще одна «новинка» — возрождение технологии HyperThreading, т.е. включение в одно ядро двух диспетчеров, позволяющих использовать вычислительные блоки ядра одновременно из двух потоков. Естественно, в каждый момент времени каждый из исполнительных блоков используется лишь в одном потоке, но время простоя исполнительных блоков при этом сокращается, а процент загрузки — увеличивается. Правда, применение этой технологии может приводить как к увеличению, так и к снижению производительности. Причем если в случае одноядерного процессора максимальное снижение было совершенно незначительным, то в случае многоядерных это снижение может достигать величин вполне ощутимых. Но об этом позже, при описании результатов конкретных тестов.
Изобретение NVIDIA — двухканальный доступ к оперативной памяти — в свое время было революционным шагом, в частности, из-за него процессор AMD устарел еще до того, как был представлен. Теперь же идея трехканального доступа воспринимается как шутка. Но ничего подобного — Intel действительно реализовала трехканальный доступ к памяти в своем новом процессоре. Теперь модули памяти следует устанавливать либо по три, либо по шесть. Правда, поддерживаются и другие конфигурации, но с некоторым ущербом в производительности.
Итак, изменений по сравнению с предшествующей моделью много, хотя подавляющее большинство из них уже трудно назвать инновациями. Но ведь эту же мысль можно сформулировать и иначе: изделие содержит лишь проверенные временем идеи и инженерные решения. Можно вспомнить, как в свое время выпуск IBM PC совершил революцию в мире персональных компьютеров, а ведь собран он был в основном из стандартных узлов, не первый год выпускаемых промышленностью.
Помимо глубоких внутренних изменений новая процессорная архитектура обладает и рядом ярко выраженных внешних проявлений. Количество контактов (так и тянет сказать «ножек», но последних у процессоров Intel больше нет) опять было увеличено и составляет теперь 1366штук, разнесенных на два Г-образных поля, подпружиненные контакты гнезд в которых имеют различную пространственную ориентацию. Сам корпус стал больше (кто бы сомневался — при таком-то числе контактов!) и приобрел прямоугольную форму вместо квадратной. Изменилось и расстояние между отверстиями крепления теплоотвода. Для тех, кто выбирает «боксовый» процессор, понятно, разница невелика, а вот у любителей экстремального разгона, уже приобретших дорогостоящую систему жидкостного охлаждения, очередной апгрейд может вызвать ряд проблем.
Если первые Core 2 поражали прежде всего низким энергопотреблением (да и в рекламной политике Intel означенная тема проходила красной нитью), то сейчас об этом вспоминать как-то не принято, — максимум потребляемой мощности опять достигает 130 Вт.
Для сравнения были использованы результаты отчасти проведенных ранее, а отчасти новых тестов для систем на базе Intel Core 2 Extreme X9770 3,2 ГГц, Intel Core 2 Duo E6700 2,66 ГГц и AMD Phenom 9850 2,5 ГГц. Последний, правда, выделяется явно более низкой тактовой частотой (и соответственно другим ценовым диапазоном), но более мощного процессора AMD в нашей тестовой лаборатории пока не было, а совсем не поместить в обзор ни одного процессора AMD мы не могли. В «альтернативных» системах Intel была использована оперативная память DDR3 SDRAM 1066 МГц объемом 2048 Мбайт, а AMD — DDR2 SDRAM 800 МГц объемом 1024 Mбайт и различные системные платы.
В тестировании был использован наш стандартный набор тестовых программ, работающий под Windows XP. Правда, нам так и не удалось запустить SysMark 2004 на системах, не имеющих IDE-контроллера (а именно таковы современные системные платы Intel), поэтому частично восполнить пробел мы решили за счет PCMark 2005.
Пользуясь штампом, можно отметить, что «новый процессор Intel продемонстрировал невиданную ранее производительность», обогнав предшественников почти по всем параметрам (опять déjà vécu?). А может, и по всем — сказать трудно: производительность в офисных и интернет-приложениях вычислялась по разным методикам для двух «экстремальных» процессоров Intel, поэтому незначительный проигрыш нового процессора в интернет-приложениях может быть связан с методической погрешностью.
Неожиданностью стал существенный прирост производительности в тестах 3DMark, результаты которых вроде бы должны зависеть в основном от мощности видеосистемы. При этом разница между новым процессором и четырехъядерным же Core 2 Extreme X9770, работающим на той же тактовой частоте, оказалась больше, чем между 3,2-ГГц четырехъядерником и 2,66-ГГц двухъядерником, при том что оба последних принадлежат к предыдущему поколению. Объяснение, по-видимому, может быть только одно: реальная производительность в этой программе упирается не в мощность ядра, а в скорость обмена с памятью, которая существенно возросла за счет встроенного контроллера и трехканального режима организации памяти. Во многих реальных игровых приложениях, включая игры на OpenGL, наблюдается такая же ситуация.
Интересно, что профессиональные приложения, использующие OpenGL, выполнялись на Intel Core i7-965 и Intel Core 2 X9770 с переменным успехом: в одних тестах победителем оказался первый, в других — второй.
При видеокомпрессии новый процессор также существенно опережает «экстремального» предшественника, но разница здесь меньше, чем на примере 3DMark (опять же при относительном сравнении пар 965/9770 и 9770/6700).
Многие синтетические тесты, определяющие производительность процессорного ядра (т.е. слабочувствительные к объему и скорости оперативной и кэш-памяти), проведенные для 965 и 9770 моделей Intel, показывают существенно различающиеся результаты, причем различие может быть как в одну, так и в другую сторону. В целом они позволяют сделать вывод, что ядра нового процессора были существенным образом переработаны, но средняя производительность ядра от этого изменилась незначительно, а заметный реальный ее прирост достигается в основном за счет радикально усовершенствованной системы работы с памятью.
В то же время возвращение к идее HyperThreading имеет и ряд спорных моментов. В процессе проведения синтетических многопоточных тестов выяснилось, что для хорошо распараллеливающихся задач, требующих высокой производительности ядра, эта технология дает во многих случаях весьма ощутимый эффект. Причем если для Pentium 4 прирост производительности по нашим измерениям составлял около 25%, то у Core i7 он может достигать в тех же условиях 40%. Но это только в том случае, когда количество потоков существенно больше числа процессорных ядер. Если же потоков меньше, чем ядер, либо столько же, процессор с HyperThreading ведет себя гораздо хуже. Дело в том, что ОС, не зная, какое из ядер является реальным, а какое виртуальным, распределяет процессы по ядрам так, что какое-то из физических ядер оказывается временами незадействованным, в то время как на другое приходится сразу два потока. Для демонстрации этого эффекта мы специально провели измерения в режиме как с включенным, так и с отключенным HyperThreading. В частности, при четырех потоках суммарная производительность процессора (по сравнению с одним потоком) оказывалась равной 382% при отключенном HyperThreading и лишь 343% при включенном. Зато при восьми потоках цифры составили уже 392% и 555% соответственно. Если же в хорошо распараллеливающейся задаче интенсивно использовался обмен данными между потоками, то эффект оказывался противоположным — в большинстве случаев применение HyperThreading приводило к снижению производительности, которое, однако, не превышало 20%.
Итак, корпорацией Intel представлена новая архитектура. Собственно, «новизна» здесь несколько условна, так как среди технических решений особенно революционных нет. Но в то же время использование апробированных и оправдавших себя подходов позволило существенно повысить производительность процессора. И компании AMD, не сумевшей догнать своими флагманскими моделями даже предыдущее семейство процессоров Intel, сейчас в секторе высокопроизводительных решений придется совсем туго. Однако перенесение контроллера памяти внутрь центрального процессора потребовало перехода к другому процессорному гнезду, а также исключило возможность использования памяти типа DDR2. Другими словами, изделия Intel сегодня разделены на два класса: дорогие LGA-1366 и не имеющие будущего LGA-775. Все это делает платформу AMD довольно привлекательной на ближайшую перспективу в области решений среднего и нижнего ценового уровня с точки зрения как последующего апгрейда, так и ремонта.
Редакция благодарит компанию Intel за предоставленное для проведения тестирования оборудование.
тестовый стенд
Основа тестового стенда в составе центрального процессора, системной платы, трех модулей памяти и объемистого теплоотвода поступила к нам практически в сборе. Вполную же конфигурацию тестового стенда входило следующее: центральный процессор — Intel Core i7-965 Extreme Edition 3.2 ГГц; оперативная память — 3072 Mбайт DDR3 1066 MГц (3 модуля PC3-8500U-7 по 1024 Mбайт); cистемная плата — Intel DX58SO; видеосистема — MSI RX3870 (ATI Radeon HD 3870) 512 Mбайт DDR4; жесткий диск — Western Digital WD2000JD-00HBB0; 200 Гбайт, SATA 150, 7200 об/мин, 8 Mбайт; привод DVD-ROM — Sony NEC DDU1675S (SerialATA); блок питания Hiper Type M 630W.
Результаты тестов 3DMark, баллы
Скорость обмена при последовательном доступе к ОЗУ, Мбайт/с
Производительность в синтетических тестах
Время выполнения синтетических тестов, мс
Время выполнения синтетических тестов, мс