Quad-Core Opteron: архитектура и планы выпуска
Месяц назад, в середине августа месяца, читатели имели возможность прочесть в наших новостях об анонсе AMD нового поколения серверных процессоров Opteron и предварительных планах компании по выпуску первых 4-ядерных (Quad-Core) чипов Opteron. В целом первые более-менее достоверные подробности о Quad-Core архитектуре процессоров Opteron начали появляться значительно раньше – например, ещё в дни июньской выставки Computex 2006 проскакивали первые сообщения о дебюте 4-ядерных Opteron со степпингом F ориентировочно в первом квартале 2007 года – как с соблюдением норм 65 нм техпроцесса, так и, возможно, 90 нм. Однако даже после августовского официального анонса полной ясности и подробностей об архитектурных особенностях чипов Quad-Core Opteron не было, информации очень не хватало.
Вот почему московского мероприятия AMD, посвящённого последним технологическим разработкам и запланированного компанией на 5 сентября, журналисты дожидались с повышенным вниманием. В этот раз ожидалось, что вместе с Пьером Брансвиком (Pierre Brunswick), вице-президентом по продажам и маркетингу в России, СНГ, Восточной Европе и Турции, в пресс-конференции примет участие Джузеппе Амато (Guiseppe Amato), технический директор отдела продаж и маркетинга в Европе, на Ближнем востоке и в Африке. Технический специалист – это всегда великая радость в наших краях, и в этот раз наши ожидания не были обмануты. Более того, в ходе презентации г-н Амато рассказал очень много интересных и эксклюзивных подробностей о новых чипах и инициативах AMD, а также открыто ответил на ряд непростых вопросов, за что ему отдельно большое спасибо. В целом мероприятие прошло на достойном техническом уровне, если не считать плотных маркетинговых вкраплений почти в каждом слайде на предмет критики основного конкурента. Вот почему у нас есть сегодня возможность рассказать вам много нового и интересного, а уж насколько удастся избавить текст от "рекламных моментов" – судить вам.
Во время презентации г-на Амато были затронуты следующие ключевые темы:
- Процессоры AMD Opteron следующего поколения на базе новой платформы с учётом возможности дальнейшей миграции на четырехъядерную архитектуру;
- Сравнение платформ AMD Opteron и Intel Woodcrest с точки зрения рациональности тех или иных методик тестирования различных параметров, характеризующих реальную производительность;
- Преимущества технологии AMD Virtualization;
- Обеспечение защиты инвестиций конечных пользователей.
Примерно в такой последовательности тем и составлен этот отчёт.
Архитектурные особенности нового поколения процессоров AMD Opteron
Итак, начнём с самого интересного, со строения 4-ядерных процессоров AMD, которые предположительно будут носить рабочие названия Santa Rosa и Deerhound. Сразу же стоит отметить, что на прямой вопрос: будут ли поставляться 4-ядерные процессоры AMD Opteron, выполненные с применением норм 90 нм техпроцесса, г-н Амато чётко ответил, что конечные потребители получат только 65 нм чипы. Таким образом, ранние прогнозы о возможном выпуске серверных 4-ядерных процессоров AMD с 90 мн нормами можно оставить позади – по всей видимости, такие чипы будут использоваться на ранних этапах для тестирования.
Основной лейтмотив части доклада, посвящённой архитектурным особенностям грядущих Quad-Core процессоров AMD Opteron сводился к возможности обратной совместимости с нынешним поколением Socket F чипов, плюс, нововведениям, улучшающим ключевой показатель – производительность на ватт (Performance-per-Watt).
Согласно представленной информации, новые 4-ядерные процессоры, несмотря на увеличение физических размеров кристалла и значительную реорганизацию внутренней архитектуры, останутся в прежнем стандартном для топовых 2-ядерных процессоров Opteron диапазоне термодизайна, то есть, TDP новых чипов обещан на уровне порядка 95 Вт. Наряду с этим, новые процессоры будут поддерживать технологию AMD-V, то есть, AMD Virtualization.
Ключевыми технологиями, реализованными в новых 4-ядерных процессоров AMD Opteron, являются:
- Native Quad-Core Design - "нативная" четырёхъядерная архитектура, четыре ядра непосредственно на единой подложке
- Enhanced AMD PowerNow! - расширенная и улучшенная технология оптимизации энергопотребления AMD PowerNow!, позволяющая динамически снижать потребление энергии ядрами – до 75% в ждущем режиме
- Direct Connect Architecture – архитектура, позволяющая эффективно снять часть традиционных "узких мест" x86 архитектуры: прямое подключение I/O шин HyperTransport (до
8 Гб/с), обеспечивающее оперативное взаимодействие между процессорами; интегрированный контроллер памяти, эффективно снижающий латентность и положительно влияющий на производительность; непосредственное подключение памяти DDR2
- Advanced Process Technology – улучшенный 65 нм техпроцесс производства с применением технологии SOI (Silicon-on-Insulator), малые токи утечек транзисторов процессора позволяют улучшить производительность на ватт и снизить тепловыделение
32-bit instruction fetch
- Улучшенный механизм предсказание ветвлений
- Исполнение команд с изменением последовательности (Out-of-order)
- Двухпотоковое управление 128-битными инструкциями SSE
- До четырёх операций с плавающей запятой двойной точности за такт
- Расширения для обработки групп битов (LZCNT/POPCNT)
- Обработка расширений SSE (EXTRQ/INSERTQ, MOVNTSD/MOVNTSS)
В качестве дополнительного преимущества новых 4-ядерных процессоров также подчёркивается сбалансированная эффективная структура кэша: 64 Кб кэша данных и 64 Кб кэша инструкций L1, по 512 Кб кэша L2 на каждое ядро, и, наконец, общий распределённый кэш L3 – 2 Мб (Santa Rosa?) и более (4 Мб – Deerhound?) на процессор.
Один из самых интересных и наглядных слайдов презентации – конечно же планы компании по выпуску следующих поколений продукции, при этом на нём указаны характеристики не только процессоров, но также чипсетов и платформ в целом.
Как видно, новые Quad-Core Opteron с кэшем L3, появление которых запланировано на следующий год, точнее – на второй квартал 2007, будут сопровождаться обвязкой с поддержкой TCP Offload, контроллерами Gigabit Ethernet, Serial SCSI, Serial ATA II с поддержкой RAID. Следующее поколение чипов, появление которых запланировано на 2008 год, будет поддерживать технологию Direct Connect Architecture 2.0 (HT 3.0?), будет обладать большим кэшем и рядом других новшество, а в плане обновления "обвязки" следует ожидать реализации шины PCI Express 2, 10 Gigabit Ethernet контроллеров и т.п.
В плане следующей волны инноваций, призванных в перспективе облегчить жизнь потребителю и улучшить производительность, г-н Амато остановился на характеристиках технологий Torrenza, Trinity и Raiden. Например, в основу технологии Torrenza, призванной ускорить обработку данных, положена технология Direct Connect Computing, а её реализация будет осуществляться за счёт слота HTX и специализированных аппаратных акселераторов.
Улучшение безопасности системы, реализацию возможностей виртуализации и улучшение управляемости будет отвечать технология Trinity, реализованная на аппаратном уровне в чипе.
Наконец, снижение общей стоимости владения (TCO) и расширение возможностей клиентского оборудования, в том числе, за счёт реализации возможностей виртуализации - прерогатива технологии Raiden.
В качестве дополнительного плюса платформы AMD Opteron докладчик также привёл тот факт, что "жизнь" нынешнему процессорному разъёму под серверные чипы – 1207-контактному Socket F, "обещана" до 2009 года, то есть, скорее всего речь идёт о той поре, когда AMD надумает реализовать в чипах Opteron интегрированный контроллер памяти с поддержкой FB-DIMM.
Чьи процессоры быстрее?
Основная идея части доклада, посвящённой вопросам правильного тестирования, звучала примерно так: для того чтобы получить адекватные результаты тестирования для сравнения систем, проведения одного теста недостаточно, обязательно следует проводить комплекс тестов. Например, синтетический тест можно использовать для оценки нагрузки на память, оценки работы системы I/O, тем не менее, такие бенчмарки не в состоянии эмулировать собой реальные приложения. Именно поэтому в AMD считают, что для измерения реальной производительности необходимо в большей степени опираться на использование реальных приложений. Кроме того, подчеркнул г-н Амато, в тестовых пакетах не редкость такое явление, как оптимизация, "искусственная акселерация" под ту или иную архитектуру.
Далее присутствующим был показан ряд тестов – сначала тех, в которых лидируют серверные системы на базе архитектуры Intel, затем на базе архитектуры AMD, при этом г-н Амато неизменно подчёркивал, что эти тестовые приложения составлены на базе реальных приложений.
Вот в этом месте лично я спорить ни с кем не буду, но знаете ли, раз уж в процессе презентации берётся курс на прямое противопоставление своих наработок с решениями конкурента, вполне может сложиться впечатление, что в этом случае также для убедительной демонстрации превосходства могли быть отобраны специфические пакеты. Нет, я ни в коем случае не намекаю на оптимизацию, просто по статистике всегда найдутся пакеты, где та или иная архитектура ведёт себя увереннее. Желающих вкусить подробности отправляют по следующей ссылке - Third Quarter 2006 SPEC JBB2005 Results, а я, пожалуй, дабы соблюсти этические нормы, ограничусь простой демонстрацией некоторых наиболее красноречивых слайдов презентации по этой теме. Плюс, ещё несколько ссылок по теме вы найдёте в конце этой статьи.
Также было отмечено, что отражая пиковую производительность серверных систем, современные бенчмарки не отражают главного – популярной нынче тенденции Performance/watt, то есть, производительности на единицу затрачиваемой энергии. То есть, бенчмарки – это не единственный индикатор производительности, более того, тесты, включающие в себя менее четырёх тредов, не являются подходящим мерилом для 2-процессорных систем. Тем не менее, после лозунга "не ослепляйте себя результатами SPECint и SPECjbb", было отмечено, что сравнение процессоров AMD с равными по тактовой частоте чипами серии Xeon Woodcrest даёт вполне конкурентные результаты. Выводы г-на Амато таковы: подход TPI (True Performance Initiative) хорош, отдельные выборочные тесты непрактичны.
С точки зрения Performance/Watt
Для сравнения производительности с учётом затрачиваемой мощности г-н Амато привёл ряд слайдов, где противопоставлялись системы на базе процессоров Intel Woodcrest и системы на базе AMD Opteron серии 2000. Именно системы, а не отдельно взятые процессоры, со всей соответствующей чипсетной обвязкой. Здесь кстати нам напомнили о том, что элементы северного моста чипсета являются неотъемлемой частью архитектуры процессоров Opteron, за счёт чего суммарный TDP серверной системы на чипах AMD выглядит предпочтительнее.
Более того, было обещано, что с реализацией нового поколения архитектуры процессоров AMD это преимущество лишь усилится – если, конечно, не обращать внимания на превосходство систем на Intel Xeon в бенчмарках, с огоньком названных Intel Sponsored Results. Склоняю голову перед высоким слогом маркетологов AMD.
Итого, в виде подведения итогов был сделан вывод о системах на базе AMD Opteron как оптимально снижающих расходы на обслуживание и общую стоимость владения (TCO), благодаря стратегии последовательного использования общего ПО, стабильному переходу на новые поколения чипов, энергоэффективной архитектуре и использованию памяти DDR-2, и так далее. Кстати, ниже приведённый слайд, где размечен роадмэп начала поддержки новых типов памяти – в частности, для AMD поддержка FD-DIMM намечена на 2008 год, ясно показывает, что компании Intel и впредь предлагается роль этакого "локомотива по расчистке путей".
Технология виртуализации AMD-V
Технология виртуализации, предлагаемая AMD, также полностью излагалась на базе противопоставления виртуализационной разработки компании Intel. Нельзя сказать, что это помогло лучше усвоить версию технологии AMD или, скажем, тем, кто ещё не совсем разобрался в разработках Intel, действительно оценить преимущества той или иной технологий.
Преимуществами AMD-V были названы (с параллельной критикой архитектуры Intel) такие моменты как безопасность, обеспечиваемая за счёт аппаратной реализации Device Exclusion Vector (DEV), производительность, обеспечиваемая благодаря архитектуре Direct Connect, меченых буферов быстрого преобразования адреса (Tagged TLB), снижающих нагрузку на канал памяти в процессе загрузки новой виртуальной машины, а также специфических вложенных таблиц Nested Page Tables, ввод которых в 2007 году должен послужить быстрому переключению между виртуальными машинами.
Такие дела. Прошу только понять меня правильно, ни в коей мере не являясь противником красивых слайдов, на которых система одной компании в пух и прах разносит систему конкурента, всё же я несколько был шокирован тем, что об архитектуре и технологиях Intel мне удалось услышать за этот вечер ничуть не меньше, чем о разработках AMD. Даже журналистов со временем перестаёт шокировать подача материалов, основанная на противопоставлении продукции соперников, но право слово, всё это было несколько неожиданно… энергично.
Итак, компания AMD в целом закончила разработку Quad-Core процессоров Opteron. Совсем скоро – уже во втором квартале 2007 года, первые 4-ядерные чипы AMD, произведённые с соблюдением норм 65 нм техпроцесса на дрезденской компании Fab36, начнут сходить с конвейера. Новые 4-ядерные процессоры будут электрически совместимы с представленным в августе поколением 2-ядерных 1207-контактных Socket F чипов AMD Opteron (с 4-значной маркировкой), благодаря чему будут обеспечены минимальные затраты и защита инвестиций.
Приложение
Ссылки по теме: