На пороге новых процессорных микроархитектур AMD: «Bulldozer» и «Bobcat»
18 августа 2010 года компания AMD провела колл-конференцию «Hot Chips», на которой представители поделилась новой информацией, касающейся микроархитектур нового поколения «Bulldozer» и «Bobcat». Микропроцессоры с новой микроархитектурой должны появится в следующем 2011 году, но уже сейчас компания AMD потихоньку «готовит публику» к новым высокопроизводительным и энергоэффективным микропроцессорам, отмечая их преимущества.
Так как на конференции компании AMD в большей степени оперировали маркетинговыми терминами, вроде, «быстрее», «лучше», «производительней», мы немного расширили этот материал информацией найденной в сети, чтобы более полно осветить особенности новой микроархитектуры «Bulldozer», появления которой особо преданные фанаты AMD ждут уже около двух лет.
В 2011 году должно будет происходить активное внедрение процессоров с двумя новыми микроархитектурами «Bulldozer» и «Bobcat», которые придут на смену современной микроархитектуре AMD K10. Новые микропроцессоры должны будут покрыть все основные сегменты современных вычислительных устройств. Производительная и хорошо масштабируемая архитектура «Bulldozer» должна будет занять сегмент серверных и высокопроизводительных игровых систем. Также эта платформа будет использована для построения производительных ноутбуков и неттопов. Процессоры с более энергоэффективной и гибкой архитектурой «Bobcat» должны будут успешно противостоять процессорам Intel Atom в сегменте нетбуков и офисных ПК.
Bulldozer
Микроархитектура нового поколения Bulldozer в первую очередь отличается от K8/K10 наличие в одном ядре сразу двух блоков ALU. Блок FPU хотя и остался один, но доступ к нему производится по двум отдельным 128-разрядным FMAC. Подобную архитектуру можно условно назвать как «два в одном», так как получается что одно ядро Bulldozer способно работать за два полноценных ядра, что фактически должно позволить увеличить производительность вдвое.
Таким образом, компания AMD хочет создать очень сильный противовес процессорам Intel и технологии Hyper-Threading , которая с помощью одного процессорного ядра позволяет параллельно обрабатывать два потока данных. В тоже время процессоры с архитектурой Bulldozer будут иметь возможность обрабатывать значительно больше системных ресурсов, и их обработка действительно будет выполняться параллельно, а не по очереди, как в случае с Hyper-Threading. Как и в случае с технологией Hyper-Threading аппаратная часть и операционная система должны будут «видеть» возможность двухпоточного выполнения команд каждым процессорным ядром Bulldozer.
Для простоты восприятия презентационного материала, компоненты архитектуры Bulldozer разделили на общие (на схеме обозначены красным цветом) и специальные (на схеме обозначены синим цветом). Общие компоненты должны помочь сократить расход энергии, уменьшить площадь кристалла и его стоимость. Наличие специализированных компонентов позволит увеличить производительность и масштабируемость процессора. Архитектура Bulldozer способна динамически переключаться между общими и специальными компонентами, что позволяет максимально увеличить производительность на Ватт потребленной энергии.
Также заметным изменением можно назвать увеличение числа конвейеров ALU с трех в архитектуре K10 до четырех в Bulldozer. Каждое интегрированное ядро будет иметь свою отдельную кэш-память первого уровня. Кэш-память второго уровня будет общей для всего ядра Bulldozer, а кэш-память третьего уровня будет общей для всего процессора. Также как и ранее, в процессорах, основанных на архитектуре Bulldozer, будет интегрирован контроллер памяти и контролер «северного моста».
Новые процессоры семейства «Zambezi» будут иметь четыре ядра Bulldozer, которые условно можно считать восьмиядерными процессорами.
Для серверного сегмента будут предложены еще более мощные варианты, которые будут насчитывать до восьми ядер Bulldozer. Как и современные шестиядерные процессоры AMD Phenom II, модели серверного сегмента будут поддерживать технологию Turbo Core, которая призвана автоматически увеличивать частоту некоторых процессорных ядер, чтобы более эффективно исполнять не оптимизированный под многопоточность код.
Также в новых ядрах увеличилось число выполняемых инструкций, расширяющих возможности процессора x86. Основной список инструкций ядер Bulldozer будет выглядеть следующим образом:
- SSE
- SSE2
- SSE3
- SSE4a
- SSSE3
- SSE4.1
- SSE4.2
- AES
- PCLMUL
- AVX
- XOP
- FMA4
- LWP (Lightweight Profiling)
Отметим появление в перечне инструкции AES (Advanced Encryption Standard) предназначенной для аппаратной шифрования, а также появление инструкций SSE4.1 и SSE4.2, которые ранее были лишь в процессорах Intel серии Penryn. Кроме того были добавлены инструкции AVX, XOP и модуль FMA4. А вот поддержки устаревших инструкций 3DNow! и MMX новая архитектура Bulldozer была лишена.
Разработчики новых процессоров не обошли вниманием и энергопотребление ядер. Помимо того что новая архитектура будет построена по более тонкому 32 нм техпроцессу, был предпринят ряд мер по уменьшению энергопотребления во время «сна» системы.
В частности на схеме приведен алгоритм по вхождению процессорного ядра в «сон» и выход из него. Вхождение в состояние CC6 сопровождается:
- стиранием данных в кэш-памяти уровней L1 и L2,
- записью данных на внешнюю оперативную память,
- уменьшением частоты ядра,
- уменьшением питания PLL,
- отключением выхода ядра,
- ограничением питание ядра.
Активация ядра процессора осуществляется в обратной последовательности с перезапуском микрокодов и инициализацией кэш-памяти уровней L1 и L2.
Bobcat
Основными чертами ядра Bobcat являются очень малый размер, высокая эффективность и очень низкое энергопотребление. Производитель заявляет, что одно ядро Bobcat способно потреблять менее одного ватта энергии. По сути это первый процессор AMD с архитектурой специально разработанной для экономичных платформ.
Архитектура Bobcat вскоре будет использоваться в процессорах «Ontario» для первой гибридной платформы Fusion. В будущем можно будет встретить процессоры с четырьмя ядрами Bobcat. Новые решения, несмотря на свой низкий уровень энергопотребления, должны будут обладать «превосходной» производительностью. Для новых процессоров на ядре Bobcat была сформулировано достаточно громкое определение: «приблизительно 90% современной массовой производительности на вдвое меньшей площади кремния». Хотя, выражение получилось размытым, но достаточно многообещающим. Расшифровывая маркетинговую фразу, выяснилось, что за эталон современной массовой производительности компания AMD приняла процессор Athlon II X2 250u. Оказывается, что по итогам предварительных тестов процессор Ontario имеет производительность целочисленных операций равную 3,047 GIPS, а производительность в операциях с плавающей запятой 1,351 GFLOPS. Эти показатели как раз и составляют приблизительно 90% от показателей процессора Athlon II X2 250u, работающего на частоте 1,6 ГГц. В тоже время производительность «топового» четырехъядерного процессора AMD Phenom II X4 965 BE на частоте 3,4 ГГц выше показателей процессора Ontario всего в 2,42 раза. В последнем соотношении просматривается явное несоответствие, учитывая вдвое большее количество процессорных ядер и вдвое большую частоту у процессора AMD Phenom II X4 965 BE.
Источник: www.bit-tech.net
Плюсом новой архитектуры Bobcat является возможность произвольного выполнения команд. Этот факт вместе с низким энергопотреблением должен повысить шансы «на победу» в поединке с процессорами серии Intel Atom, которые поддерживают технологию многопоточности Hyper-Threading.
Также из ключевых особенностей ядра Bobcat можно выделить достаточно большой набор инструкций, в число которых вошли SSE1, SSE2, SSE3 и SSSE3 ISA. Однако размер кэш-памяти первого уровня ядра Bobcat должен составлять всего 32 кБ.
Для уменьшения энергопотребления в простое ядро Bobcat будет поддерживать уменьшение частоты и напряжение питания.
Напоследок мы хотим вам предложить для просмотра презентационный ролик компании AMD об архитектурах «Bulldozer» и «Bobcat» на английском языке.
Автор: Дмитрий Масюк
Статья переопубликована с
www.EasyCOM.com.ua