В процессорах архитектуры K8, а также Intel NetBurst (Pentium 4) процессор выгружает обработанные данные только после получения новых, что несколько снижает производительность. Часть исполнительных блоков процессора простаивает.
Внеочередная загрузка команд способна повысить производительность.
Также вдвое в сравнении с K8 увеличен размер стека возврата. У K8 при выполнении длинной цепочки запросов возможна ситуация, когда места для записи начального адреса в стеке возврата не хватает и тогда предсказания ветвлений становятся невозможными. Теперь вероятность этого значительно снизилась.
Архитектура K10 позволяет отслеживать гораздо больше переходов и ветвлений, за счет чего повышается точность предсказаний. А чем точнее предсказания переходов, тем более полно процессор способен загрузить работой свои исполнительные блоки.
Улучшенное предсказание ветвлений
gPPPPP Поддерживаются инструкции SSE4a, которые, помимо стандартного набора, включают: комбинированный набор инструкций (EXTRQ/INSERTQ) и векторные потоковые инструкции (MOVNTSD/MOVNTSS).
gPPPPP Связь между кэшем L2 и контроллером памяти также увеличила разрядность и теперь составляет 128 бит.
gPPPPP Увеличена разрядность интерфейса между SSE-блоками и кэшем данных первого уровня. Теперь за один такт стала возможной загрузка двух 128-битных инструкций за такт против двух 64-битных у K8.
gPPPPP Чипы K10 могут выполнять 64-битные SSE-инструкции как одну. Именно поэтому увеличение разрядности SSE-блоков так важно и производительность должна вырасти довольно значительно.
Увеличена разрядность SSE блоков с 64 бит до 128 бит. Современные процессоры K8 при выполнении 128-битной SSE-операции вынуждены разбивать ее на две 64-битных и выполнять по очереди. Само дробление операции, кстати, тоже является операцией, поэтому налицо узкое место архитектуры. Таким образом, одна 128-битная SSE-инструкция требует от процессора K8 выполнения минимум трех операций.
Для справки: SSE (Streaming SIMD Extensions, потоковое SIMD-расширение процессора) это набор инструкций, который дает увеличение производительности при выполнении одинаковой последовательности действий над большим набором однотипных данных. Активно используется 3D-играми.
Улучшена работа с инструкциями SSE
Некоторые особенности AMD K10
А между тем, заметим, что в роадмапах Intel уже значатся , идущие вслед за Penryn. Кроме отличной от Core архитектуры, Nehalem хвастаются первым для Intel встроенным контроллером для прямой работы с ОЗУ.
Итак, задача минимум, которая стоит перед новыми процессорами AMD, достижение паритета с нынешними Core 2 Duo. Задача максимум превзойти по производительности выходящие в конце этого года 45-нм процессоры Intel семейства Penryn. Каковы же слагаемые успеха новой архитектуры, за счет чего увеличится производительность по сравнению с процессорами поколения K8?
Первые упоминания о новой архитектуре процессоров AMD появились в 2003 году, причем нам обещали нечто грандиозное с тактовой частотой до 10 ГГц. В 2006-м официальные лица в различных интервью подтвердили, что AMD действительно кое-что готовит, а именно обновление K8 в лице K8L, и умерили пыл относительно наполеоновских частот. В феврале 2007-го технический директор AMD, Джузеппе Амато, в видеоинтервью заявил, что готовящаяся архитектура носит кодовое имя . С конца 2006-го AMD начала демонстрировать на различных выставках образцы K10 серверные чипы Barcelona, системы на которых должны начать продавать в сентябре.
В то время как Intel вовсю готовится к 45-нм процессорам, AMD еще не распрощалась с 90-нм. Как известно, после выхода чрезвычайно удачных в плане производительности и энергопотребления 65-нм процессоров Intel архитектуры Core для настольных ПК и ноутбуков дела у компании AMD с ее 90-нм чипами на основе пошли ни шатко ни валко. Если раньше ее процессоры Athlon 64 X2 серии FX были общепризнанными лидерами по быстродействию, то теперь передовому Athlon FX-62 (2,8 ГГц) не потягаться даже с далеко не самым мощным Core 2 Duo E6600 (2,66 ГГц). А уж для четырехъядерных процессоров Intel Core 2 Quad у AMD вообще нет ответа... К слову, Intel умудрилась продать меньше чем за год (в настольном, мобильном и серверном сегментах), у AMD же процессоров с четырьмя головами пока вообще нет.
Максим Гусаров / 10.09.2007 / 22:26
AMD K10: архитектура, маркировка и другие особенности грядущей революции
AMD K10: архитектура, маркировка и другие особенности грядущей революции -- Обзоры -- mobi.ru
Комментариев нет:
Отправить комментарий