Автор: Васечкин,Валерий
О новой процессорной архитектуре, которая идет на смену клюющей носом K8, компания Advanced Micro Devices объявила еще в начале 2006 года. Изучая роадмапы и следуя обещаниям ответственных лиц, сторонники AMD приготовили бутылки с шампанским еще к августу. Однако ж ожидание "дня X" затянулось, и лишь сейчас производитель дает команду праздновать.
Вино за три месяца явно не стало хуже, а вот новая линейка процессоров, еще не увидев свет, уже рискует немного состариться, так как заклятый конкурент AMD - корпорация Intel - не дремлет и в ближайшее время запускает усовершенствованную версию архитектуры Core 2 Duo под общим названием Penryn. Этот не столь большой шаг по сравнению с тем, который сейчас делает AMD, вполне может поставить под сомнения ее новые достижения. K10 выходит более чем вовремя, и теперь, наконец, можно ответить на вопрос: сумеет ли AMD восстановить паритет, нарушившийся с выходом Core 2 Duo?
После этого события AMD оказалась не в том положении, чтобы скрывать сведения о новом процессорном семействе, поэтому еще задолго до анонса основные черты новинки были хорошо изучены сетевыми и "бумажными" обозревателями. Среди того немногого, что фирма до поры скрывала, было кодовое название проекта. Долгое время все пребывали в уверенности, что он называется K8L. Потом неожиданно всплыло K10, и человеку, на пару недель выпавшему из темы, могло показаться, что AMD затеяла что-то новое. На самом деле, как гласили быстро затерявшиеся в лентах новостей заметки, обозначение K8L относится к мобильным процессорам Turion 64, что более логично, а новая архитектура проходит под кодом K10. Вот так AMD проскочила номер девять в своей исторической цепочке. Торговые марки процессоров и вовсе определились сравнительно недавно. Заслуженное имя Athlon уходит из авангарда в средний ценовой ряд, его место займет брэнд Phenom, почему-то вызывающий у меня ассоциации из области технического ретро - громадные исследовательские проекты середины-конца XX века или советские телевизоры того же времени. "Наукообразный" стреловидный логотип новых процессоров эти ассоциации лишь усиливает. AMD отказалась и от давно утратившей адекватность системы рейтингов, вместо которой вводятся строгие кодовые обозначения. В серверном секторе продолжает править бал торговая марка Opteron. Но это все формальности, куда важнее и интереснее узнать, какая реальность за ними скрывается.
Самое заметное новшество K10 состоит в том, что эта архитектура изначально рассчитана на четыре процессорных ядра, из чего следует добрая половина остальных изменений. Тогда как Intel сделала четырехъядерный Kents-field, упаковав в один конструктив два кристалла Conroe, AMD решила не плодить "сиамских близнецов": Phenom представляет собой более элегантное решение с единым камнем. Теоретически это должно давать ему преимущество в быстродействии (ядра избавлены от необходимости общаться через системную память), но, как однажды заметил по этому поводу представитель Intel, пользователю все равно, что находится под крышкой процессора, если он быстрее. Окажется ли Phenom быстрее - большой вопрос. В то же время раздельное производство "половинок" для четырехъядерного CPU гораздо выгоднее, так как годных чипов с конвейера выходит больше. У AMD с этим могут возникнуть трудности - "камень" огромный, состоит из 463 млн. транзисторов. При изготовлении используется техпроцесс 65 нм. В этом Intel пока безусловно впереди: обновленные процессоры Core 2 Duo под кодовым названием Penryn уже готовы к массовому выпуску на 45 нм, а Phenom перейдет на такое исполнение лишь в нынешнем году.
Так вот, первое следствие настоящего четырехъядерного дизайна Phenom и один из самых громких рекламных лозунгов AMD - это новая организация кэш-памяти. Фирма по-прежнему испытывает трудности с ее объемом и не может угнаться за Intel в искусстве выпускать крупные чипы с регулярно уменьшающимся техпроцессом: процессоры Penryn уже хвастаются памятью до 12 Мбайт! В прошлом ситуацию спасал чрезвычайно быстрый встроенный контроллер памяти, отчасти уменьшавший нужду в больших кэшах. Теперь же поневоле пришлось раскошелиться на дополнительные транзисторы: четыре ядра для эффективной работы обязаны обладать общим хранилищем данных. В четырехъядерных Core 2 эту задачу решает разделяемый кэш L2 в каждой паре ядер. AMD сочла такой дизайн слишком сложным и решила оставить иерархию памяти K8 как есть, лишь добавив надстройку в виде общего кэша L3. Кроме общих данных, в нем хранится и весь получаемый процессором код, а каждое из четырех ядер снабжено 64 килобайтами персонального кэша первого уровня и 512 килобайтами второго.
Сам контроллер памяти - конек всех последних процессоров AMD - стал еще более эффективным. Говоря точнее, их теперь две штуки: по одному на каждый канал. Многоядерному процессору это дает ощутимое преимущество, особенно в случае работы с разными потоками. Если же этого не требуется, контроллеры могут перейти в сгруппированный режим, имитируя один. Кроме того, устройство поумнело и научилось выжимать последнее из пропускной полосы памяти: операции записи теперь накапливаются в специальном буфере, и как только набираются в достаточном количестве, выполняются скопом. Заодно происходит слежка за всеми обращениями к оперативке, и потенциально нужные данные заранее скачиваются в "мини-кэш" контроллера. Такая предвыборка на общем уровне тоже приходится весьма кстати для многоядерного CPU. Однако на все эти хитрости AMD пошла не спроста, ведь в поддержке памяти Phenom пока ограничен DDR2 c частотой 1066 МГц, хотя и к работе с DDR3 потенциально готов. AMD снова скептически относится к новому типу памяти, предоставляя другим фирмам прокладывать дорогу прогрессивным стандартам, благо Intel всегда готова быть первопроходцем. Но на самом деле, DDR2 Phenom хватает за глаза, поскольку частота фронтальной шины у него так и не поднялась выше 800 МГц, тогда как Intel готовится удвоить этот показатель. Зато шина HyperTransport прогрессировала до версии 3.0 и теперь будет работать на частотах до 2 ГГц в каждую сторону в зависимости от модели процессора.
Архитектура K10 полна малозаметных по отдельности усовершенствований, копирующих некогда эксклюзивные качества Core 2 Duo. И память - лишь вершина айсберга; куда больше инженеры поработали над вычислительным ядром процессора. Если при работе с данными задержки уменьшает предвыборка, то для того, чтобы непрерывно работали исполнительные устройства, нужно предсказание ветвления кода программы. У K8 оно работало отлично, только в одном Intel была впереди. Pentium M, а затем и Pentium 4 с ядром Prescott обзавелись непрямым предсказателем ветвлений. Что это за устройство? Вместо предсказания конкретной инструкции он лишь указывает место в памяти, где она может оказаться. Prescott в свое время немало выиграл от такого блока, со своим конвейером непомерной длины. У Phenom такой проблемы нет, но AMD решила, что и ему новинка пойдет на пользу. Кроме того, и обычные предсказатели Phenom работают эффективнее, чем раньше. Еще у современных процессоров Intel есть такая важная особенность, как выполнение определенных инструкций загрузки заранее, в обход других команд, стоящих в очереди. В результате, вместо того чтобы дожидаться поступления данных, расчеты, для которых они нужны, получают их немедленно. Это неплохое подспорье для процессора, при том что загрузки составляют около трети всего кода в современном софте. У процессоров K8 таких возможностей не было, а у K10 - уже есть.
Другой мелкой радостью Phenom стало добавление нескольких новых инструкций: двух для нужд криптографии и четырех расширений под названием SSE4а (в интеловском SSE4 их нет, и вряд ли появятся). AMD, заметим, пошла еще дальше и без оглядки на Intel (между прочим, конкуренты за свою историю купили друг у друга немало технологий) разработала набор SSE5, который Intel предала анафеме. Но в Phenom он не попал и дебютирует в составе процессоров Fusion. Да, еще один бонус K10 - аппаратный менеджмент памяти при виртуализации операционных систем. Сейчас, когда одна или несколько ОС работают на машине под надзором основной операционки, последняя до 75% времени тратит на эту работу, и технология Nested Paging должна перенести ее на плечи процессора. AMD говорит, что ввести новинку в оборот будет совсем нетрудно.
Все эти изменения создают критическую массу, ставящую Phenom на голову выше своих устаревших предков Athlon 64. Но куда важнее мелких подвижек то, что AMD сделала с логикой обработки SSE-инструкций. Как известно, одной из главных причин, по которым Core 2 Duo ушел в безнадежный отрыв от Athlon 64 в мультимедийных приложениях, было тотальное превосходство в вычислениях с плавающей точкой (в офисных делах и прочих задачах с целочисленными расчетами K8 упирается что есть сил). Core 2 Duo имеет три полноценных 128-битных вычислительных блока и, соответственно, выполняет за такт три инструкции SSE. K8 довольствуется двумя 64-разрядными ALU. Это значит, что Core 2 Duo в два с лишним раза быстрее, так как K8 тратит дополнительное время на "разделку" 128-битной инструкции на две 64-битные половины. Phenom просто обязан был одолеть эти преграды, и действительно оба ALU стали 128-разрядными. А значит, теперь AMD имеет все шансы если не вернуть себе былое превосходство в мультимедийных приложениях (третий ALU, как у Core 2 Duo, не заменишь), то хотя бы серьезно сократить отставание.
Итак, что можно сказать об архитектуре Phenom в целом, глядя на описания технологий и схемы с функциональными блоками? Конечно же, K10 не может претендовать на статус революционной разработки и все еще весьма похожа на свою предшественницу K8. Тем не менее во всем виден немалый прогресс: инженеры AMD прикрыли почти все слабые места, со временем все больше резавшие глаз в заслуженных процессорах Athlon 64. Убийцей Core 2 Duo Phenom’у тоже стать не суждено: Duo все еще слишком хорош, и к тому же получил успешное обновление в лице процессоров Penryn. Но технологический разрыв конкурентов теперь сократился до минимума - настолько, что без бенчмарков невозможно сказать, взяла AMD реванш или нет. На наше счастье, Сеть наполнилась ими тут же после анонса новинки. Цифры говорят, что Core 2 Duo на аналогичной с Phenom частоте по-прежнему впереди почти во всех задачах. Преимущество невелико - процессору AMD достаточно было бы "лишних" двухсот мегагерц, чтобы свести его на нет. Но может ли Phenom получить их? Этот вопрос уводит нас от высоких материй к более практичным вещам.
Как там у Phenom обстоят дела с таким важным понятием, как "производительность на ватт"? Оказывается, совсем неплохо. К технологии PowerNow! AMD добавила серьезные энергосберегающие функции, причем не зависящие от софта и операционной системы. И частота работы процессора, и подаваемое на него напряжение меняется в зависимости от загрузки самого загруженного ядра. Контроллер памяти питается и регулируется отдельно. Он же для экономии энергии может отключать свои неиспользуемые блоки. Ядра обладают такими же функциями, причем сначала отключаются крупные блоки, а затем, если требуется, внутри оставшихся под напряжением областей обесточиваются мелкие компоненты. В результате процессоры Phenom обладают вполне приемлемым TDP: средние модели укладываются в 89 Вт. Старшие достигают внушительных 140 Вт, но топовые Intel Penryn обещают не отставать - как-никак, четыре ядра. Широкий тепловой коридор позволяет надеяться и на богатый ассортимент частот. AMD уже успела подразнить публику демонстрацией системы с Phenom, разогнанным до 3,0 ГГц. Вот такая частота позволила бы новым процессорам чувствовать себя уверенно в обществе Core 2 Duo. Вся беда в том, что до серийного выпуска эти модели дойдут еще не скоро.
Пока выпущены лишь две разновидности: Phenom 9500 и Phenom 9600, с частотами 2200 и 2300 МГц. В первом квартале нынешнего года к ним присоединятся модели Phenom 9700 и Phenom 9900, но и они достигнут не бог весть какого рубежа - 2400 и 2600 МГц. Самым верным вариантом для AMD сейчас была бы ставка на ценовую войну, в которой она имеет неплохие шансы на успех: когда-то ведь удавалось брать верх доступностью продукции, так почему бы не повторить? Процессоры Phenom станут завидной покупкой для обладателей старых материнских плат под Socket AM2. Единственное, чего лишатся пользователи, - это поддержки HyperTransport 3.0, раздельного питания ядер процессора и контроллера памяти. Чтобы получить эти блага прогресса, придется купить плату с новым разъемом Socket AM2+ на чипсете AMD 700-й серии. Такая же ситуация с Socket F и Socket F+: они предназначены для процессоров Phenom FX с повышенными частотами и тоже совместимы друг с другом.
Еще одно препятствие, стоящее на пути новой архитектуры, является обратной стороной ее главного преимущества. Предмет гордости AMD - монолитный четырехъядерный кристалл - нельзя разобрать на две половинки и продать порознь, как делает Intel. Двухъядерные камни K10 нуждаются в отдельном проектировании и производстве и сильно "тормозят" на пути к прилавкам. Лишь во втором квартале будущего года их можно будет купить под старым добрым брэндом Athlon. Производителю приходится убеждать нас, что двухъядерные процессоры уходят в прошлое, пора массово переходить на четыре ядра, в крайнем случае - на три. И это не шутка: ближе к марту появятся настоящие трехъядерные Phenom.
Вот и все, что можно сказать про сами процессоры на основе архитектуры K10. Видно, что продукт удался и всем хорош, но ковровую дорожку на пути к успеху ему никто не постелил. AMD еще придется приложить немалые усилия, чтобы составить достойную конкуренцию Core 2 Duo. И между прочим, компания уже действует. AMD не была бы самой собой, если б не использовала во благо своего нового детища плоды покупки фирмы ATI. Эта сделка дала возможность выпустить на рынок целую аппаратную платформу из связки CPU, чипсета и видеоадаптера. Все это с умеренной помпой было представлено публике на недавней презентации, которую AMD устроила в уютном московском клубе. Таким образом, нам стало известно, как хорошо подходят друг другу процессоры Phenom, чипсеты AMD семисотой серии и видеокарты Radeon HD 3870 или Radeon HD 3850, а лучше две или четыре, в чем, собственно, мало кто сомневался. Сомневающимся из-под стеклянного окна в полу клуба грозили живые крокодилы (шутка). Да, сама платформа называется Spider - по имени галактики, образующей комплекс с галактиками поменьше. Судя по уже заявленной поддержке производителей железа и сборщиков PC, ее ожидает хорошее будущее.