Athlon64 3200+: Нова надежда

Производител: AMD
Доставчик:Most
Автори:Николай Цеков a.k.a Geniusloci

За Athlon64 се изговори много - всъщност толкова много, че не виждам смисъл да се приказва повече за новостите на архитектурата му и останалите нововъведения на AMD. И все пак няма как да не отбележа, че с този процесор компанията най-сетне успя да постигне дълго мечтания от феновете й успех. Гаранция за него бяха годините, през които можеше да си позволим да имаме машина с процесор на AMD за много по-ниска цена, отколкото на Рentium платформите, а често не само не страдахме от по-ниска производителност, а дори получавахме много по-висока.

През тези години се наложи и названието "котлони" (ако все още някой не знае - игра на думи с "Атлони"). Е, Athlon64 е твърде далеч от подобно определение и най-накрая най-малкия проблем е топлината. Притесненията относно охлаждането ще оставим само на овърклокърите, за останалите остава въпроса каква е производителността на новите процесори. Днес. Защото колкото и да ни бъде обещавано светло бъдеще когато стане "едикакво си"...всички все пак искаме това да се случва сега.

Първото нещо, което се "набива на очи", е далеч по-ниската честота на процесора от аналогичните като производителност (дали? :)) процесори на Intel. Моделът с рейтинг 3200+ е с работна честота 2000 MHz. От AMD отново залагат на така наречения PR (пак се получава интересна игра на думи с един термин от рекламата), макар с предното поколение процесори (Barton) да се получи известно недоразумение - те определено не отговаряха на означението си и вече показахме това в наше ревю преди време. След тестовете обаче мога да потвърдя, че този път няма никакви съмнения за производителността на процесора. Честотите, които се планира да достигне Athlon64 не са известни (поне не и тези, до които НАИСТИНА ще достигне :)). Подобно и на К7 процесорите от AMD залагат на обработката на повече инструкции за такт, вместо на високата честота, макар при тези температури да съм сигурен, че ще видим и много по-високи работни честоти. Втория плюс на този метод е нуждата от малко повишение на честотата за постигане на сравнително високо покачване на производителността. При Р4 например трябва да увеличите честотата много повече за подобно повишение на бързодействието. не знам какво ще се получи, ако Intel пусне настоящите Pentium-M процесори и в десктоп версии - Centrino 1.6 GHz в много приложения успява да пребори 3.0 и 3.06 GHz-овите модели Pentium4, така че ще се окаже сериозен конкурент на Athlon64 (изключвам липсата на 64-битова поддръжка, за нея - по-късно).

Тази статия не претендира за изчерпателност - всъщност засега ще се задоволите само със сравнение с Barton 3200+, а след няколко дни ще излезне и подробно ревю и сравнение с P4 3.2 GHz и резултати от овърклокнат Athlon64. Почти няма приложение, в което AthlonXP 3200+ да има съществена преднина, но в това ще се убедите и сами от графиките с резултати от тестовете. В някои от тях присъстват и Opteron 240 и AthlonXP с ядро Thoroughbred с по-ниски честоти, но така ще може да се ориентирате и за разликите при по-ниска честота.

За мен остава загадка пускането на Athlon64 с едноканален контролер на паметта. Да, той трябва да бъде "ценово ориентираният" модел, но пък така се губи едно от основните предимства на новата архитектура. Opteron е с двуканален контролер, но работи с ЕСС памет и то с максимална честота 333 MHz, което не е най-удачния вариант. Реално и той, и Athlon64 работят с външна шина (нека я наречем така за теорията) 200MHz. Основна разлика обаче от досегашните решения е именно контролера на паметта. Досега свързването ставаше през северния мост на чипсетите, като за целта се използваше именно контакт между процесора и контролера на паметта с определена честота (FSB - 266, 333, дори 400 MHz през последните години). От своя страна контролера на паметта контактува с нея през шина с честотата на паметта, като обаче независимо от синхронната работа се налагаха известни задръжки в него и така никога не можеше да се постигне и използва максималния възможен трансфер към оперативната памет. Особено много проблеми имат чипсетите при асинхронна работа на FSB и честотата на паметта - в това положение задръжките (или "латентности") са още по-големи и така се почти се губи смисъла от работа на такива асинхронни честоти. На теория обаче работата на FSB 200 MHz (DDR) и на паметта на 400 MHz (DDR) също е синхронна, но тъй като тогава процесора е ограничен откъм пропусквателна способност към чипсета няма да се усети никакво подобрение (освен евентуално в някои графични приложения, където AGP контролера ще използва памет). Също така е валидно и обратното предположение - при FSB 400 MHz и работа с памет на честота 200 MHz (РС2100) ограничението ще е в паметта. Двуканалните архитектури на чипсетите (nForce, nForce2 например) опитаха да повишат производителността именно във втория случай - при FSB 400 MHz прираст от изполването на два канала по 400 MHz към паметта няма да има дори на теория (само при същите условности - графични приложения или вграден видеоконтролер). Въпреки това имаше, макар и незначителен прираст на производителността, най-вече поради усвояването на по-голяма част от възможния трансфер между чипсета и процесора. На теория при 400 MHz FSB не би трябвало да има значение дали използваме два канала по 200 MHz към паметта или един с честота 400 MHz. На практика разликата е двойна, и от nVidia нямат обяснение защо. В първия случай работата отново е синхронна, но...само на теория.

В Athlon64 отново има леки "недомислия", резултат от разликите, които винаги се получават на теория и на практика. Вграждането на контролера на паметта е само начин на изразяване. Реално паметта контактува с шина, работеща на пълната честота на процесора (точно както и кеша), а самата тя работи на определена честота - по-долу са съотношенията при различните честоти на процесора, като са показани така, както се ползват при ползване на Cool'n'Quiet режима на работа, когато честотата и напрежението се регулират спрямо натовареността.

Множител

Честота на ядрото

Честота на паметта (MHz)

100

133

166

200

4

800

100,00

133,33

160,00

160,00

5

1000

100,00

125,00

166,66

200,00

6

1200

100,00

133,33

150,00

200,00

7

1400

100,00

127,27

155,55

200,00

8

1600

100,00

133,33

160,00

200,00

9

1800

100,00

128,57

163,63

200,00

10

2000

100,00

133,33

166,66

200,00

11

2200

100,00

129,41

157,14

200,00

12

2400

100,00

133,33

160,00

200,00

13

2600

100,00

130,00

162,50

200,00

Такава архитектура позволява директна работа на процесора с паметта без нужда от задръжки от страна на контролера на паметта. Вече споменах, че при процесорите Opteron максималната честота на паметта на паметта е 333 MHz, но това е продиктувано повече от липсата на сертифицирани registered модули памет. При Athlon64 (дано не сте поглеждали наличието на 128-битов, 16-bit ECC интерфейс към паметта в едно друго ревю - "такова чудо нема" ;)) паметта може и да е с честота 400 MHz. Проблема е, че използването на вграден интерфейс към паметта не позволява промяна на силата на сигналите към нея, а "високоволтовите" (т.е. всички high end памети с работно напрежение над 2.6 V) може да изискват такава промяна. Това може би обяснява и защо трудно се постигат честоти на FSB над 240MHz с тези процесори - твърдо мнение на всички, пипнали такъв процесор е, че ограничение за овърклока определено не е самото ядро - то е студено, повишаването на напрежението просто не прави нищо, следователно "тясното място" е друго. Имам собствена теория за невъзможността да се постигнат по-високи честоти, но ще ви запозная малко по-късно. На няколко места прочетох предположения, че ограничител се явява Hypertransport шината, но това е несериозно - реално тя не се явява тясно място по една изключително проста причина. Честотата й. VIA претендира за по-висока производителност на своя "чипсет" за Athlon64 поради използването на пълните възможности на НТ шината - а именно честота 800 MHz и Full Duplex контакти с 16-битова разчетност (6.4 GB/s). При nForce3 150 се използва работа на 600 MHz при разчетност 8 бита в едната посока и 16 в другата, като сумарния трансфер в двете посоки (не е известно в коя връзката е 8-битова)осигурява общо 3.6 GB/s. И в двата случая обаче процесорите стигат до едни и същи честоти, независимо от по-ниската честота на работа на НТ. Дори повече - и в двата случая няма проблем да намалите честотата, но това не води до нищо. При тестовете на Opteron (който успях да овърклокна благодарение на ASUS SK8) нямах проблем с паметта - при овърклок пусках паметта на 266 MHz но това не доведе до по-добри резултати, ядрото работеше абсолютно еднакво при 1.55 V и при 1.75 V. Става ясно, че слабото място е било друго, още повече при този процесор контролера е двуканален (казано по друг начин - 128-битов) и работи само с registered памет, което вероятно го прави още по-чувствителен към проблеми вследствие повишената честота.

Дъната за Athlon64 наистина са по-капризни към памет - някои модули, които доказано нямат проблеми дори над 230 MHz честота не работят на повече от 210 MHz. Няма никакво становище на VIA или AMD по въпроса. За наша радост не срещнах проблеми с прословутите Winbond BH-5/CH-5/Mtec чипове на Kingston и TwinMOS.

Второ тясно място е връзката с AGP шината. За разлика от PCI, която винаги е заключена на 33 MHz, AGP шината работи на 1/3 от честотата на FSB, което при повишаване над 240 MHz е друга възможна причина за нестабилност над системата (малко видеокарти издържат над 80 MHz честота на AGP. Решение би било по-бързото навлизане на PCI-Express, за която се говори, че ще бъде с отделен генератор подобно на PCI и няма да има такива проблеми.

Овърклок
За да не правя отделни заключения за възможностите за овърклок на процесора ги вмествам където според мен им е мястото. Защо ли? Сега ще разберете.
Виждали сте вече в Интернет и разни преписващи издания предположения или резултати от овърклока на Athlon64. Като преломна стойност си струва да отбележа 2400 MHz, когато възможностите явно се изчерпват. Не ми е ясно на глупави ли се правят някои колеги, затова внасям известни пояснения, изпитани на собствен гръб. След като разгледах и посочих евентуалните тесни места при овърклок, редно е да посоча и конкретния виновник за невъзможността да премина 2200 MHz след като постоях на дъното на ASUS с чипсет на VIA. AGP шината. И смея да го твърдя със сигурност по следните причини:
- 240 MHz FSB - Windows зарежда, няма проблем при пускане на SuperPI, при всякакъв опит да пусна 3D или да овърклокна видеокартата, компютъра зависва.
- 235~240 MHz FSB - Windows зарежда, няма проблем със SuperPI, но се повтаря проблема с 3D - още при зареждане на началния екран на тестовете от 3DMark2001. Мога да овърклокна видеокартата, но на втория или третия опит с натискане на "Test" в RivaTuner компютъра забива.
Около 230 MHz FSB - Windows зарежда, влиза в теста от 3DMark и забива.
- 220MHz (до 225 MHz) FSB - Никакви проблеми с тестовете и стабилността.
Всякакви опити с намаляване на съотношението на честотата на паметта и FSB, повишаване на нейното или на процесора напрежение, промяна и "омекотяване" на настройките й не помага. Повишаването на напрежението на AGP слота разбира се не помогна - както и никога не е помагало ;) От цялата гимнастика се оказва, че прираста в тестовете не бе достатъчен, поне не и за да се борим за място в базата резултати на Futuremark :)

Вече имам дъно с nForce3 за Athlon64 (Gigabyte K8NNXP) и още няколко дъна с VIA K8T800 и се надявам до дни да проверя докъде се простират възможностите за овърклок на процесора.

(UPDATED 24.11) Вече се преборих с платката на Gigabyte с чипсет nForce 3 150 и мога с убеденост да твърдя, че ако изключим липсата на native serialATA поддръжка това е по-добрият чипсет. Да не говорим за наличието на AGP Lock ;)

Въпреки, че използвам FSB като означение, при тази архитектура това не е правилно означение. Ще ви оставя сами да разтълкувате думите на AMD по въпроса:
"The 200MHz clock generator feeds the components of the motherboard (including the CPU), but it is not the speed of the CPUs interface to the memory controller or to the chipset. The old term FSB has always represented the speed at which the processor moves memory traffic and other command and data traffic to and from the chipset. Because the memory controller is located on the processor die, that memory subsystem traffic no longer has to go through the chipset or CPU-to-memory calls. With Athlon64 processors, the speed at which the CPU and memory controller interface is full processor frequency - the speed at which the processor and chipset communicate is dependent on the chipset's Hypertransport spec which can be at speeds of up to 1600MHz." Пояснение - в BIOS винаги ще намирате нещата, с които сме свикнали - FSB и CPU ratio (Второто вероятно в редки случаи, защото засега за смяна на множителя се , така че - спокойно, няма да овърклокваме "поновому" (2000 MHz, 2001 MHz, 2003 MHz...2400 MHz :))

Малко повече за чипсетите
За теста използвах платка на Gigabyte -K8VNXP с чипсет VIA К8Т800. Вече споменах за несъгласието си с "предимствата" на архитектурата на VIA. Тяхното решение, както и това на SiS използват връзка със северния мост, а от своя страна той се свързва с южния, AGP шината (процесора няма AGP контролер, може би заради бъдещата замяна на AGP с PCI-Express). При VIA връзката е означена като V-Map (на диаграмата), но е позната под името V-Link и има пропусквателна способност 533 MB/s - което е малко за чипсет с подобни претенции.
Не съм съгласен с твърденията на VIA за превъзходство (по посочените по-горе причини) на техния чипсет. Все пак говорим за десктоп дъна, които почти няма начин да се достигне дори половината от теоретичния трансфер на данни между PCI и Hypertransport шините (между процесора и северния мост), а какво ли да кажа за тесничкия V-Link...

Така наречената "модулна" система е по-скоро ново наименование на досегашния метод на поставяне на допълнителна периферия, сега дори улеснен (само на теория). Всички допълнителни устройства се връзват към южния мост, което директно изключва постигането на някакво съществено преимущество пред конкурентните чипсети. С използването на НТ връзка само към северния мост всъщност се дава свобода на комуникация основно със видеоконтролера, но пък той е ограничен от честотата и пропусквателната способност на AGP 3.0 (8х), която засега не се използва сериозно така или иначе дори и при много тежки професионални приложения. Самия процесор не се нуждае от по-бърза връзка с периферията от тази, която вече има - Hyper Transport, защото тя осигурява предостатъчна големина на трансфера, но явно от VIA не са пожелали да ползват и НТ за връзка между двата моста.

SiS са избрали подобен подход, но връзката между двата моста е фирмената MuLTIOL с възможност на пренос на данни до със скорост до 1 GB/s. Остатъка естествено е не по-различен от решението на VIA (после кажете, че "модулността" не се ползвала и била новост от лагера на VIA :)).

nForce3 150 има по-бавна връзка към процесора -общо 3.6 GB/s общо за AGP шината и допълнителните устройства (диаграмата не е вярна - в едната посока връзката е 16 битова), но на всички ни е известно, че това е напълно достатъчно. Връзката на останалите компоненти е към южния мост, но при положение, че имаме само него - той и AGP контролера са обединени в един чип, няма да има нужда от по-широка лента към процесора - северния и южния мост контактуват с вътрешни шини директно в чипа.


Ali изглежда са се ориентирали най-добре към ползването на HT като основа за изграждане на бърз чипсет (нямам никаква информация относно производителността, така или иначе - нали никой не си купува Ali…)

Единственото решение, което ползва само HT връзка е AMD 8000, но този чипсет е само за Opteron процесори и вероятно няма да има версия за Athlon64.
(UPDATED 24,11) По-късно днес съм "на среща" с двупроцесорна система с два Opteron 240. Скоро очаквайте и преките впечатления от работата на чипсета на AMD.
Няма да описвам подробно платката на Gigabyte - надявах се скоро да направим ревю на всички налични дъна за Athlon64 и да го съпоставим с останалите, но се оказа, че това е бил "Limited Edition" и сега не е ясно ще мога ли да се сдобия отново с такава. На мястото на този модел е фамилията K8VT800, чиито цени започват от малко под 100 долара - дънните платки за А64 явно бързо намериха правилната ценова категория. Имах проблеми, които буквално ме отказаха от опитите да овърклоквам с K8VNXP - при задаване на някакви стойности в BIOS и рестартиране процесора тръгваше отново на default честота и напрежение. Като цяло дъното е "бъкано" с екстри и би задоволило почти всеки. Е, почти. Очаквах по-добро решение за звука - от VIA предлагат възможност за добавяне на 7.1 звук чрез използване на ENVY24 чипа, който често се среща в скъпите полупрофесионални решения (наскоро писах, че звукови карти с такъв чип на Terratec вече се продават и у нас). При възможност за 24-битои 96 KHz запис и възпроизвеждане това би поставило такова решение едва ли не най-отгоре на възможните вградени аудио решения, но от друга страна ENVY24 е просто I/O контролер, а не звуков процесор. Gigabyte - K8VNXP е с Realtek ALC658 (най-новият чип на компанията) AC'97 кодек, който е с "уж" подобрени възможности.
Споменах и за участието на Opteron 240 в някои тестове. В момента у нас има и процесори Opteron 140 и цената им е почти наполовина на тази на Athlon64, което ги прави меко казано привлекателна покупка, ако преглътнете факта, че ще трябва да си купите Registered DDR памет (но пък "само" на 333 MHz и то два модула за двата канала ;)). А и дъната за тях (или по-точно дъното - ASUS SK8) са съвместими с Athlon FX, не забравяйте.

Главният герой:

На долните две снимки са съответно героя на настоящото ревю - Athlon64 3200+ и малко по-стария му "брат" - Opteron 240:

Athlon64 е с метална капачка, покриваща ядрото, точно каквато доскоро виждахме само върху процесорите на Intel. Освен да разпределя и без това малкото отделена топлина, тя предпазва ядрото от наранявания - много от вас са виждали оръфани ядра на К7 процесорите, дори и нови процесори често идваха с подобен дефект когато не са в оригиналната опаковка. Подложката е органична (или както някои я наричат - текстолит :)), твърде прилична на използваните в момента за процесорите Duron/Thoroughbred/Thorton/Barton.

Това е първият ми сблъсък с К8 чиповете - Opteron 240. Основна разлика при поглед отгоре - керамична подложка и надпис върху капачката. Засега няма желаещ (поне сред нас) да се опита да свали капачката и да потърси други съществени разлики.

На тези две снимки се вижда (донякъде, като изключим сакатата ми работа с фотоапарата) разликата и отдолу. На следващите две ще видите съответно и сокетите на двете дъна - Gigabyte K8VNXP и ASUS SK8:

Дъното, на което тествах - Gigabyte K8VNXP - много екстри, поносима цена, калпав BIOS:

Athlon64 идва и с нов метод на захващане на охладителя, като същия се използва и за процесорите Opteron. Самия радиатор е от алуминиева сплав и не изглежда кой-знае колко добър, но ако се съобразим с това, че Athlon64 почти не грее (най-после всички с Р4 ще има за какво да завиждат), подобно охлаждане е напълно достатъчно дори при овърклок. Нещо повече - перката е много тиха, на фона на шума от видеокартите, които тествахме през последните дни дори не се чува.
(UPDATED 24,11) Максималната температура, достигната от процесора дори при овърклок около 300 MHz над номиналната честота и повишено напрежение бе малко над 40 градуса с обикновен алуминиев радиатор Cooler Master. Нямам думи с каква радост го констатирах.

Както се вижда процесора прилепва перфектно за основата, която при box кулъра на Opteron е медна, а при Athlon64 - от същата сплав както и ребрата.

Тестовите системи:

Athlon64 3200+

AthlonXP 3200+

AthlonXP "Thoroughbred"

AMD Opteron 240

Gigabyte K8VNXP

Soltek FRN2-RL

ASUS SK8

2x256MB DDR400 Winbond BH5 chips (TwinMOS PC3200 & Kingston KVR400X64C25)

2x256MB Registered PC2700 Kingston KVR333X72C25)

ASUS V9550 (nVidia GeForce FX5900 128MB), 44.09 драйвери

Maxtor DMAX+9 80GB 8MB cache IDE

2xWD Raptor 36GB SATA

Box Coolers

PSU 400W Matrix PPFC

Софтуер:
-
Windows XP Professional SP1
- DirectX 9a
- 3DMark2001 330
- 3DMark2003 330
- Specviewperf 7.1
- SisoftSandra MAX3
- AIDA32
- PCMark2002
- Virtual DUB XVid-to-DivX (DivX 5.0.5) Ogg Vorbis 43KB/s audio compression
- Kribi bench rendering
- SuperPI

Тестове, тестове, тестове…

В 3DMark2003 влиянието на процесора е минимално. Разликата е символична, но в 3DMark2001 това далеч не е така:

Превъзходството на системата с Athlon54 3200+ на места е озадачаващо и достига до над 25% !!!

Първият ми опит да открия вероятния причинител на подобна разлика в бързодействието :)...

...и втория, също неуспешен. Паметта не показва кой знае колко по-добри резултати. Лидер определено е Opteron, който благодарение на 128-битовият си контролер започва да догонва дори Р4.

Както обикновено - Sandra не е никакъв критерий за оценка на бързодействието...

...и това се доказва отново.

Подобно на Sisoft Sandra, според PCMark няма прираст на производителността спрямо AthlonXP 3200+, макар паметта този път да получи заслужени овации.

В не един тест AthlonXP 3200+ изглежда по-добър.

Това е така и в Specviewperf - както и досега, превъзходството на Intel поне в тази област (Professional OGL) със сигурност ще се задържи.

Съвсем логично в SuperPI вече има разлика.

При кодиране на видео тя става очевидна и със сигурност е в полза на новите ядра на AMD.

Лично за мен един от най-заслужилите доверие тестове. Дори овърклокнатия Opteron в някои тестове успява да пребори работещия на цели 400 MHz повече процесор AthlonXP.

Дотук с тестовете. Ще оставя подробното заключение за по-късно, когато "сборим" Athlon64 с Pentium4 3.2 GHz в по-сериозни тестове. Известно е, че AthlonXP не бе претендент за лидерска позиция дори когато излезе, така че не очаквах да се намеси в съревнованието, но по-бързата му работа в някои от тестовете показва, че в K7 архитектурата има още много хляб. Можем само да съжаляваме, че AMD не само отказаха да поработят върху нея и да продължат да я развиват, но и напоследък всячески се стремят да ни откажат от покупката на Thorougbred/Thorton процесори като ги пускат със заключен множител. Това бе основния "виновник" за невероятния бум в продажбите на 1700/1800+, но днес вече е време да се насочим към Athlon64. Не защото е 64-битов процесор и е първия такъв за домашни компютри, а защото успява да покаже мускулите си съвсем не на шега. Дъна за него има в изобилие, проблеми със съвместимостта няма, а и съм повече от убудун, че при излизане на 64-битова версия на Windows с оптимизации за него ще имаме още по-голям прираст в производителността.

Висока цена? Who cares - винаги ще има манияци :)))))