Opteron 3350 HE Insides

amd(only in german – sorry)

Ich habe vor kurzem einen Opteron 3350HE (siehe auch dieser Artikel http://www.hyperpac.de/?p=1548) via eBay Kleinanzeigen verkauft. Wie sich herausgestellt hat, ist der Käufer – Nicos – ein ganz schöner CPU-Pro. Auf jeden Fall hat er sich eine ganze Menge Mühe gemacht um möglichst alles aus der CPU herauszuholen. Da Infos zu den Opterons aus der 3300 Serie sehr rar sind, gebe ich Nicos Informationen nur mit kleinen Editierungen wieder. Die Texte sind chronologisch, das Neuste ist ganz oben (und enthält dementsprechend auch den größten Erkenntnisgewinn).

Hier sind auch noch 2 Links zu den Bulldozer Fixes von Microsoft. Bevor ihr diese einspielt sollte ihr unbedingt den ganzen Text lesen !

http://hotfixv4.microsoft.com/Windows%207/Windows%20Server2008%20R2%20SP1/sp2/Fix387870/7600/free/441065_intl_x64_zip.exe
http://hotfixv4.microsoft.com/Windows%207/Windows%20Server2008%20R2%20SP1/sp2/Fix391262/7600/free/441280_intl_x64_zip.exe

Viel Spaß beim lesen und dickes DANKE an Nicos !!!

Ein paar letzte Zusätze möchte ich zu dem letzt Geschriebenen doch noch machen. Einfach der Vollständigkeit halber, und um die Sache so abzuschließen.

Die Sache mit dem Hobby-Hardcore-Overclocker ist hier zu finden: http://www.computerbase.de/forum/showthread.php?t=1028605

Ist vom Februar 2012, wie ich erst jetzt festgestellt habe. Das wird ihn dann wohl doch nicht mehr interessieren, denn entweder arbeitet er seit der Zeit mit ‘ner CPU, die sich verrechnen kann, oder er hat schon längst das Pferd gewechselt. (Womit ich mal eher rechne.)

Der Mehrwert für Dich an dieser zusätzlichen Mail kommt jetzt:

Ich habe das mit dem HPC = High Performance Computing” (Mode) nämlich herausgekriegt. Das bedeutet, dass wenn es aktiviert
ist, die letzte noch nicht Turbo-Stufe, von da an zur Basis bzw. zum Minimum(-Takt) wird. Alle Takt-Stufen darunter werden
dann nicht mehr benutzt. Beim Opteron 3350 HE wären bei aktiviertem HPC also 2800 MHz das Minimum. Turbo-Stufe 1 mit 3100 MHz wäre noch drin, und bei Turbo-Stufe 2 mit 3800 MHz bin ich mir nicht ganz sicher. Dazu müsste ja 1 Modul (2 Kerne) in den C6-Status (/Schlaf-Modus) wechseln und ob das durch das 2800 MHz Minimum nicht verhindert wird, weiss ich nicht genau. Ich würde aber mal sagen: nicht. Weil C6 ja ungleich dem normalen Basis-Takt von 1400 MHz ist. Schlaf-Modus ist Schlaf-Modus und nicht 1400 MHz. – Richtig bei mir überprüfen konnte ich das nicht, weil bei mir HPC nicht funktioniert. – Vielleicht muss das Betriebssystem das auch noch unterstützen (also ein Server-Betriebssysten sein) oder es hat andere Gründe (wie eine fehler-hafte Bios-Implementation). – Bei mir fällt(/fallen) die Takt-raten also durchaus auch mit aktiviertem HPC-Modus auf den Standard-Basis-Takt von 1400 MHz, was sie so nicht dürften. (Machmal wurden mir aber so kurzzeitig (/”flackerhaft”) eine Taktrate von 4600 MHz oder irgendsowas angezeigt. Jedenfalls irgendwas über 4 GHz, was der Prozessor eigentlich nicht beherrscht und ohne Spannungs-Erhöhung nur schwerlich schaffen sollte. – Wurde mir aber so angezeigt. … Da das aber mein Vertrauen darin nicht gerade stärkte und das mit 2800 MHz als Basis-Takt auch nicht funktionierte, habe ich’s natürlich wieder de-aktiviert.)

Das mit den 4600 MHz war glaube ich bei nur 1 Thread möglich*. Habe ich aber nicht weiter überprüft. – 3800 MHz dann bei 2
Threads, die auf(/in) einem Modul laufen und 3100/2800 MHz bei 4 Threads. – Wobei ich auch noch nicht so genau weiss,
wann von 2800 MHz auf 3100 MHz geschaltet wird.

*innerhalb eines Moduls (oder mit nur 1 Kern? … – wohl wahrscheinlicher.

Vielleicht war das auch eine “Fehl-Anzeige”. Rechen-Fehler traten dadurch jedenfalls nicht auf. Die CPU-Spannung muss also gereicht haben.

Im Computerbase-Forum werde ich vielleicht auch noch etwas dazu schreiben, weil im Februar (2012) auch irgendeiner eine Frage dazu hatte, und ihm keiner eine Antwort geben konnte. – Der hatte ‘nen Acht-Kerner (FX) und hat sich auch gewundert, warum sich die CPU bei 2 Threads verrechnet hat (und ansonsten nicht). – Das hat meiner Meinung nach genau mit der Sache
zu tun, die ich Dir beschrieben hab. -> C6-State und (dann) nicht genug V-Core für Turbo-Stufe 2. … – Da das aber ein (Hobby-)Hardcore-Übertakter (und somit “CPU-Quäler”) zu sein scheint, räume ich dem keine hohe Priorität ein. Ich hab’ im Moment einfach andere Sorgen. … – Obwohl… So schwer kann’s ja nicht sein, dazu mal was “Geordnetes” zu verfassen. … Der Linux-Fehler trat nicht wieder auf -> scheint also tatsächlich “nur” die Hardware-Erkennung gewesen zu sein. – Was aber mit HPC = High Performance Computing” (Mode) gemeint ist, weiss ich immer noch nicht. … – Nur, dass das “regulär” in Clustern zum Einsatz kommt, die dann wirklich nur für krasserere(/umfassendere) Berechnungen verwendet werden. – Welchen Effekt
das nun genau hat und ob man das zur Verbesserung der herkömmlichen Desktop-Performance verwenden kann, dazu hab’ ich nichts gefunden. – Und soweit auch noch keinen Unterschied festgestellt bzw. das noch nicht genauer “unter die Lupe genommen”, weil mir dann doch irgendwann der Aufwand zu hoch ist bzw. ich mal Zeit dafür haben muss/müsste.

Die richtige Abkürzung für dieses eine Feature ist also “HPC” und nicht “HPM” wie letztens von mir verwendet. Patch 1 bringt Windows 7 die Bulldozer-Architektur bei (weil die anders funktioniert als bei Intel-Prozessoren).  1 Modul sind immer noch 2 reale Kerne, die sich aber etwas mehr teilen, wie bei den Prozessoren davor. – Da war es nur der L3-Cache. – Grob gesagt, haben die nur das L3-Cache Prinzip auf “darunter-liegende” Einheiten angewendet (bei denen das möglich war). Musste natürlich angepasst werden, weil’s ja keine Caches waren, sondern irgendwelche Recheneinheiten usw. “Ganz unten” blieben aber die “realen Kerne” erhalten. Was bei Intel-Proz. glaube ich nicht der Fall ist. (Die gaukeln nur doppelt so viele Kerne vor. – Wie auch immer…) – Jedenfalls haben die’s auch geschafft, dabei “Fehler” zu machen und zum Beispiel den Befehlspuffer zu klein gewählt
bzw. einfach übernommen – was aber dann zu “Kollisionen” bzw. Verzögerungen führt – habe ich gerüchteweise gehört.** Daraus ergibt sich, dass es besser ist, einzelne Aufgaben in einem Modul zu lassen, weil die 2 zugehörigen Kerne sich ja doch so einiges teilen, weil dann vielleicht doch ab und wann einer der beiden Kerne auf Sachen das anderen Kerns ohne große Umwege zugreifen kann. Patch 2 ist dafür da, um es 4-Kernern zu ermöglichen, 1 Modul abzuschalten bzw. in den Standby-Modus zu versetzen. – Nur in dem Fall kann Turbo-Stufe 2 aktiviert werden.  Eigentlich wäre es bei z.B. 8 Kernern genau das gleiche, aber offiziell beschrieben ist es nur für 4-Kerner.
**(Das soll mit/bei den Nachfolgern dieser Opteron-Prozessor-Generation behoben
werden.)

Mit 1,15 Volt, aktiviertem C6-State und beiden Bulldozer-Patchen funktioniert alles. – Auch der 2. Turbo-Modus mit 3,8 GHz.(/!)
Die Spannung könnte noch etwas knapp bemessen sein, aber grundsätzlich scheint so alles zu funktionieren. Da verrechnet sich auch nichts mehr.

Eins hatte ich noch vergessen: Eigentlich sollte der Prozessor auch 2 Turbo-Zustände kennen.

Der Normal-Takt ist jedenfalls 2,8 GHz. Der Turbo-Modus für alle Kerne beträgt 3,1 GHz und der Turbo-Modus für die Hälfte der Kerne sollte 3,8 GHz betragen. Die 3,1 GHz werden ja ab und zu erreicht, aber auf 3,8 GHz hat der Prozessor noch nie geschaltet.
(Auch bei separater Beobachtung der einzelnen Kerne nicht.) Irgendwie glaube ich, dass dieser 2. Turbo-Modus durch den 2. Bulldozer-Patch für Windows (7) erreicht werden kann. Nur so kann 1 Modul in den C6-State versetzt werden.

Vermutlich müsste ich die C6-State-Unterstützung dafür wieder aktivieren, nur bringt die CPU dann ja Fehler. … – Vielleicht hat
sie dann zu wenig Volt anliegen (für 3,8 Ghz…) (ist ja nur manuell von mir eingestellt, weil die Automatik Mist baut) – Ist schon etwas “tricky”. – Aber auch unterhaltsam. Nur irgendwann will man auch einen funktionierenden PC.

Nur, dass 1,44 V schlecht sind bzw. für FX eigentlich gedacht sind, weiss ich jetzt, weil ich dann irgendwo doch noch eine max. V – Angabe von 1,35 V gefunden habe. (Von irgendeinem Programm ausgelesen. – Das aber bei den anderen Werten nur unverständliches Zeug zeigte. …) Windows 7 funktioniert mit dieser Prozessor-Generation auch nicht besonders gut. Bei aktiviertem C6 State und (Voll-)Last auf ausschließlich 2 Kernen sind NACH einspielen der Bulldozer-Hotfixes* RECHENFEHLER möglich.

Könnte am Board liegen – sieht mir aber alles noch sehr “Beta” aus- bzw. “unausgereift. Funktioniert wohl mit einem Board der nächsten Generation (FX1090 (oder X1090)) und Windows 8 (oder 8.1) prima, aber bis dahin…C6 habe ich jetzt de-aktiviert und die Core-Spannung auf’s Geratewohl eingestellt. Dann gibt’s noch viele Optionen, von denen ich noch gar nicht weiss, was genau die bewirken – wie HPC (der High Performance Mode).

AMD Opteron 3320 EE & 3350 HE with Gigabyte GA 970a UD3 (Socket AM3+)

amdIf you are looking for a fast, but energy efficient AMD CPU you´ll probably have heard about the Opteron 3300 series. The Opterons – formerly used only in server systems – are nowadays fully compatible desktop CPU´s using the common CPU socket AM3+. This socket is also used by AMD´s FX & A-Series CPU´s and a whole bunch of mainboards are available. The only problem is – most mainboard manufacturers only refer to the FX  & A-Series in their CPU compatibility lists and you´ll probably not find any information about the Opterons.

So I picked two 3300 series Opterons for a short test with the very popular Gigabyte GA 970a UD3 Rev. 1.0 mainboard.

The Opteron 3320 EE is the most energy efficient AMD quad core CPU currently on the market with a TDP of only 25W. The Opteron 3350 HE is the second most energy efficient AMD quad core CPU with a TDP of only 45W. While the 3320 operates at 1.9 GHZ, the 3350 operates at 2.8 GHZ.

Both CPU´s work fine with the Gigabyte GA 970a UD3 mainboard but only if you have the latest BIOS installed. In my case this was BIOS version F7 (2012.10.22). One important note: the BIOS can not be updated with the Opteron 3320 or 3350. You´ll need an older CPU that is already supported by your current BIOS version. I used an AMD Sempron 145 (Socket AM3) for updating.

Links:

Gigabyte GA 970a UD3 Overview: http://www.gigabyte.de/products/product-page.aspx?pid=3907#ov

Gigabyte GA 970a UD3 BIOS Download: http://www.gigabyte.de/products/product-page.aspx?pid=3907#bios