Opteron 3350 HE Insides

amd(only in german – sorry)

Ich habe vor kurzem einen Opteron 3350HE (siehe auch dieser Artikel http://www.hyperpac.de/?p=1548) via eBay Kleinanzeigen verkauft. Wie sich herausgestellt hat, ist der Käufer – Nicos – ein ganz schöner CPU-Pro. Auf jeden Fall hat er sich eine ganze Menge Mühe gemacht um möglichst alles aus der CPU herauszuholen. Da Infos zu den Opterons aus der 3300 Serie sehr rar sind, gebe ich Nicos Informationen nur mit kleinen Editierungen wieder. Die Texte sind chronologisch, das Neuste ist ganz oben (und enthält dementsprechend auch den größten Erkenntnisgewinn).

Hier sind auch noch 2 Links zu den Bulldozer Fixes von Microsoft. Bevor ihr diese einspielt sollte ihr unbedingt den ganzen Text lesen !

http://hotfixv4.microsoft.com/Windows%207/Windows%20Server2008%20R2%20SP1/sp2/Fix387870/7600/free/441065_intl_x64_zip.exe
http://hotfixv4.microsoft.com/Windows%207/Windows%20Server2008%20R2%20SP1/sp2/Fix391262/7600/free/441280_intl_x64_zip.exe

Viel Spaß beim lesen und dickes DANKE an Nicos !!!

Ein paar letzte Zusätze möchte ich zu dem letzt Geschriebenen doch noch machen. Einfach der Vollständigkeit halber, und um die Sache so abzuschließen.

Die Sache mit dem Hobby-Hardcore-Overclocker ist hier zu finden: http://www.computerbase.de/forum/showthread.php?t=1028605

Ist vom Februar 2012, wie ich erst jetzt festgestellt habe. Das wird ihn dann wohl doch nicht mehr interessieren, denn entweder arbeitet er seit der Zeit mit ‘ner CPU, die sich verrechnen kann, oder er hat schon längst das Pferd gewechselt. (Womit ich mal eher rechne.)

Der Mehrwert für Dich an dieser zusätzlichen Mail kommt jetzt:

Ich habe das mit dem HPC = High Performance Computing” (Mode) nämlich herausgekriegt. Das bedeutet, dass wenn es aktiviert
ist, die letzte noch nicht Turbo-Stufe, von da an zur Basis bzw. zum Minimum(-Takt) wird. Alle Takt-Stufen darunter werden
dann nicht mehr benutzt. Beim Opteron 3350 HE wären bei aktiviertem HPC also 2800 MHz das Minimum. Turbo-Stufe 1 mit 3100 MHz wäre noch drin, und bei Turbo-Stufe 2 mit 3800 MHz bin ich mir nicht ganz sicher. Dazu müsste ja 1 Modul (2 Kerne) in den C6-Status (/Schlaf-Modus) wechseln und ob das durch das 2800 MHz Minimum nicht verhindert wird, weiss ich nicht genau. Ich würde aber mal sagen: nicht. Weil C6 ja ungleich dem normalen Basis-Takt von 1400 MHz ist. Schlaf-Modus ist Schlaf-Modus und nicht 1400 MHz. – Richtig bei mir überprüfen konnte ich das nicht, weil bei mir HPC nicht funktioniert. – Vielleicht muss das Betriebssystem das auch noch unterstützen (also ein Server-Betriebssysten sein) oder es hat andere Gründe (wie eine fehler-hafte Bios-Implementation). – Bei mir fällt(/fallen) die Takt-raten also durchaus auch mit aktiviertem HPC-Modus auf den Standard-Basis-Takt von 1400 MHz, was sie so nicht dürften. (Machmal wurden mir aber so kurzzeitig (/”flackerhaft”) eine Taktrate von 4600 MHz oder irgendsowas angezeigt. Jedenfalls irgendwas über 4 GHz, was der Prozessor eigentlich nicht beherrscht und ohne Spannungs-Erhöhung nur schwerlich schaffen sollte. – Wurde mir aber so angezeigt. … Da das aber mein Vertrauen darin nicht gerade stärkte und das mit 2800 MHz als Basis-Takt auch nicht funktionierte, habe ich’s natürlich wieder de-aktiviert.)

Das mit den 4600 MHz war glaube ich bei nur 1 Thread möglich*. Habe ich aber nicht weiter überprüft. – 3800 MHz dann bei 2
Threads, die auf(/in) einem Modul laufen und 3100/2800 MHz bei 4 Threads. – Wobei ich auch noch nicht so genau weiss,
wann von 2800 MHz auf 3100 MHz geschaltet wird.

*innerhalb eines Moduls (oder mit nur 1 Kern? … – wohl wahrscheinlicher.

Vielleicht war das auch eine “Fehl-Anzeige”. Rechen-Fehler traten dadurch jedenfalls nicht auf. Die CPU-Spannung muss also gereicht haben.

Im Computerbase-Forum werde ich vielleicht auch noch etwas dazu schreiben, weil im Februar (2012) auch irgendeiner eine Frage dazu hatte, und ihm keiner eine Antwort geben konnte. – Der hatte ‘nen Acht-Kerner (FX) und hat sich auch gewundert, warum sich die CPU bei 2 Threads verrechnet hat (und ansonsten nicht). – Das hat meiner Meinung nach genau mit der Sache
zu tun, die ich Dir beschrieben hab. -> C6-State und (dann) nicht genug V-Core für Turbo-Stufe 2. … – Da das aber ein (Hobby-)Hardcore-Übertakter (und somit “CPU-Quäler”) zu sein scheint, räume ich dem keine hohe Priorität ein. Ich hab’ im Moment einfach andere Sorgen. … – Obwohl… So schwer kann’s ja nicht sein, dazu mal was “Geordnetes” zu verfassen. … Der Linux-Fehler trat nicht wieder auf -> scheint also tatsächlich “nur” die Hardware-Erkennung gewesen zu sein. – Was aber mit HPC = High Performance Computing” (Mode) gemeint ist, weiss ich immer noch nicht. … – Nur, dass das “regulär” in Clustern zum Einsatz kommt, die dann wirklich nur für krasserere(/umfassendere) Berechnungen verwendet werden. – Welchen Effekt
das nun genau hat und ob man das zur Verbesserung der herkömmlichen Desktop-Performance verwenden kann, dazu hab’ ich nichts gefunden. – Und soweit auch noch keinen Unterschied festgestellt bzw. das noch nicht genauer “unter die Lupe genommen”, weil mir dann doch irgendwann der Aufwand zu hoch ist bzw. ich mal Zeit dafür haben muss/müsste.

Die richtige Abkürzung für dieses eine Feature ist also “HPC” und nicht “HPM” wie letztens von mir verwendet. Patch 1 bringt Windows 7 die Bulldozer-Architektur bei (weil die anders funktioniert als bei Intel-Prozessoren).  1 Modul sind immer noch 2 reale Kerne, die sich aber etwas mehr teilen, wie bei den Prozessoren davor. – Da war es nur der L3-Cache. – Grob gesagt, haben die nur das L3-Cache Prinzip auf “darunter-liegende” Einheiten angewendet (bei denen das möglich war). Musste natürlich angepasst werden, weil’s ja keine Caches waren, sondern irgendwelche Recheneinheiten usw. “Ganz unten” blieben aber die “realen Kerne” erhalten. Was bei Intel-Proz. glaube ich nicht der Fall ist. (Die gaukeln nur doppelt so viele Kerne vor. – Wie auch immer…) – Jedenfalls haben die’s auch geschafft, dabei “Fehler” zu machen und zum Beispiel den Befehlspuffer zu klein gewählt
bzw. einfach übernommen – was aber dann zu “Kollisionen” bzw. Verzögerungen führt – habe ich gerüchteweise gehört.** Daraus ergibt sich, dass es besser ist, einzelne Aufgaben in einem Modul zu lassen, weil die 2 zugehörigen Kerne sich ja doch so einiges teilen, weil dann vielleicht doch ab und wann einer der beiden Kerne auf Sachen das anderen Kerns ohne große Umwege zugreifen kann. Patch 2 ist dafür da, um es 4-Kernern zu ermöglichen, 1 Modul abzuschalten bzw. in den Standby-Modus zu versetzen. – Nur in dem Fall kann Turbo-Stufe 2 aktiviert werden.  Eigentlich wäre es bei z.B. 8 Kernern genau das gleiche, aber offiziell beschrieben ist es nur für 4-Kerner.
**(Das soll mit/bei den Nachfolgern dieser Opteron-Prozessor-Generation behoben
werden.)

Mit 1,15 Volt, aktiviertem C6-State und beiden Bulldozer-Patchen funktioniert alles. – Auch der 2. Turbo-Modus mit 3,8 GHz.(/!)
Die Spannung könnte noch etwas knapp bemessen sein, aber grundsätzlich scheint so alles zu funktionieren. Da verrechnet sich auch nichts mehr.

Eins hatte ich noch vergessen: Eigentlich sollte der Prozessor auch 2 Turbo-Zustände kennen.

Der Normal-Takt ist jedenfalls 2,8 GHz. Der Turbo-Modus für alle Kerne beträgt 3,1 GHz und der Turbo-Modus für die Hälfte der Kerne sollte 3,8 GHz betragen. Die 3,1 GHz werden ja ab und zu erreicht, aber auf 3,8 GHz hat der Prozessor noch nie geschaltet.
(Auch bei separater Beobachtung der einzelnen Kerne nicht.) Irgendwie glaube ich, dass dieser 2. Turbo-Modus durch den 2. Bulldozer-Patch für Windows (7) erreicht werden kann. Nur so kann 1 Modul in den C6-State versetzt werden.

Vermutlich müsste ich die C6-State-Unterstützung dafür wieder aktivieren, nur bringt die CPU dann ja Fehler. … – Vielleicht hat
sie dann zu wenig Volt anliegen (für 3,8 Ghz…) (ist ja nur manuell von mir eingestellt, weil die Automatik Mist baut) – Ist schon etwas “tricky”. – Aber auch unterhaltsam. Nur irgendwann will man auch einen funktionierenden PC.

Nur, dass 1,44 V schlecht sind bzw. für FX eigentlich gedacht sind, weiss ich jetzt, weil ich dann irgendwo doch noch eine max. V – Angabe von 1,35 V gefunden habe. (Von irgendeinem Programm ausgelesen. – Das aber bei den anderen Werten nur unverständliches Zeug zeigte. …) Windows 7 funktioniert mit dieser Prozessor-Generation auch nicht besonders gut. Bei aktiviertem C6 State und (Voll-)Last auf ausschließlich 2 Kernen sind NACH einspielen der Bulldozer-Hotfixes* RECHENFEHLER möglich.

Könnte am Board liegen – sieht mir aber alles noch sehr “Beta” aus- bzw. “unausgereift. Funktioniert wohl mit einem Board der nächsten Generation (FX1090 (oder X1090)) und Windows 8 (oder 8.1) prima, aber bis dahin…C6 habe ich jetzt de-aktiviert und die Core-Spannung auf’s Geratewohl eingestellt. Dann gibt’s noch viele Optionen, von denen ich noch gar nicht weiss, was genau die bewirken – wie HPC (der High Performance Mode).

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.