PG Turnaj 2024 - testy a nastavení

PrimeGrid Challenge
Odpovědět
Zpráva
Autor
Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3388
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2024 - testy a nastavení

#221 Příspěvek od Honza »

To vychází lépe, než dvě jednotky každá na jednom CCD?
Hmm, asi malá cache, u 3D verzí to vypadá jinak.

I z tohoto pohledu by 9800X3D mohla být výborná volba - velká cache, jeden CCD, nebude se zde tak projevoval limit škálování počtu treadů..přečijen 16 mi přijde dost.


Jo, bacha na Windows updates...

technik007.cz
21.0526315789 %
21.0526315789 %
Příspěvky: 196
Registrován: stř 10 kvě, 2023 15:46
rok narození: 01 led 1981
ID CNT statistics: 15985
Bydliště: ostrovy

Re: PG Turnaj 2024 - testy a nastavení

#222 Příspěvek od technik007.cz »

No, po predchozich zkusenostech s aplikacema Primegridu se budu drzet klasicky hyperthreading off ( vypnuti HT na linuxu je otazka par sekund ) a 8 threads na 1 CCD nebo 8c/16t CPU.
Ale situaci na tymovych strojich budu sledovat.

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1492
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2024 - testy a nastavení

#223 Příspěvek od RoKro »

Honza píše: úte 12 lis, 2024 15:30 To vychází lépe, než dvě jednotky každá na jednom CCD?
Hele, to je hodně divný. Jasně, je to jinej procesor, ale přesto...
Moje testy balíčkové výsledky pro Ryzen 7900 (dva CCD po 6 jádrech /12 vláknech):
(počítáno se zapnutým HT)
1 úloha na 24 vláknech ... 1,4 ms per bit
1 úloha na 12 vláknech bez afinity ... také 1,4 ms per bit
1 úloha na 12 vláknech s afinitou na jedno CCD ... 1,2 ms per bit
2 úlohy každá na 12 vláknech s afinitou ... 1,2 ms per bit u každé jednotky, tzn. 0,6 ms per bit celkově
=> počítat 1 jednotku na všech 24 vláknech, logicky tedy bez afinity, dává jen 42% výkonu proti počítání dvou jednotek na 12 vláknech s afinitou.
Obrázek

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19891
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: PG Turnaj 2024 - testy a nastavení

#224 Příspěvek od forest »

U 9950X mně vycházelo 0.6 s afinitou na 1x16 a 1.25 na 2x8.
U 5950X s afinitou 1.22 na 1x16 a 3,1 když jsem dal 2x8.

Uvidíme v reálu při soutěži. Má někdo 5950X, nebo 9950X s lepšími výsledky, nebo jiným poměrem? Chápu, že mohou hrát roli i paměti, ale ty by měly mít vliv na výsledné časy, nikoliv nastavení.

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1492
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2024 - testy a nastavení

#225 Příspěvek od RoKro »

Aha, tak to jsem asi ještě část hraní s afinitou nepochopil a tudíž ani netestoval. Co si mám představit pod afinitou na 1x16? Těch 16 vláken je přece ve dvou CCD, tak se ta jednotka počítá sdíleně na obou CCD. Jak v tomhle případě funguje afinita a jak se dá/má ručně nastavit?
Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3388
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2024 - testy a nastavení

#226 Příspěvek od Honza »

O 2 hodinky pozdější start, no co se dá dělat...

Zkusil jsem 5950X a
2x8 mi píše kolem 2.0 každý, tedy 1.0
Varianta 1x16 mi dle očekávání vychází trochu hůř, kolem 1.17

Pro zajímavost 7800X3D jede kolem 1.09

ahorek
5.26315789474 %
5.26315789474 %
Příspěvky: 39
Registrován: stř 24 lis, 2021 16:47
rok narození: 16 zář 1990
ID CNT statistics: 2496
Bydliště: Praha

Re: PG Turnaj 2024 - testy a nastavení

#227 Příspěvek od ahorek »

5950x už se hodně potí, DDR4 bez AVX512 dělá svoje a Zen4/5 ho hravě poráží i na ECO.

jinak affinita u 1x16 nemá smysl řešit. Smyslem je, že plánovač úloh běžně přehazuje v nějakých intervalech práci mezi volnými jádry. To má smysl kvůli rovnoměrnému rozložení teploty a responzivitě systému, aby každá aplikace měla podobné právo na výpočetní prostředky. Problém je ale v tom, že přesun mezi CCD je ale pomalejší než v rámci jednoho chipletu, může být třeba přesypat cache apod. a pokud se děje často, má to negativní vliv na výkon (u specifických aplikací jako je primegrid). Proto je výhodné výpočetně náročné jednotky zamknout v rámci jednoho chipletu např 2x16, aby k těmto zbytečným a relativně pomalým přesunům nedocházelo.

ahorek
5.26315789474 %
5.26315789474 %
Příspěvky: 39
Registrován: stř 24 lis, 2021 16:47
rok narození: 16 zář 1990
ID CNT statistics: 2496
Bydliště: Praha

Re: PG Turnaj 2024 - testy a nastavení

#228 Příspěvek od ahorek »

porovnání zen4x5

7950x
package 90W @ 3.040 GHz
1.68% frontend cycles idle
1.24 insn per cycle
2.15% branch-misses
31.20% L1-dcache-load-misses

9950x
package 90W @ 2.240 GHz
2.97% frontend cycles idle
1.83 insn per cycle
0.61% branch-misses
54.28% L1-dcache-load-misses

efektivita při stejné spotřebě se sice o moc nezlepšila, ale lepší branch prediktor a ipc vidět je. Bez omezení spotřeby už 9950x jasně vítězí, protože v kombinaci s plným AVX512 vytáhne vyšší frekvence.

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1492
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2024 - testy a nastavení

#229 Příspěvek od RoKro »

ahorek píše: stř 13 lis, 2024 13:05 5950x už se hodně potí, DDR4 bez AVX512 dělá svoje a Zen4/5 ho hravě poráží i na ECO.

jinak affinita u 1x16 nemá smysl řešit. Smyslem je, že plánovač úloh běžně přehazuje v nějakých intervalech práci mezi volnými jádry. To má smysl kvůli rovnoměrnému rozložení teploty a responzivitě systému, aby každá aplikace měla podobné právo na výpočetní prostředky. Problém je ale v tom, že přesun mezi CCD je ale pomalejší než v rámci jednoho chipletu, může být třeba přesypat cache apod. a pokud se děje často, má to negativní vliv na výkon (u specifických aplikací jako je primegrid). Proto je výhodné výpočetně náročné jednotky zamknout v rámci jednoho chipletu např 2x16, aby k těmto zbytečným a relativně pomalým přesunům nedocházelo.
Tak to taky vnímám a proto nechápu, co a jak forest nastavil jako afinitu 1x16, že dosáhl takového pěkného výsledku.
Obrázek

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19891
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: PG Turnaj 2024 - testy a nastavení

#230 Příspěvek od forest »

Trochu chybně jsem se vyjádřil. Nastavil jsem u 1x16 výpočty pouze na fyzická jádra, jelikož vzdáleně nejde vypnout HT.
Bohužel jsem zjistil, že se to nastavení s další jednotkou rozhodí. Tedy fyzicky večer mašiny oběhnu s monitorem a HT na turnaj u všech natvrdo vypnu.

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1492
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2024 - testy a nastavení

#231 Příspěvek od RoKro »

Aha, zajímavé. Dík za vysvětlení.
Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3388
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2024 - testy a nastavení

#232 Příspěvek od Honza »

Sice je do turnaje ještě 14 dní, ale mám po ruce nový 9950X, tak jsem si říkal, že bude perspektivnější zkusit GFN21, než PSP.

U GFN zkouším kandidáta s b=1742320, který je zrovna rozpočítaný na grafice, takže aktuální jednotky.

4x4 - odhadovaný čas jednotek 80-120 hodin každá podle toho, jak je na tom zrovna která jednotka s cache, protože se do cache nevejdou. Tedy vše dle očekávání - takto nejspíše dopadnou CPU s malou cache.
2x8 - to je jiná liga, odhad kolem 18 hodin každý, tedy 1 za 9 hodin.

RTX 4070 Ti Super dá jednotku asi za necelé 3 hodiny (TDP 90%), s TDP 80% řekněme 3 hodiny.

technik007.cz
21.0526315789 %
21.0526315789 %
Příspěvky: 196
Registrován: stř 10 kvě, 2023 15:46
rok narození: 01 led 1981
ID CNT statistics: 15985
Bydliště: ostrovy

Re: PG Turnaj 2024 - testy a nastavení

#233 Příspěvek od technik007.cz »

S 4070 Super jsem na podobných časech, tj. cca 3h. Ta karta má navýšený počet SP jako Ti Super, ale nižší TDP než Ti Su. Už si nepamatuju jestli jsem dal TDP up na max, tj. 220W -> 242W. Asi jo.
Ještě tam musím dodat ventilátor směřující na backplate, protože dost hřeje a díky tomu PSU které je hned vedle (TB3 box) je hlučné. A pak v turnaji pojede na max i kdybych tam měl dát ventilátory 2.

Zajímalo by mě jak to jede dohromady s CPU appkou? Nezpomaluje to?

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1492
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2024 - testy a nastavení

#234 Příspěvek od RoKro »

RTX 3080 na defaultu ukazuje pro tohoto kandidáta čas asi 4 hodiny a 7 minut při souběžném počítání té samé jednotky na 7 CPU jádrech (z osmi). Bez zatížení CPU je odhadovaný čas výpočtu na GPU stejný. Čas na těch 7 jádrech CPU i7 12700K je asi 42 hodin.
Obrázek

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19891
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: PG Turnaj 2024 - testy a nastavení

#235 Příspěvek od forest »

technik007.cz píše: úte 26 lis, 2024 17:59 Zajímalo by mě jak to jede dohromady s CPU appkou? Nezpomaluje to?
To je přesně to, co se chystám rovněž prozkoumat, jak jsem psal v sousedním tématu. Tedy vyladit maximální výkon CPU, ale aby to nebrzdilo GPU. Jsem rád, že RoKro píše, že u něj k negativnímu ovlivňová nedochází.

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1492
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2024 - testy a nastavení

#236 Příspěvek od RoKro »

obrázek_2024-11-28_124211639.png
obrázek_2024-11-28_124211639.png (3.12 KiB) Zobrazeno 533 x
Myslím, že se ten vliv dá taky odhadnout z údajů o spočtené GPU jednotce. Čím menší CPU time vzhledem k Elapsed time, tím menší závislost GPU výpočtu na CPU a tudíž tím menší vzájemné zpomalování. Tady je ten CPU time jen jedna setina času výpočtu na GPU.
Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3388
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2024 - testy a nastavení

#237 Příspěvek od Honza »

GFN-21 turnaj je za 4 dny.
b se pohybuje kolem 1.8M, konkrétně třeba 1800656, na kterém lze testovat.

U GPU asi není moc co testovat, CPU by mělo jít rozumně škálovat podle CPU cache/CCD

Důležité ohlídat 2 věci - začátek turnaje a aktualizace Windows 45hh
Naposledy upravil(a) Honza dne ned 08 pro, 2024 09:38, celkem upraveno 1 x.

technik007.cz
21.0526315789 %
21.0526315789 %
Příspěvky: 196
Registrován: stř 10 kvě, 2023 15:46
rok narození: 01 led 1981
ID CNT statistics: 15985
Bydliště: ostrovy

Re: PG Turnaj 2024 - testy a nastavení

#238 Příspěvek od technik007.cz »

Ale je co na GPU testovat. Dal jsem +5% TDP a za 24h bez erroru. Teď jedu +10% TDP a přes noc 3 jednotky jsou ok a čas nejlepší 2h:50m.

Co se týká testů procesoru, tak tam u jednotky náročnosti 2-3dny v turnaji na 10dní není moc co zlepšovat, aby to mělo vliv na extra dokončenou jednotku navíc předpokládaje že využíváte předchozí nabyté znalosti, tj. 1 wu/CCD a HT off nebo afinita na fyz. jádra.

Pokud počítáte na iGPU, což je můj připad, protože test ukázal, že 780M umí wu za 2dny, tak je dobré dát -1 nebo -2 jádro pro CPU task. CPU a iGPU sharuje RAM a s nižším využitím CPU jsem zjistil, že iGPU dokáže dokončit wu pod 2 hodinky a to je zase extra wu navíc.

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1492
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2024 - testy a nastavení

#239 Příspěvek od RoKro »

Jak jsi nastavil, aby se počítalo na igpu? Testovací balíček to umí, ale v BOINCu mi jede jen RTX.

EDIT: Aha, tak ono si to o práci pro igpu říká, jen ji to nedostalo.
Obrázek

technik007.cz
21.0526315789 %
21.0526315789 %
Příspěvky: 196
Registrován: stř 10 kvě, 2023 15:46
rok narození: 01 led 1981
ID CNT statistics: 15985
Bydliště: ostrovy

Re: PG Turnaj 2024 - testy a nastavení

#240 Příspěvek od technik007.cz »

Mám iGPU od AMD a na primegridu je potřeba kromě Nvidie a CPU povolit i tuto kartu (možnost) nejenom v zahlaví projektu, ale i jednotlivých řádcích aplikací, v tomto případě pro GNF 21.

Nicméně jestli chceš použít ten iGPU, který je součástí Zen4/5 desktopových CPU, tak nebude asi mít dostatečný výkon ledaže by to byla G verze procesoru, např 8600G.

Odpovědět

Zpět na „Prime Grid“