PG Turnaj 2024 - testy a nastavení
Re: PG Turnaj 2024 - testy a nastavení
To vychází lépe, než dvě jednotky každá na jednom CCD?
Hmm, asi malá cache, u 3D verzí to vypadá jinak.
I z tohoto pohledu by 9800X3D mohla být výborná volba - velká cache, jeden CCD, nebude se zde tak projevoval limit škálování počtu treadů..přečijen 16 mi přijde dost.
Jo, bacha na Windows updates...
Hmm, asi malá cache, u 3D verzí to vypadá jinak.
I z tohoto pohledu by 9800X3D mohla být výborná volba - velká cache, jeden CCD, nebude se zde tak projevoval limit škálování počtu treadů..přečijen 16 mi přijde dost.
Jo, bacha na Windows updates...
-
- 21.0526315789 %
- Příspěvky: 196
- Registrován: stř 10 kvě, 2023 15:46
- rok narození: 01 led 1981
- ID CNT statistics: 15985
- Bydliště: ostrovy
Re: PG Turnaj 2024 - testy a nastavení
No, po predchozich zkusenostech s aplikacema Primegridu se budu drzet klasicky hyperthreading off ( vypnuti HT na linuxu je otazka par sekund ) a 8 threads na 1 CCD nebo 8c/16t CPU.
Ale situaci na tymovych strojich budu sledovat.
Ale situaci na tymovych strojich budu sledovat.
- RoKro
- 52.6315789474 %
- Příspěvky: 1492
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2024 - testy a nastavení
Hele, to je hodně divný. Jasně, je to jinej procesor, ale přesto...
Moje testy balíčkové výsledky pro Ryzen 7900 (dva CCD po 6 jádrech /12 vláknech):
(počítáno se zapnutým HT)
1 úloha na 24 vláknech ... 1,4 ms per bit
1 úloha na 12 vláknech bez afinity ... také 1,4 ms per bit
1 úloha na 12 vláknech s afinitou na jedno CCD ... 1,2 ms per bit
2 úlohy každá na 12 vláknech s afinitou ... 1,2 ms per bit u každé jednotky, tzn. 0,6 ms per bit celkově
=> počítat 1 jednotku na všech 24 vláknech, logicky tedy bez afinity, dává jen 42% výkonu proti počítání dvou jednotek na 12 vláknech s afinitou.
- forest
- Admin webu a fóra CNT
- Příspěvky: 19891
- Registrován: pát 27 říj, 2006 10:19
- rok narození: 03 bře 1977
- ID CNT statistics: 71
- Bydliště: Újezd u Brna
Re: PG Turnaj 2024 - testy a nastavení
U 9950X mně vycházelo 0.6 s afinitou na 1x16 a 1.25 na 2x8.
U 5950X s afinitou 1.22 na 1x16 a 3,1 když jsem dal 2x8.
Uvidíme v reálu při soutěži. Má někdo 5950X, nebo 9950X s lepšími výsledky, nebo jiným poměrem? Chápu, že mohou hrát roli i paměti, ale ty by měly mít vliv na výsledné časy, nikoliv nastavení.
U 5950X s afinitou 1.22 na 1x16 a 3,1 když jsem dal 2x8.
Uvidíme v reálu při soutěži. Má někdo 5950X, nebo 9950X s lepšími výsledky, nebo jiným poměrem? Chápu, že mohou hrát roli i paměti, ale ty by měly mít vliv na výsledné časy, nikoliv nastavení.
- RoKro
- 52.6315789474 %
- Příspěvky: 1492
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2024 - testy a nastavení
Aha, tak to jsem asi ještě část hraní s afinitou nepochopil a tudíž ani netestoval. Co si mám představit pod afinitou na 1x16? Těch 16 vláken je přece ve dvou CCD, tak se ta jednotka počítá sdíleně na obou CCD. Jak v tomhle případě funguje afinita a jak se dá/má ručně nastavit?
Re: PG Turnaj 2024 - testy a nastavení
O 2 hodinky pozdější start, no co se dá dělat...
Zkusil jsem 5950X a
2x8 mi píše kolem 2.0 každý, tedy 1.0
Varianta 1x16 mi dle očekávání vychází trochu hůř, kolem 1.17
Pro zajímavost 7800X3D jede kolem 1.09
Zkusil jsem 5950X a
2x8 mi píše kolem 2.0 každý, tedy 1.0
Varianta 1x16 mi dle očekávání vychází trochu hůř, kolem 1.17
Pro zajímavost 7800X3D jede kolem 1.09
-
- 5.26315789474 %
- Příspěvky: 39
- Registrován: stř 24 lis, 2021 16:47
- rok narození: 16 zář 1990
- ID CNT statistics: 2496
- Bydliště: Praha
Re: PG Turnaj 2024 - testy a nastavení
5950x už se hodně potí, DDR4 bez AVX512 dělá svoje a Zen4/5 ho hravě poráží i na ECO.
jinak affinita u 1x16 nemá smysl řešit. Smyslem je, že plánovač úloh běžně přehazuje v nějakých intervalech práci mezi volnými jádry. To má smysl kvůli rovnoměrnému rozložení teploty a responzivitě systému, aby každá aplikace měla podobné právo na výpočetní prostředky. Problém je ale v tom, že přesun mezi CCD je ale pomalejší než v rámci jednoho chipletu, může být třeba přesypat cache apod. a pokud se děje často, má to negativní vliv na výkon (u specifických aplikací jako je primegrid). Proto je výhodné výpočetně náročné jednotky zamknout v rámci jednoho chipletu např 2x16, aby k těmto zbytečným a relativně pomalým přesunům nedocházelo.
jinak affinita u 1x16 nemá smysl řešit. Smyslem je, že plánovač úloh běžně přehazuje v nějakých intervalech práci mezi volnými jádry. To má smysl kvůli rovnoměrnému rozložení teploty a responzivitě systému, aby každá aplikace měla podobné právo na výpočetní prostředky. Problém je ale v tom, že přesun mezi CCD je ale pomalejší než v rámci jednoho chipletu, může být třeba přesypat cache apod. a pokud se děje často, má to negativní vliv na výkon (u specifických aplikací jako je primegrid). Proto je výhodné výpočetně náročné jednotky zamknout v rámci jednoho chipletu např 2x16, aby k těmto zbytečným a relativně pomalým přesunům nedocházelo.
-
- 5.26315789474 %
- Příspěvky: 39
- Registrován: stř 24 lis, 2021 16:47
- rok narození: 16 zář 1990
- ID CNT statistics: 2496
- Bydliště: Praha
Re: PG Turnaj 2024 - testy a nastavení
porovnání zen4x5
7950x
package 90W @ 3.040 GHz
1.68% frontend cycles idle
1.24 insn per cycle
2.15% branch-misses
31.20% L1-dcache-load-misses
9950x
package 90W @ 2.240 GHz
2.97% frontend cycles idle
1.83 insn per cycle
0.61% branch-misses
54.28% L1-dcache-load-misses
efektivita při stejné spotřebě se sice o moc nezlepšila, ale lepší branch prediktor a ipc vidět je. Bez omezení spotřeby už 9950x jasně vítězí, protože v kombinaci s plným AVX512 vytáhne vyšší frekvence.
7950x
package 90W @ 3.040 GHz
1.68% frontend cycles idle
1.24 insn per cycle
2.15% branch-misses
31.20% L1-dcache-load-misses
9950x
package 90W @ 2.240 GHz
2.97% frontend cycles idle
1.83 insn per cycle
0.61% branch-misses
54.28% L1-dcache-load-misses
efektivita při stejné spotřebě se sice o moc nezlepšila, ale lepší branch prediktor a ipc vidět je. Bez omezení spotřeby už 9950x jasně vítězí, protože v kombinaci s plným AVX512 vytáhne vyšší frekvence.
- RoKro
- 52.6315789474 %
- Příspěvky: 1492
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2024 - testy a nastavení
Tak to taky vnímám a proto nechápu, co a jak forest nastavil jako afinitu 1x16, že dosáhl takového pěkného výsledku.ahorek píše: ↑stř 13 lis, 2024 13:05 5950x už se hodně potí, DDR4 bez AVX512 dělá svoje a Zen4/5 ho hravě poráží i na ECO.
jinak affinita u 1x16 nemá smysl řešit. Smyslem je, že plánovač úloh běžně přehazuje v nějakých intervalech práci mezi volnými jádry. To má smysl kvůli rovnoměrnému rozložení teploty a responzivitě systému, aby každá aplikace měla podobné právo na výpočetní prostředky. Problém je ale v tom, že přesun mezi CCD je ale pomalejší než v rámci jednoho chipletu, může být třeba přesypat cache apod. a pokud se děje často, má to negativní vliv na výkon (u specifických aplikací jako je primegrid). Proto je výhodné výpočetně náročné jednotky zamknout v rámci jednoho chipletu např 2x16, aby k těmto zbytečným a relativně pomalým přesunům nedocházelo.
- forest
- Admin webu a fóra CNT
- Příspěvky: 19891
- Registrován: pát 27 říj, 2006 10:19
- rok narození: 03 bře 1977
- ID CNT statistics: 71
- Bydliště: Újezd u Brna
Re: PG Turnaj 2024 - testy a nastavení
Trochu chybně jsem se vyjádřil. Nastavil jsem u 1x16 výpočty pouze na fyzická jádra, jelikož vzdáleně nejde vypnout HT.
Bohužel jsem zjistil, že se to nastavení s další jednotkou rozhodí. Tedy fyzicky večer mašiny oběhnu s monitorem a HT na turnaj u všech natvrdo vypnu.
Bohužel jsem zjistil, že se to nastavení s další jednotkou rozhodí. Tedy fyzicky večer mašiny oběhnu s monitorem a HT na turnaj u všech natvrdo vypnu.
- RoKro
- 52.6315789474 %
- Příspěvky: 1492
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2024 - testy a nastavení
Aha, zajímavé. Dík za vysvětlení.
Re: PG Turnaj 2024 - testy a nastavení
Sice je do turnaje ještě 14 dní, ale mám po ruce nový 9950X, tak jsem si říkal, že bude perspektivnější zkusit GFN21, než PSP.
U GFN zkouším kandidáta s b=1742320, který je zrovna rozpočítaný na grafice, takže aktuální jednotky.
4x4 - odhadovaný čas jednotek 80-120 hodin každá podle toho, jak je na tom zrovna která jednotka s cache, protože se do cache nevejdou. Tedy vše dle očekávání - takto nejspíše dopadnou CPU s malou cache.
2x8 - to je jiná liga, odhad kolem 18 hodin každý, tedy 1 za 9 hodin.
RTX 4070 Ti Super dá jednotku asi za necelé 3 hodiny (TDP 90%), s TDP 80% řekněme 3 hodiny.
U GFN zkouším kandidáta s b=1742320, který je zrovna rozpočítaný na grafice, takže aktuální jednotky.
4x4 - odhadovaný čas jednotek 80-120 hodin každá podle toho, jak je na tom zrovna která jednotka s cache, protože se do cache nevejdou. Tedy vše dle očekávání - takto nejspíše dopadnou CPU s malou cache.
2x8 - to je jiná liga, odhad kolem 18 hodin každý, tedy 1 za 9 hodin.
RTX 4070 Ti Super dá jednotku asi za necelé 3 hodiny (TDP 90%), s TDP 80% řekněme 3 hodiny.
-
- 21.0526315789 %
- Příspěvky: 196
- Registrován: stř 10 kvě, 2023 15:46
- rok narození: 01 led 1981
- ID CNT statistics: 15985
- Bydliště: ostrovy
Re: PG Turnaj 2024 - testy a nastavení
S 4070 Super jsem na podobných časech, tj. cca 3h. Ta karta má navýšený počet SP jako Ti Super, ale nižší TDP než Ti Su. Už si nepamatuju jestli jsem dal TDP up na max, tj. 220W -> 242W. Asi jo.
Ještě tam musím dodat ventilátor směřující na backplate, protože dost hřeje a díky tomu PSU které je hned vedle (TB3 box) je hlučné. A pak v turnaji pojede na max i kdybych tam měl dát ventilátory 2.
Zajímalo by mě jak to jede dohromady s CPU appkou? Nezpomaluje to?
Ještě tam musím dodat ventilátor směřující na backplate, protože dost hřeje a díky tomu PSU které je hned vedle (TB3 box) je hlučné. A pak v turnaji pojede na max i kdybych tam měl dát ventilátory 2.
Zajímalo by mě jak to jede dohromady s CPU appkou? Nezpomaluje to?
- RoKro
- 52.6315789474 %
- Příspěvky: 1492
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2024 - testy a nastavení
RTX 3080 na defaultu ukazuje pro tohoto kandidáta čas asi 4 hodiny a 7 minut při souběžném počítání té samé jednotky na 7 CPU jádrech (z osmi). Bez zatížení CPU je odhadovaný čas výpočtu na GPU stejný. Čas na těch 7 jádrech CPU i7 12700K je asi 42 hodin.
- forest
- Admin webu a fóra CNT
- Příspěvky: 19891
- Registrován: pát 27 říj, 2006 10:19
- rok narození: 03 bře 1977
- ID CNT statistics: 71
- Bydliště: Újezd u Brna
Re: PG Turnaj 2024 - testy a nastavení
To je přesně to, co se chystám rovněž prozkoumat, jak jsem psal v sousedním tématu. Tedy vyladit maximální výkon CPU, ale aby to nebrzdilo GPU. Jsem rád, že RoKro píše, že u něj k negativnímu ovlivňová nedochází.technik007.cz píše: ↑úte 26 lis, 2024 17:59 Zajímalo by mě jak to jede dohromady s CPU appkou? Nezpomaluje to?
- RoKro
- 52.6315789474 %
- Příspěvky: 1492
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2024 - testy a nastavení
Myslím, že se ten vliv dá taky odhadnout z údajů o spočtené GPU jednotce. Čím menší CPU time vzhledem k Elapsed time, tím menší závislost GPU výpočtu na CPU a tudíž tím menší vzájemné zpomalování. Tady je ten CPU time jen jedna setina času výpočtu na GPU.
Re: PG Turnaj 2024 - testy a nastavení
GFN-21 turnaj je za 4 dny.
b se pohybuje kolem 1.8M, konkrétně třeba 1800656, na kterém lze testovat.
U GPU asi není moc co testovat, CPU by mělo jít rozumně škálovat podle CPU cache/CCD
Důležité ohlídat 2 věci - začátek turnaje a aktualizace Windows
b se pohybuje kolem 1.8M, konkrétně třeba 1800656, na kterém lze testovat.
U GPU asi není moc co testovat, CPU by mělo jít rozumně škálovat podle CPU cache/CCD
Důležité ohlídat 2 věci - začátek turnaje a aktualizace Windows
Naposledy upravil(a) Honza dne ned 08 pro, 2024 09:38, celkem upraveno 1 x.
-
- 21.0526315789 %
- Příspěvky: 196
- Registrován: stř 10 kvě, 2023 15:46
- rok narození: 01 led 1981
- ID CNT statistics: 15985
- Bydliště: ostrovy
Re: PG Turnaj 2024 - testy a nastavení
Ale je co na GPU testovat. Dal jsem +5% TDP a za 24h bez erroru. Teď jedu +10% TDP a přes noc 3 jednotky jsou ok a čas nejlepší 2h:50m.
Co se týká testů procesoru, tak tam u jednotky náročnosti 2-3dny v turnaji na 10dní není moc co zlepšovat, aby to mělo vliv na extra dokončenou jednotku navíc předpokládaje že využíváte předchozí nabyté znalosti, tj. 1 wu/CCD a HT off nebo afinita na fyz. jádra.
Pokud počítáte na iGPU, což je můj připad, protože test ukázal, že 780M umí wu za 2dny, tak je dobré dát -1 nebo -2 jádro pro CPU task. CPU a iGPU sharuje RAM a s nižším využitím CPU jsem zjistil, že iGPU dokáže dokončit wu pod 2 hodinky a to je zase extra wu navíc.
Co se týká testů procesoru, tak tam u jednotky náročnosti 2-3dny v turnaji na 10dní není moc co zlepšovat, aby to mělo vliv na extra dokončenou jednotku navíc předpokládaje že využíváte předchozí nabyté znalosti, tj. 1 wu/CCD a HT off nebo afinita na fyz. jádra.
Pokud počítáte na iGPU, což je můj připad, protože test ukázal, že 780M umí wu za 2dny, tak je dobré dát -1 nebo -2 jádro pro CPU task. CPU a iGPU sharuje RAM a s nižším využitím CPU jsem zjistil, že iGPU dokáže dokončit wu pod 2 hodinky a to je zase extra wu navíc.
- RoKro
- 52.6315789474 %
- Příspěvky: 1492
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2024 - testy a nastavení
Jak jsi nastavil, aby se počítalo na igpu? Testovací balíček to umí, ale v BOINCu mi jede jen RTX.
EDIT: Aha, tak ono si to o práci pro igpu říká, jen ji to nedostalo.
EDIT: Aha, tak ono si to o práci pro igpu říká, jen ji to nedostalo.
-
- 21.0526315789 %
- Příspěvky: 196
- Registrován: stř 10 kvě, 2023 15:46
- rok narození: 01 led 1981
- ID CNT statistics: 15985
- Bydliště: ostrovy
Re: PG Turnaj 2024 - testy a nastavení
Mám iGPU od AMD a na primegridu je potřeba kromě Nvidie a CPU povolit i tuto kartu (možnost) nejenom v zahlaví projektu, ale i jednotlivých řádcích aplikací, v tomto případě pro GNF 21.
Nicméně jestli chceš použít ten iGPU, který je součástí Zen4/5 desktopových CPU, tak nebude asi mít dostatečný výkon ledaže by to byla G verze procesoru, např 8600G.
Nicméně jestli chceš použít ten iGPU, který je součástí Zen4/5 desktopových CPU, tak nebude asi mít dostatečný výkon ledaže by to byla G verze procesoru, např 8600G.