PG Turnaj 2020 - testy a nastavení

PrimeGrid Challenge
Odpovědět
Zpráva
Autor
fobius
10.5263157895 %
10.5263157895 %
Příspěvky: 52
Registrován: ned 22 zář, 2019 22:04
ID CNT statistics: 13826
Bydliště: Praha - Kamenice

Re: Challenge Series - turnaj na Primegridu 2020

#161 Příspěvek od fobius »

Dělal někdo testy kolik vláken pustit na jeden task? Díky za info

Uživatelský avatar
porab
15.7894736842 %
15.7894736842 %
Příspěvky: 116
Registrován: sob 26 pro, 2009 09:19
ID CNT statistics: 12432

Re: Challenge Series - turnaj na Primegridu 2020

#162 Příspěvek od porab »

Ahoj, jestli jsem něco nepřehlídl tak na 3950x mi to vychází nejlíp pustit dvě vlákna na jednotku. Tzn. při zaplém SMT(HT) 16 úkolů.

Uživatelský avatar
RoKro
47.3684210526 %
47.3684210526 %
Příspěvky: 1119
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2020 - testy a nastavení

#163 Příspěvek od RoKro »

Nemá někdo nápad, proč mám na jednom pc, které počítá každou jednotku na dvou jádrech, čas Elapsed time výrazně vyšší, než polovinu Procesorového času?
U všech ostatních pc platí přibližně, že Procesorový čas = Elapsed time * počet jednotkou používaných jader.
Jen pro info, první dva řádky jsou šestijádra počítající 3 jednotky na 2 jádrech, třetí řádek je čtyřjádro počítající dvě jednotky na dvou jádrech. Nikde není HT.


EDIT: Jak jsem to odeslal, tak mi to asi došlo, že by zatížení CPU jinými procesy ...
Přílohy
obrázek_2020-10-20_202942.png
obrázek_2020-10-20_202942.png (15.73 KiB) Zobrazeno 845 x
Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 2806
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2020 - testy a nastavení

#164 Příspěvek od Honza »

Díky, žes to poslal.

Jmse si nevzpomněl, že bych se na tuto metriku mohl podívat a zkouknout nastavení, se kterým jsem si moc nehrál.

Našel jsem jeden zajímavý stroj. Je to Intel 6126, tedy 12-core, na kterém běží 3 virtuálky a jedna má 10 jader.
A v rámcí ní běží jednotky na 2-thready a vychází CPU time menší, než dvojnásek Elapsed time.
Prostě počítat na 2 thready se někdy vyplatí.

Kód: Vybrat vše

Host	Tasks	Firsts	First percentage	Send/receive duration	Elapsed time	CPU time
49	49	100.00	8,534 / 6,826 / 13,161	7,087 / 6,658 / 8,880	13,808 / 13,002 / 17,281
7 MEGAprimes: Obrázek Obrázek | TdP: Obrázek Obrázek Obrázek Obrázek Obrázek ObrázekObrázek 118568·5^3112069+1 a další nálezy
Obrázek

Uživatelský avatar
petnek
Moderátor
Moderátor
Příspěvky: 3625
Registrován: pon 28 led, 2008 12:44
rok narození: 16 kvě 1987
ID CNT statistics: 10883
Bydliště: Tábor
Kontaktovat uživatele:

Re: PG Turnaj 2020 - testy a nastavení

#165 Příspěvek od petnek »

fobius píše: pon 19 říj, 2020 12:05 Ahoj, mám klasický dotaz, jaké nastavení pro Ryzen 2700x doporučujete. Chvilku jsem počítal co jádro to úkol bez chyb a teď testuju 2x7 vláken za 1H:20min s warningama.
ASUS TUF B450, RAM 3466MHz XMP nedávali, ani ve windows, takže snížené 3400 a mám warning, teď zkouším 3333 MHz a uvidím.
Na Ryzen 5 2600 na B450 s RAM na 2400MHz jedu s HT, 3 WU, každá 4 logická vlákna, GPU projekty pozastavené. Jsou i lepší možnosti, ale podle mě ne s tak velkým rozdílem. Všechny jednotky bez warningu za 37000-40000s CPU time, krátké jednotky za 590s.

Kód: Vybrat vše

FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 1 worker):  0.54 ms.  Throughput: 1838.67 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 2 workers):  0.94,  0.95 ms.  Throughput: 2108.27 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 3 workers):  2.93,  1.42,  0.93 ms.  Throughput: 2118.20 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 4 workers):  3.12,  1.62,  3.32,  1.63 ms.  Throughput: 1853.43 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 6 workers):  2.83,  2.79,  2.85,  3.00,  2.87,  2.89 ms.  Throughput: 2089.48 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 1 worker):  0.57 ms.  Throughput: 1765.87 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 2 workers):  0.98,  0.99 ms.  Throughput: 2033.57 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 3 workers):  2.88,  1.41,  0.98 ms.  Throughput: 2071.89 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 4 workers):  2.99,  1.44,  2.75,  1.49 ms.  Throughput: 2067.72 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 6 workers):  3.24,  3.11,  3.00,  3.37,  3.11,  3.07 ms.  Throughput: 1907.74 iter/sec.
Pro zajímavost, noťas s i5-2410M, HT zapnuté, 1WU na všech 4 logických vláknech dává časy 47000s, krátké 750-880s.
Obrázek

Uživatelský avatar
Boby_cze
26.3157894737 %
26.3157894737 %
Příspěvky: 235
Registrován: čtv 16 dub, 2020 09:56
rok narození: 31 led 1971
ID CNT statistics: 27352
Bydliště: Jižní čechy

Re: PG Turnaj 2020 - testy a nastavení

#166 Příspěvek od Boby_cze »

Na notebooku i5-5500u mi při PG šly teploty strašně nahoru, tak jsem ho nechal na WCG kde je v pohodě. Škoda

Uživatelský avatar
RoKro
47.3684210526 %
47.3684210526 %
Příspěvky: 1119
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2020 - testy a nastavení

#167 Příspěvek od RoKro »

Honza píše: úte 20 říj, 2020 20:45 A v rámcí ní běží jednotky na 2-thready a vychází CPU time menší, než dvojnásek Elapsed time.
Prostě počítat na 2 thready se někdy vyplatí.
Asi jsem tě plně nepochopil, to vyznívá, jako kdyby to byla nějaká výhoda. Já si to vysvětluju tak, že CPU time je čas, kdy se vlákno skutečně věnovalo výpočtu PG jednotky (počet "tiknutí" věnovaných matematické operaci pro PG) a je to součet za všechna vlákna na jedné jednotce. Kdyby CPU nedělalo absolutně nic jiného a kdyby se vlákna na výpočtu podílela přesně stejným dílem, byl by elapsed time přesně polovinou CPU time (u dvou vláken na jednotku). Nikdy by nemohl být kratší, než ta polovina. A když je delší, tak to znamená, že ta vlákna se nepodílela přesně polovinou, a/nebo že dělala ještě něco jiného, což zdrželo dokončení výpočtu (prodloužilo elapsed time), ale nezapočítalo se to do CPU time, protože to byl jiný proces.
Takže tvůj případ, stejně jako můj označený na obrázku, znamená, že to CPU má kromě PG ještě jinou ne úplně nevýznamnou práci. U mně to byl Chrome, který bral 15-20% výkonu.
Nebo to chápu blbě?
Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 2806
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2020 - testy a nastavení

#168 Příspěvek od Honza »

Tím, že se jede na 2 vlákna, se může stát, že výpočet je rychlejší, než kdyby se jelo více jednotek po jednom vláknu.
Nastává to (nejspíš typicky) tehdy, kdy se při MT vejde jednotka do CPU cache a výpočet nejde (tolik) přes pomalou RAM.
Nemám přesně čísla, ale 321 má tuším u mě také nějaké nastavení, kdy na nějakém CPU je větší výtěžnost při MT, než běžném provozu bez MT.

Je to o škálovatelnosti, a ten sweet-spot může být u různých jednotek různě a u různých CPU/architektur různě.
V tomto ohledu jsem zvědavý na nové Ryzeny, protože ty současné 3950X jsou háklivé na nastavení afinit, jinak jde výkon HODNĚ dolů.

Nejhorší příklad - nativní 3950X, kde jede bez virtualizace a s ProcessLasso mi teď ukazuje 117 jednotek za posledních 24 hod. A to ještě krmí 2080Ti na GFN, běží tam Chrome (20 záložek), občas na něm pakuji 7Zip, Office, prostě všechno možné.
Druhý 3950X jede přes VMWare, je to stroj s jednou Win10 virtuálkou, ale nemá Processlasso a dělá pouze 56 jednotek, prostě polovinu. Nejspíš i blbé nastavení, jak koukám - jeden 3x5, kdežto ten produktivní jede 4x4+GFN.
Změním, zkusím pozorovat.

EDIT: Jo, některé jednotky už mají 480K FFT. Tedy pohybujeme se 384K, 400K a 480K
7 MEGAprimes: Obrázek Obrázek | TdP: Obrázek Obrázek Obrázek Obrázek Obrázek ObrázekObrázek 118568·5^3112069+1 a další nálezy
Obrázek

Uživatelský avatar
RoKro
47.3684210526 %
47.3684210526 %
Příspěvky: 1119
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2020 - testy a nastavení

#169 Příspěvek od RoKro »

Jojo, ten multithreading rozhodně výhody má a ideální nastavení (nejvíc spočítaných úloh za jednotku času) je opravdu pro různé CPU často hodně odlišné, zvlášť u typu úloh, kde FFT není ani z těch nejmenších (např. SGS nebo PPSE) ani z těch největších (SoB apod.), to pak různým mašinám chutnají různá nastavení.

Dejte sem, pokud to nechcete tajit, info, kolik (velkých, ne ověřovacích) turnajových jednotek počítají vaše CPU za den. Je to jednoduše vidět na titulní stránce vašeho účtu na PG, tam jsou údaje za posledních (klouzavých) 24 hodin. U mě je to:

Kód: Vybrat vše

i5-9600K	41
i7-8700K	51
i3-9100F	28
i5-4570		20
i7-9800X	105
Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 2806
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2020 - testy a nastavení

#170 Příspěvek od Honza »

Chtěl jsem se podívat, kolik mi počítá i7-9700K a zjistil jsem, že...nula.
Prostě po restartu aktualizacích jsem to neošetřil :oops:

Nejvíc mi chroupá dual xeon, 142 za den.
Z plnohodnotných strojů nejméně i5-4670 a sice 19 za den, takový trochu zapomenutý stroj.
7 MEGAprimes: Obrázek Obrázek | TdP: Obrázek Obrázek Obrázek Obrázek Obrázek ObrázekObrázek 118568·5^3112069+1 a další nálezy
Obrázek

Uživatelský avatar
RoKro
47.3684210526 %
47.3684210526 %
Příspěvky: 1119
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2020 - testy a nastavení

#171 Příspěvek od RoKro »

Tak to mi ze srovnání s tou 3950X to moje 9800X s polovinou jader a za poloviční cenu nevychází špatně, dobře jsem vybral, musím se pochválit ;-)
Obrázek

Albert
26.3157894737 %
26.3157894737 %
Příspěvky: 230
Registrován: úte 05 led, 2016 14:25
rok narození: 05 črc 1969
ID CNT statistics: 22548
Bydliště: Kotvrdovice

Re: PG Turnaj 2020 - testy a nastavení

#172 Příspěvek od Albert »

i5-7400 22wu/den
i7-8700 35wu/den
3700X 56wu/den
8260 146wu/den

Uživatelský avatar
Boby_cze
26.3157894737 %
26.3157894737 %
Příspěvky: 235
Registrován: čtv 16 dub, 2020 09:56
rok narození: 31 led 1971
ID CNT statistics: 27352
Bydliště: Jižní čechy

Re: PG Turnaj 2020 - testy a nastavení

#173 Příspěvek od Boby_cze »

i7-3770 15
i7-870 8
i5-3470 17
i5-3470 18
i5-3470 19
i5-3470 16

koukam jak velky rozdily jsou bez AVX, s AVX, AVX2, a u novych AVX512

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 2806
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2020 - testy a nastavení

#174 Příspěvek od Honza »

RoKro píše: stř 21 říj, 2020 16:42Tak to mi ze srovnání s tou 3950X to moje 9800X s polovinou jader a za poloviční cenu nevychází špatně, dobře jsem vybral, musím se pochválit ;-)
jj, AVX-512 je prostě u LLR znát.
Viz Albretuv 8260 24-core.

Je to ale i o nastavení - jeden stroj má 117 (kdybych na něm nic nedělal, bylo by to trošku víc), ten druhý ve virtuálu má aktuálně 54.
Mimochodem, spotřebu mám myslím 115W.
Kolik si papá 9800X?
Z hlediska spotřeba/výkon na tom bude 3950 třeba 3x lépe.
7 MEGAprimes: Obrázek Obrázek | TdP: Obrázek Obrázek Obrázek Obrázek Obrázek ObrázekObrázek 118568·5^3112069+1 a další nálezy
Obrázek

Uživatelský avatar
RoKro
47.3684210526 %
47.3684210526 %
Příspěvky: 1119
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2020 - testy a nastavení

#175 Příspěvek od RoKro »

Spotřeba - dle HWmonitoru aktuálně žere sám procesor 165W.
Když jsem testoval tvůj balíček, žralo to pecko na zásuvce 323W, ale to jsem testoval na 4,1GHz a teď počítám výrazně níž na 3,6GHz, takže ta spotřeba bude asi možná i o nějakou desítku wattů nižší (už to nemám na wattmetru, tak nevím přesně). Navíc tam jede vodní pumpa a 7 ventilátorů.
Pořizoval jsem to s vědomím, že z pohledu spotřeby to bude míň výhodný, než ryzeny, ale to pc (až ho dodělám) pojede v baráku, kde se topí elektřinou, takže půl roku pojede "zadarmo", o to míň šťávy si bude brát kotlík. A i v létě pořád pojede za nižší sazbu, než mám v paneláku. To jen na vysvětlenou.
Tvých 115W je na zásuvce? To asi ne ...
Ten cenový rozdíl řádově 10 tisíc, to je pěkných pár kWh, které můžu proti 3950X navíc propálit :-) To je tak na tři roky? A to je morální životnost procesoru :-D Přeháním, ta je možná i 4 tady v naší komunitě bláznivých počtářů ;-)
Tohle není flame amd x intel, kdybych ho pořizoval domů a nechtěl ho výhradně na PG LLR, tak bych rozhodně vážně uvažoval i o ryzenech. Jde mi ale jen o srovnání, jestli jsem to i tak neměl udělat (jenže ve stejné cenové kategorii bych sice šetřil elektřinu, ale měl bych výrazně nižší výkon).

Upřímně - Albertův 24 core, tam mi těch 146 jednotek za den připadá jako JENOM 146 jednotek. To fakt jede na plný nebo skoro plný výkon? CPu za cenu +/- 100 litrů a nedělá ani dvojnásobek toho co tvůj ryzen nebo moje osmijádro? Co mi uniká ... furt si říkám, že něco musí ... není to už pro PG málo, jen dvě AVX-512 jednotky na 24 jader?
Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 2806
Registrován: pát 03 lis, 2006 10:46

Re: PG Turnaj 2020 - testy a nastavení

#176 Příspěvek od Honza »

To musí říct Albert, ale ten Xeon asi pojede na trochu jiné frekvenci, aby se uchladil.
3950X nebo tvůj 9800X pojede na frekvenci cca +50% co ten Xeon (nebo můj dual CPU kombajn)
7 MEGAprimes: Obrázek Obrázek | TdP: Obrázek Obrázek Obrázek Obrázek Obrázek ObrázekObrázek 118568·5^3112069+1 a další nálezy
Obrázek

Uživatelský avatar
RoKro
47.3684210526 %
47.3684210526 %
Příspěvky: 1119
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2020 - testy a nastavení

#177 Příspěvek od RoKro »

To je celkem jedno, jaký je důvod, ale stojí 10x víc, jader má 4x víc, ale počítá jenom 1,5x víc ... to mi hlava nebere.
Zase, nemyslím to jako hejt, jen nahlas přemýšlím.
Obrázek

Albert
26.3157894737 %
26.3157894737 %
Příspěvky: 230
Registrován: úte 05 led, 2016 14:25
rok narození: 05 črc 1969
ID CNT statistics: 22548
Bydliště: Kotvrdovice

Re: PG Turnaj 2020 - testy a nastavení

#178 Příspěvek od Albert »

Pokud počítají všechna fyzická jádra, tak 8260 při výpočtech AVX-512 jede na 2,0GHz. Není to ostrá verze (ani ta by nejela na o moc vyšším kmitoštu), mám ES (engineering sample) a má tím pádem sníženou frekvenci o 200MHz. A samozřejmě stál zlomek ceny, jinak bych si jej nekoupil 45ff . Mám jej téměř rok a jsem spokojen s jeho účinností, spotřeba je okolo 220 až 250W při plné zátěži.

Uživatelský avatar
RoKro
47.3684210526 %
47.3684210526 %
Příspěvky: 1119
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: PG Turnaj 2020 - testy a nastavení

#179 Příspěvek od RoKro »

Aha, dík za ujasnění.
Obrázek

Albert
26.3157894737 %
26.3157894737 %
Příspěvky: 230
Registrován: úte 05 led, 2016 14:25
rok narození: 05 črc 1969
ID CNT statistics: 22548
Bydliště: Kotvrdovice

Re: PG Turnaj 2020 - testy a nastavení

#180 Příspěvek od Albert »

Ještě poznámka k těm frekvencím. 8260 je zrecyklovaná 8160 a platí tedy tato tabulka. Nicméně je fakt, že AMD se se svými CPU pro spotřební segment trhu postupně dostává výkonově do úrovně Xeonů Gold a Platinum. A to je dobře.
Přílohy
avx512.png
avx512.png (210.52 KiB) Zobrazeno 728 x

Odpovědět

Zpět na „Prime Grid“