PG Turnaj 2020 - testy a nastavení
-
- 10.5263157895 %
- Příspěvky: 52
- Registrován: ned 22 zář, 2019 22:04
- ID CNT statistics: 13826
- Bydliště: Praha - Kamenice
Re: Challenge Series - turnaj na Primegridu 2020
Dělal někdo testy kolik vláken pustit na jeden task? Díky za info
Re: Challenge Series - turnaj na Primegridu 2020
Ahoj, jestli jsem něco nepřehlídl tak na 3950x mi to vychází nejlíp pustit dvě vlákna na jednotku. Tzn. při zaplém SMT(HT) 16 úkolů.
- RoKro
- 47.3684210526 %
- Příspěvky: 1119
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2020 - testy a nastavení
Nemá někdo nápad, proč mám na jednom pc, které počítá každou jednotku na dvou jádrech, čas Elapsed time výrazně vyšší, než polovinu Procesorového času?
U všech ostatních pc platí přibližně, že Procesorový čas = Elapsed time * počet jednotkou používaných jader.
Jen pro info, první dva řádky jsou šestijádra počítající 3 jednotky na 2 jádrech, třetí řádek je čtyřjádro počítající dvě jednotky na dvou jádrech. Nikde není HT.
EDIT: Jak jsem to odeslal, tak mi to asi došlo, že by zatížení CPU jinými procesy ...
U všech ostatních pc platí přibližně, že Procesorový čas = Elapsed time * počet jednotkou používaných jader.
Jen pro info, první dva řádky jsou šestijádra počítající 3 jednotky na 2 jádrech, třetí řádek je čtyřjádro počítající dvě jednotky na dvou jádrech. Nikde není HT.
EDIT: Jak jsem to odeslal, tak mi to asi došlo, že by zatížení CPU jinými procesy ...
- Přílohy
-
- obrázek_2020-10-20_202942.png (15.73 KiB) Zobrazeno 845 x

Re: PG Turnaj 2020 - testy a nastavení
Díky, žes to poslal.
Jmse si nevzpomněl, že bych se na tuto metriku mohl podívat a zkouknout nastavení, se kterým jsem si moc nehrál.
Našel jsem jeden zajímavý stroj. Je to Intel 6126, tedy 12-core, na kterém běží 3 virtuálky a jedna má 10 jader.
A v rámcí ní běží jednotky na 2-thready a vychází CPU time menší, než dvojnásek Elapsed time.
Prostě počítat na 2 thready se někdy vyplatí.
Jmse si nevzpomněl, že bych se na tuto metriku mohl podívat a zkouknout nastavení, se kterým jsem si moc nehrál.
Našel jsem jeden zajímavý stroj. Je to Intel 6126, tedy 12-core, na kterém běží 3 virtuálky a jedna má 10 jader.
A v rámcí ní běží jednotky na 2-thready a vychází CPU time menší, než dvojnásek Elapsed time.
Prostě počítat na 2 thready se někdy vyplatí.
Kód: Vybrat vše
Host Tasks Firsts First percentage Send/receive duration Elapsed time CPU time
49 49 100.00 8,534 / 6,826 / 13,161 7,087 / 6,658 / 8,880 13,808 / 13,002 / 17,281
- petnek
- Moderátor
- Příspěvky: 3625
- Registrován: pon 28 led, 2008 12:44
- rok narození: 16 kvě 1987
- ID CNT statistics: 10883
- Bydliště: Tábor
- Kontaktovat uživatele:
Re: PG Turnaj 2020 - testy a nastavení
Na Ryzen 5 2600 na B450 s RAM na 2400MHz jedu s HT, 3 WU, každá 4 logická vlákna, GPU projekty pozastavené. Jsou i lepší možnosti, ale podle mě ne s tak velkým rozdílem. Všechny jednotky bez warningu za 37000-40000s CPU time, krátké jednotky za 590s.fobius píše: ↑pon 19 říj, 2020 12:05 Ahoj, mám klasický dotaz, jaké nastavení pro Ryzen 2700x doporučujete. Chvilku jsem počítal co jádro to úkol bez chyb a teď testuju 2x7 vláken za 1H:20min s warningama.
ASUS TUF B450, RAM 3466MHz XMP nedávali, ani ve windows, takže snížené 3400 a mám warning, teď zkouším 3333 MHz a uvidím.
Kód: Vybrat vše
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 1 worker): 0.54 ms. Throughput: 1838.67 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 2 workers): 0.94, 0.95 ms. Throughput: 2108.27 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 3 workers): 2.93, 1.42, 0.93 ms. Throughput: 2118.20 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 4 workers): 3.12, 1.62, 3.32, 1.63 ms. Throughput: 1853.43 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores, 6 workers): 2.83, 2.79, 2.85, 3.00, 2.87, 2.89 ms. Throughput: 2089.48 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 1 worker): 0.57 ms. Throughput: 1765.87 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 2 workers): 0.98, 0.99 ms. Throughput: 2033.57 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 3 workers): 2.88, 1.41, 0.98 ms. Throughput: 2071.89 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 4 workers): 2.99, 1.44, 2.75, 1.49 ms. Throughput: 2067.72 iter/sec.
FFTlen=384K all-complex, Type=3, Arch=4, Pass1=128, Pass2=3072, clm=4 (6 cores hyperthreaded, 6 workers): 3.24, 3.11, 3.00, 3.37, 3.11, 3.07 ms. Throughput: 1907.74 iter/sec.

- Boby_cze
- 26.3157894737 %
- Příspěvky: 235
- Registrován: čtv 16 dub, 2020 09:56
- rok narození: 31 led 1971
- ID CNT statistics: 27352
- Bydliště: Jižní čechy
Re: PG Turnaj 2020 - testy a nastavení
Na notebooku i5-5500u mi při PG šly teploty strašně nahoru, tak jsem ho nechal na WCG kde je v pohodě. Škoda
- RoKro
- 47.3684210526 %
- Příspěvky: 1119
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2020 - testy a nastavení
Asi jsem tě plně nepochopil, to vyznívá, jako kdyby to byla nějaká výhoda. Já si to vysvětluju tak, že CPU time je čas, kdy se vlákno skutečně věnovalo výpočtu PG jednotky (počet "tiknutí" věnovaných matematické operaci pro PG) a je to součet za všechna vlákna na jedné jednotce. Kdyby CPU nedělalo absolutně nic jiného a kdyby se vlákna na výpočtu podílela přesně stejným dílem, byl by elapsed time přesně polovinou CPU time (u dvou vláken na jednotku). Nikdy by nemohl být kratší, než ta polovina. A když je delší, tak to znamená, že ta vlákna se nepodílela přesně polovinou, a/nebo že dělala ještě něco jiného, což zdrželo dokončení výpočtu (prodloužilo elapsed time), ale nezapočítalo se to do CPU time, protože to byl jiný proces.
Takže tvůj případ, stejně jako můj označený na obrázku, znamená, že to CPU má kromě PG ještě jinou ne úplně nevýznamnou práci. U mně to byl Chrome, který bral 15-20% výkonu.
Nebo to chápu blbě?

Re: PG Turnaj 2020 - testy a nastavení
Tím, že se jede na 2 vlákna, se může stát, že výpočet je rychlejší, než kdyby se jelo více jednotek po jednom vláknu.
Nastává to (nejspíš typicky) tehdy, kdy se při MT vejde jednotka do CPU cache a výpočet nejde (tolik) přes pomalou RAM.
Nemám přesně čísla, ale 321 má tuším u mě také nějaké nastavení, kdy na nějakém CPU je větší výtěžnost při MT, než běžném provozu bez MT.
Je to o škálovatelnosti, a ten sweet-spot může být u různých jednotek různě a u různých CPU/architektur různě.
V tomto ohledu jsem zvědavý na nové Ryzeny, protože ty současné 3950X jsou háklivé na nastavení afinit, jinak jde výkon HODNĚ dolů.
Nejhorší příklad - nativní 3950X, kde jede bez virtualizace a s ProcessLasso mi teď ukazuje 117 jednotek za posledních 24 hod. A to ještě krmí 2080Ti na GFN, běží tam Chrome (20 záložek), občas na něm pakuji 7Zip, Office, prostě všechno možné.
Druhý 3950X jede přes VMWare, je to stroj s jednou Win10 virtuálkou, ale nemá Processlasso a dělá pouze 56 jednotek, prostě polovinu. Nejspíš i blbé nastavení, jak koukám - jeden 3x5, kdežto ten produktivní jede 4x4+GFN.
Změním, zkusím pozorovat.
EDIT: Jo, některé jednotky už mají 480K FFT. Tedy pohybujeme se 384K, 400K a 480K
Nastává to (nejspíš typicky) tehdy, kdy se při MT vejde jednotka do CPU cache a výpočet nejde (tolik) přes pomalou RAM.
Nemám přesně čísla, ale 321 má tuším u mě také nějaké nastavení, kdy na nějakém CPU je větší výtěžnost při MT, než běžném provozu bez MT.
Je to o škálovatelnosti, a ten sweet-spot může být u různých jednotek různě a u různých CPU/architektur různě.
V tomto ohledu jsem zvědavý na nové Ryzeny, protože ty současné 3950X jsou háklivé na nastavení afinit, jinak jde výkon HODNĚ dolů.
Nejhorší příklad - nativní 3950X, kde jede bez virtualizace a s ProcessLasso mi teď ukazuje 117 jednotek za posledních 24 hod. A to ještě krmí 2080Ti na GFN, běží tam Chrome (20 záložek), občas na něm pakuji 7Zip, Office, prostě všechno možné.
Druhý 3950X jede přes VMWare, je to stroj s jednou Win10 virtuálkou, ale nemá Processlasso a dělá pouze 56 jednotek, prostě polovinu. Nejspíš i blbé nastavení, jak koukám - jeden 3x5, kdežto ten produktivní jede 4x4+GFN.
Změním, zkusím pozorovat.
EDIT: Jo, některé jednotky už mají 480K FFT. Tedy pohybujeme se 384K, 400K a 480K
- RoKro
- 47.3684210526 %
- Příspěvky: 1119
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2020 - testy a nastavení
Jojo, ten multithreading rozhodně výhody má a ideální nastavení (nejvíc spočítaných úloh za jednotku času) je opravdu pro různé CPU často hodně odlišné, zvlášť u typu úloh, kde FFT není ani z těch nejmenších (např. SGS nebo PPSE) ani z těch největších (SoB apod.), to pak různým mašinám chutnají různá nastavení.
Dejte sem, pokud to nechcete tajit, info, kolik (velkých, ne ověřovacích) turnajových jednotek počítají vaše CPU za den. Je to jednoduše vidět na titulní stránce vašeho účtu na PG, tam jsou údaje za posledních (klouzavých) 24 hodin. U mě je to:
Dejte sem, pokud to nechcete tajit, info, kolik (velkých, ne ověřovacích) turnajových jednotek počítají vaše CPU za den. Je to jednoduše vidět na titulní stránce vašeho účtu na PG, tam jsou údaje za posledních (klouzavých) 24 hodin. U mě je to:
Kód: Vybrat vše
i5-9600K 41
i7-8700K 51
i3-9100F 28
i5-4570 20
i7-9800X 105

Re: PG Turnaj 2020 - testy a nastavení
Chtěl jsem se podívat, kolik mi počítá i7-9700K a zjistil jsem, že...nula.
Prostě po restartu aktualizacích jsem to neošetřil
Nejvíc mi chroupá dual xeon, 142 za den.
Z plnohodnotných strojů nejméně i5-4670 a sice 19 za den, takový trochu zapomenutý stroj.
Prostě po restartu aktualizacích jsem to neošetřil

Nejvíc mi chroupá dual xeon, 142 za den.
Z plnohodnotných strojů nejméně i5-4670 a sice 19 za den, takový trochu zapomenutý stroj.
- RoKro
- 47.3684210526 %
- Příspěvky: 1119
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2020 - testy a nastavení
Tak to mi ze srovnání s tou 3950X to moje 9800X s polovinou jader a za poloviční cenu nevychází špatně, dobře jsem vybral, musím se pochválit 


-
- 26.3157894737 %
- Příspěvky: 230
- Registrován: úte 05 led, 2016 14:25
- rok narození: 05 črc 1969
- ID CNT statistics: 22548
- Bydliště: Kotvrdovice
Re: PG Turnaj 2020 - testy a nastavení
i5-7400 22wu/den
i7-8700 35wu/den
3700X 56wu/den
8260 146wu/den
i7-8700 35wu/den
3700X 56wu/den
8260 146wu/den
- Boby_cze
- 26.3157894737 %
- Příspěvky: 235
- Registrován: čtv 16 dub, 2020 09:56
- rok narození: 31 led 1971
- ID CNT statistics: 27352
- Bydliště: Jižní čechy
Re: PG Turnaj 2020 - testy a nastavení
i7-3770 15
i7-870 8
i5-3470 17
i5-3470 18
i5-3470 19
i5-3470 16
koukam jak velky rozdily jsou bez AVX, s AVX, AVX2, a u novych AVX512
i7-870 8
i5-3470 17
i5-3470 18
i5-3470 19
i5-3470 16
koukam jak velky rozdily jsou bez AVX, s AVX, AVX2, a u novych AVX512
Re: PG Turnaj 2020 - testy a nastavení
jj, AVX-512 je prostě u LLR znát.
Viz Albretuv 8260 24-core.
Je to ale i o nastavení - jeden stroj má 117 (kdybych na něm nic nedělal, bylo by to trošku víc), ten druhý ve virtuálu má aktuálně 54.
Mimochodem, spotřebu mám myslím 115W.
Kolik si papá 9800X?
Z hlediska spotřeba/výkon na tom bude 3950 třeba 3x lépe.
- RoKro
- 47.3684210526 %
- Příspěvky: 1119
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2020 - testy a nastavení
Spotřeba - dle HWmonitoru aktuálně žere sám procesor 165W.
Když jsem testoval tvůj balíček, žralo to pecko na zásuvce 323W, ale to jsem testoval na 4,1GHz a teď počítám výrazně níž na 3,6GHz, takže ta spotřeba bude asi možná i o nějakou desítku wattů nižší (už to nemám na wattmetru, tak nevím přesně). Navíc tam jede vodní pumpa a 7 ventilátorů.
Pořizoval jsem to s vědomím, že z pohledu spotřeby to bude míň výhodný, než ryzeny, ale to pc (až ho dodělám) pojede v baráku, kde se topí elektřinou, takže půl roku pojede "zadarmo", o to míň šťávy si bude brát kotlík. A i v létě pořád pojede za nižší sazbu, než mám v paneláku. To jen na vysvětlenou.
Tvých 115W je na zásuvce? To asi ne ...
Ten cenový rozdíl řádově 10 tisíc, to je pěkných pár kWh, které můžu proti 3950X navíc propálit
To je tak na tři roky? A to je morální životnost procesoru
Přeháním, ta je možná i 4 tady v naší komunitě bláznivých počtářů 
Tohle není flame amd x intel, kdybych ho pořizoval domů a nechtěl ho výhradně na PG LLR, tak bych rozhodně vážně uvažoval i o ryzenech. Jde mi ale jen o srovnání, jestli jsem to i tak neměl udělat (jenže ve stejné cenové kategorii bych sice šetřil elektřinu, ale měl bych výrazně nižší výkon).
Upřímně - Albertův 24 core, tam mi těch 146 jednotek za den připadá jako JENOM 146 jednotek. To fakt jede na plný nebo skoro plný výkon? CPu za cenu +/- 100 litrů a nedělá ani dvojnásobek toho co tvůj ryzen nebo moje osmijádro? Co mi uniká ... furt si říkám, že něco musí ... není to už pro PG málo, jen dvě AVX-512 jednotky na 24 jader?
Když jsem testoval tvůj balíček, žralo to pecko na zásuvce 323W, ale to jsem testoval na 4,1GHz a teď počítám výrazně níž na 3,6GHz, takže ta spotřeba bude asi možná i o nějakou desítku wattů nižší (už to nemám na wattmetru, tak nevím přesně). Navíc tam jede vodní pumpa a 7 ventilátorů.
Pořizoval jsem to s vědomím, že z pohledu spotřeby to bude míň výhodný, než ryzeny, ale to pc (až ho dodělám) pojede v baráku, kde se topí elektřinou, takže půl roku pojede "zadarmo", o to míň šťávy si bude brát kotlík. A i v létě pořád pojede za nižší sazbu, než mám v paneláku. To jen na vysvětlenou.
Tvých 115W je na zásuvce? To asi ne ...
Ten cenový rozdíl řádově 10 tisíc, to je pěkných pár kWh, které můžu proti 3950X navíc propálit



Tohle není flame amd x intel, kdybych ho pořizoval domů a nechtěl ho výhradně na PG LLR, tak bych rozhodně vážně uvažoval i o ryzenech. Jde mi ale jen o srovnání, jestli jsem to i tak neměl udělat (jenže ve stejné cenové kategorii bych sice šetřil elektřinu, ale měl bych výrazně nižší výkon).
Upřímně - Albertův 24 core, tam mi těch 146 jednotek za den připadá jako JENOM 146 jednotek. To fakt jede na plný nebo skoro plný výkon? CPu za cenu +/- 100 litrů a nedělá ani dvojnásobek toho co tvůj ryzen nebo moje osmijádro? Co mi uniká ... furt si říkám, že něco musí ... není to už pro PG málo, jen dvě AVX-512 jednotky na 24 jader?

Re: PG Turnaj 2020 - testy a nastavení
To musí říct Albert, ale ten Xeon asi pojede na trochu jiné frekvenci, aby se uchladil.
3950X nebo tvůj 9800X pojede na frekvenci cca +50% co ten Xeon (nebo můj dual CPU kombajn)
3950X nebo tvůj 9800X pojede na frekvenci cca +50% co ten Xeon (nebo můj dual CPU kombajn)
- RoKro
- 47.3684210526 %
- Příspěvky: 1119
- Registrován: pon 31 srp, 2009 08:57
- rok narození: 29 črc 1970
- ID CNT statistics: 10234
- Bydliště: Beroun
- Kontaktovat uživatele:
Re: PG Turnaj 2020 - testy a nastavení
To je celkem jedno, jaký je důvod, ale stojí 10x víc, jader má 4x víc, ale počítá jenom 1,5x víc ... to mi hlava nebere.
Zase, nemyslím to jako hejt, jen nahlas přemýšlím.
Zase, nemyslím to jako hejt, jen nahlas přemýšlím.

-
- 26.3157894737 %
- Příspěvky: 230
- Registrován: úte 05 led, 2016 14:25
- rok narození: 05 črc 1969
- ID CNT statistics: 22548
- Bydliště: Kotvrdovice
Re: PG Turnaj 2020 - testy a nastavení
Pokud počítají všechna fyzická jádra, tak 8260 při výpočtech AVX-512 jede na 2,0GHz. Není to ostrá verze (ani ta by nejela na o moc vyšším kmitoštu), mám ES (engineering sample) a má tím pádem sníženou frekvenci o 200MHz. A samozřejmě stál zlomek ceny, jinak bych si jej nekoupil
. Mám jej téměř rok a jsem spokojen s jeho účinností, spotřeba je okolo 220 až 250W při plné zátěži.

-
- 26.3157894737 %
- Příspěvky: 230
- Registrován: úte 05 led, 2016 14:25
- rok narození: 05 črc 1969
- ID CNT statistics: 22548
- Bydliště: Kotvrdovice
Re: PG Turnaj 2020 - testy a nastavení
Ještě poznámka k těm frekvencím. 8260 je zrecyklovaná 8160 a platí tedy tato tabulka. Nicméně je fakt, že AMD se se svými CPU pro spotřební segment trhu postupně dostává výkonově do úrovně Xeonů Gold a Platinum. A to je dobře.
- Přílohy
-
- avx512.png (210.52 KiB) Zobrazeno 728 x