Stránka 6 z 11

Re: PG Turnaj 2020 - testy a nastavení

Napsal: úte 21 črc, 2020 07:48
od Honza1616
forest píše: pon 20 črc, 2020 20:56 Ještě jste se nikdo nepochlubili ideálním nastavením a app_configem pro své stroje.
...ještě je brzo 22rrr ja třeba testuji az den pred turnajem

Re: PG Turnaj 2020 - testy a nastavení

Napsal: úte 21 črc, 2020 13:24
od vkliber
Napíšu to i zde:

Turnaj je pojmenován na počest matematičky Katherine Johnson (26. srpna 1918 - 24. února 2020), která byla první Afroameričankou, která pracovala v NASA.
Doporučuji shlédnout velice pěkný film Skrytá čísla (vedle hlavních hrdinek Taraji P. Henson, Janelle Monáe, a Octavia Spencer hraje např. i Kevin Costner a Jim Parsons (Sheldon)).

Re: PG Turnaj 2020 - testy a nastavení

Napsal: úte 21 črc, 2020 14:19
od Honza
Film také doporučuji.

Na tesy není brzy, neb se FFT stejně nezmění.
S větším rozsahem FFT je to trochu loterie, jestli čtu správně Prime95, tak na 3950X mi
u 768k vychází nejlépe 7-8 workerů, ale 4 jsou také ok, protže rozdíl jsou 1-2%.
u 1120k 4-5 workerů.
Takže nechat 4 asi nic nezkazím.

Jenže tohle je Prime95 teorie, ale s použítím Affinity pomocí Process Lasso je to pak o dost jinak/rychlejší.
Nějak mi příjde, že je důležitější dobře nastavit CPU Affinity, než počet threadů.
Zkoušenosti někoho s 3900X nebo 3950X?

P.S. Windows.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: úte 21 črc, 2020 22:22
od forest
Ještě budu zítra dotestovávat, tedy finální výsledky zveřejním zítra večer.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: stř 22 črc, 2020 22:46
od forest
Přináším dosavadní výsledky:
Na CPU Intel 6600, 8700K, 4790 a Threadripperu AMD 2950X je nejvýhodnější počítat pouze jednu jednotku a nenecat (pokud neomezíte GPU výpočty) žádné (ani virtuální) jádro volné.
Na Threadripperu 1950X mně vychází nejlépe zapojit tři jednotky po devítí CPU vláknech, na Ryzenu druhé generace 2700X dvě jednotky po 7 vláknech, na Intelu 6950X také dvě jednotky po 9 vláknech.

Tedy nemá to moc jasnou línii a chce to otestovat. Všeobecně by se dalo říct, že starším Intelům a novější AMD chutná více pouze jednovláknová operace a naopak novějším Intelům a starším AMD více úloh naráz, ale na takový závěr nestačí otestovat jen desítku strojů.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: úte 28 črc, 2020 00:49
od petnek
Na Ryzenu 2600 mi nejlépe vycházejí 2 jednotky naráz, každá 6 jader. HT mám zapnuté, rozdíl oproti vypnutému minimální. S vypnutým HT vychází nejlépe nastavení 2 jednotky naráz, každá 3 jádra. Zkoušel jsem pro FFT 768K a 960K

Re: PG Turnaj 2020 - testy a nastavení

Napsal: úte 28 črc, 2020 08:16
od Honza1616
petnek píše: úte 28 črc, 2020 00:49 Na Ryzenu 2600 mi nejlépe vycházejí 2 jednotky naráz, každá 6 jader. HT mám zapnuté, rozdíl oproti vypnutému minimální. S vypnutým HT vychází nejlépe nastavení 2 jednotky naráz, každá 3 jádra. Zkoušel jsem pro FFT 768K a 960K
koukám že rozložení jader do CCX se stále projevuje
R.2600 má 1 čiplet s 6 jádry , optimální nastavení pro muj Ryzen je 4Wu taktéž se zapnutým HT (Ryzen 3900X má dva 6ti jádrové čiplety)
tedy že jednotka se počítá vždy na jedno CCX, biď TRP jednotkám chutná co nejvyšší multivláknové počítání, zapojení všech jader v rámci čipletu se výpočet zpomaluje a ještě víc se zpomaluje při zapojení všech jadrech na všech čipletech,
mít Threadripper nebo EPYC tak ani nemusím testovat, prostě si spočítám kolik má CPU CCX modulů a tolik jednotek pustím 45hh
další generace Ryzenu má mít jádra už sloučené a nebudou CCX moduly které se budou muset dělit o cache a budou spolu moci i lépe komunikovat 33zzz

Re: PG Turnaj 2020 - testy a nastavení

Napsal: pon 31 srp, 2020 15:08
od RoKro
Asi to tak nějak všichni tuší, ale v tomto kole, které za dva a kus dne začíná, se na projektu PSSE nevyplácí multithreading, tzn. počítejte co jádro, to jednotka. A aspoň na intelu i7 8700K mi to o chloupek líp vychází bez HT.
Nevím, jestli mnohajádrové ryzeny nebudou lepší při zapojení dvou jader na jednu úlohu, ale i o tom dost pochybuji, jsou to opravdu malé jednotky.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: pon 31 srp, 2020 22:11
od forest
Testoval jsem to v posledních dnech a je to jak říkáš. Ani při desítkách jader není výhodnější zapojit do jednotky více jader a to ani se zapnutým HT. Není tedy moc co testovat. Délka jednotek se bude pravděpodobně během turnaje rychle zvyšovat, ale kolo je pouze na tři dny, takže ani to nebude hrát zásadní roli.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: stř 02 zář, 2020 23:04
od fobius
Když není doporučeno HT, je tedy stejné pokud teda na Ryzen 2700x pojedu v nastavení boinc na 50% počet cpu jako když bych to HT uplně vypnul v biosu a v boinc jel 100% počet cpu?

Re: PG Turnaj 2020 - testy a nastavení

Napsal: čtv 03 zář, 2020 06:07
od forest
Na 50% to nefunguje dobře, testoval jsem to. Jediná možnost je vypnutí HT v Biosu. Ale ona ta ztráta při počítání se zapnutým HT na všech vláknech není nijak velká. Pokud máte PC někde vzdáleně, je lepší počítat na všech vláknech po jedné jednotce, než jen na 50% vláknech se zapnutým HT.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: čtv 03 zář, 2020 08:29
od porab
Tak mi to teda vychází o něco líp, na Ryzenu 3950x, se zapnutým SMT(HT). 32=cca20min,16=cca12min.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: pát 04 zář, 2020 05:35
od forest
Trojkovou řadu Ryzenů nemám kde si osahat. Díky za upřesnění. Je vidět, že tento CPU je v mnohém opravdu jedinečný.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: ned 13 zář, 2020 11:52
od fobius
Mám takovej lehce offtopic dotaz na hw... jeden komp s xeonem zapínám jen na turnaje a válí se mi tam herní vega56 a přijde mi to škoda a zvažuju jestli tam nenechám válet nějakou jinou grafiku, kterou taky zapnu jen na turnaje... máte někdo zkušenosti k čemu by byla dobrá například nějaká starší Tesla K20 (dnes karta cca za 3000,-), makala by i dnes dobře v nějaký typových úlohách (primegrid? nebo jiné projekty?)... chybí mi zkušenosti, jaký typ projektů sedí na jakou kartu... díky za názor

Re: PG Turnaj 2020 - testy a nastavení

Napsal: ned 13 zář, 2020 12:42
od RoKro
Konkrétní zkušenost s touhle kartou nemám, ale obecně - na PrimeGrid tyhle AMD docela zaostávaly za Nvidiema podobné třídy. To platí dokonce i pro Radeon VII, kterou vyzkoušenou mám.
Aspoň dřív na AMD dobře fungoval GPUgrid a možná i Milka.
Ale nemělo by ti dát moc práce to otestovat, spočítat několik málo jednotek od různých projektů a srovnat, jak si stojí ve srovnání s to tvojí 1070ti.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: ned 13 zář, 2020 20:16
od Dzordzik
GPUGrid dnes už na AMD grafikách nejde vůbec. Jediné o čem má smysl uvažovat je asi Milka, nic jiného mě nenapadá. Na PG si svoji práci odvede ale není to s nVidiema stejná váhová kategorie.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: ned 13 zář, 2020 22:08
od ® Plšák Ráďa ®
Einstein@home by pro AMD taky nemuselo být špatný, jen to nemám odzkoušený, jen to kdysi bába povídala. AMD gk neprovozuji od léta páně ani nepamatuji 45ff Přesunout do OT nebo někam do hardwaru místnosti.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: stř 16 zář, 2020 12:28
od Honza
Jelikož je venku LLR2 aplikace, zakomponoval jsem ji do aktualizované verze PG testovacího balíčku.
Ačkoli LLR2 aplikace v současnosti není pro PPS DIV v provozu, do testu jsem ji zařadil, protože nadcházející turnaj.

Mimochodem, tím že se LLR2 aplikace volá jako link z jednoho místa, nejde pomocí Process Lasso nastavit CPU affinity.
Nebo to neumím a někdo poradí, aby to fungovalo jako v případě volání ze SLOTs.

testovaci_balicek_CNT_v4 (2020-09) Honza
Zakomponována nová LLR2 aplikace
Testovaný kandidát je známé prvočíslo 39*2^6164630+1 z PPS DIV podprojektu, vhodné pro nadcházející turnaj 2020-10.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: čtv 01 říj, 2020 20:01
od RoKro
Honzo, určitě jsi to taky sám testoval, když jsi to vyrobil, hoď prosím do fóra nějaké výsledky. Myslím, že ten tvůj Ryzen 3950X by zajímal víc lidí.

Mně teď na i7-8700K dobíhá test 6 jednotek každá na 1 vlákně, tak o to pak doplním svůj příspěvek ze 17. září ve vlákně "Nová tabulka pro srovnání efektivnosti PC sestav", kde jsem již publikoval nějaké výsledky pro tohle CPU.
A k tomu přidám výsledky testu pro i7-9800X. Myslím, že s tímhle CPU budu spokojený, na PG LLR je to AVX-512 a quad channel RAM neskutečně znát. Ty dva procesory se chovají totálně odlišně, ta i7-8700K je lepší v multithread zpracování, nejspíš díky vyššímu taktu a rychlejším RAMkám, ta i7-9800X ji ale neskutečně válcuje v singlethread nebo nízko-multithread zpracování a tudíž i v porovnání celkového výkonu při nejlepším nastavení pro každý z CPU.
Ale platí to jen pro PG LLR, ne už tak pro obecný testovací balíček CNT, jehož asteroids úlohy nevyužívají AVX-512 instrukce. Nicméně já ten Xkový procesor vybíral cíleně na PG.

Re: PG Turnaj 2020 - testy a nastavení

Napsal: čtv 01 říj, 2020 21:01
od RoKro
Otestoval jsem novým balíčkem následující pc:
CPU Intel® Core™ i7-9800X, 8 jader, 16 vláken, podpora AVX-512.
RAM 16 GB (4x4) DDR4 3000 CL15 v konfiguraci quad channel.
GPU AMD Radeon VII
Win 10 64 bit
Spotřeba v klidu 68 W (je to vodník, takže pumpa plus 6 x ventilátor 140 mm).

Zároveň uvádím i testy mé i7-8700K, je to zajímavé srovnání.

i7-8700K 4,7 GHz, 4 x 8 GB DDR4 dual channel 3600 MHz CL14
1 x 6 vláken ... 1448 sekund (1448 sekund na jednotku, 59,7 jednotek za den) při odběru 220 W na zásuvce.
1 x 5 vláken ... 1670 sekund (1670 sekund na jednotku, 51,7 jednotek za den) při odběru 200 W na zásuvce.
2 x 3 vlákna ... 2596 sekund (1298 sekund na jednotku, 66,6 jednotek za den) při odběru 230 W na zásuvce.
3 x 2 vlákna ... 3831 sekund (1277 sekund na jednotku, 67,7 jednotek za den) při odběru 238 W na zásuvce.
6 x 1 vlákn0 ...10780 sekund (1797 sekund na jednotku, 48,1 jednotek za den) při odběru - neměřeno.
Při nejlepších nastaveních (3 x 2 nebo 2 x 3) je spotřeba 82-85 Wh na jednotku.

i7-9800X 4,1 GHz, 4 x 4 GB DDR4 quad channel 3000 MHz CL15
1 x 8 vláken ... 3092 sekund (3092 sekund na jednotku, 27,9 jednotek za den) při odběru 165 W na zásuvce a 38 stupních.
2 x 4 vlákna ... 2631 sekund (1316 sekund na jednotku, 65,7 jednotek za den) při odběru 215 W na zásuvce a 51 stupních.
2 x 3 vlákna ... 2794 sekund (1397 sekund na jednotku, 61,8 jednotek za den) při odběru 200 W na zásuvce.
4 x 2 vlákna ... 3509 sekund (877 sekund na jednotku, 98,5 jednotek za den) při odběru 254 W na zásuvce a 61 stupních.
8 x 1 vlákno ... 4716 sekund (590 sekund na jednotku, 146,4 jednotek za den) při odběru 323 W na zásuvce a 74 stupních.
Při nejlepším nastavení 8 x 1 je spotřeba 53 Wh na jednotku, to je 65% spotřeby i7-8700K, tedy výrazně vyšší účinnost.
Teplota 74 stupňů je ale taky dost, na vodníka, uvidím, jak to bude při opravdu dlouhodobé zátěži, možná budu muset snížit takt ze 4,1 GHz na 4,0 GHz, což samozřejmě asi trochu prodlouží doby výpočtu, ale zase klesne spotřeba.

Obecná zjištění:
1) U balíčku CNT postaveného na asteroids jednotkách není u i7-9800X rychlost výpočtu závislá na rychlosti RAM pamětí. Čas výpočtu byl stejný bez XMP profilu, kdy byly paměti nastaveny na 2400 MHz CL 17, s prvním XMP profilem 2666 MHz CL 15 i s druhým XMP profilem 3000 MHz CL 15.
2) U nového balíčku s PG LLR aplikací od Honzy tam nějaká závislost na rychlosti pamětí byla, když jsem ty Kingston HyperX Fury 3000 Mhz CL 15 nahradil rychlými G.Skill 3600 MHz CL 16, klesla doba při jednovláknovém výpočtu (8 jednotek naráz každá na jednom vlákně) z 4716 sekund na 4585 sekund, což jsou necelá cca 3%. Asi záleží na typu úlohy, jak moc se při výpočtu komunikuje s ramkou, možná by u testu na větším prvočísle byl ten rozdíl ještě vyšší.
3) Frekvence, na kterých procesor bez problému zvládá asteroids AVX jednotky, jsou mnohem vyšší (o stovky MHz), než při jakých dokáže počítat LLR jednotky využívající AVX-512 instrukce. To samozřejmě není nic nečekaného.
4) PG PPSE jednotky v Boinc manageru - i7-8700K na 4,7 GHz spočítá jednotku za 623 sekund (6 jednotek najednou), i7-9800X na 4,1 GHz spočítá jednotku za 307 sekund (8 jednotek najednou). To je docela brutální rozdíl, 35 jednotek za hodinu proti 93 jednotkám za hodinu. A to mě ta 9800X (Launch Date Q4'18) stála necelých 9 tisíc a za tu 8700K (Launch Date Q4'17) jsem dal myslím přes 10.
U PG SGS je ten poměr 490 sekund (6 jednotek najednou, 44 za hodinu) / 269 sekund (8 jednotek najednou, 78 za hodinu).

Mám otestovaný i klasický CNT balíček, ale mám určité pochybnosti, jestli jsem některé testy nepustil špatně, až to přetestuji, zveřejním výsledky v příslušném vlákně.