Stránka 1 z 25

PG Turnaj 2019 - testy a nastavení

Napsal: pát 04 led, 2019 11:05
od vkliber
Vlákno pro testování nastavení PG turnajů pro rok 2019.

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pát 04 led, 2019 19:24
od RoKro
Tak já začnu :-)
Pro intel 8700K aplikaci Seventeen or Bust LLR (SOB) mi s FFT 2560K vychází nejlíp počítat jednu jednotku na 4 ze 6 dostupných jader. Testováno jen bez HT, s HT to ani zkoušet nebudu.

Kód: Vybrat vše

Timings for 2560K FFT length (6 cores, 1 worker):  3.04 ms.  Throughput: 328.65 iter/sec.
Timings for 2560K FFT length (5 cores, 1 worker):  2.91 ms.  Throughput: 343.49 iter/sec.
Timings for 2560K FFT length (4 cores, 1 worker):  2.81 ms.  Throughput: 355.74 iter/sec.
Timings for 2560K FFT length (3 cores, 1 worker):  2.95 ms.  Throughput: 339.35 iter/sec.

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pát 04 led, 2019 20:20
od RoKro
No a když už jsem byl v tom, testnul jsem též šestijádrový i5-9600K.
Když to trochu přeženu, tak u něj je jedno, jak to počítání spustím :-)
Nejlíp vychází počítat jednu jednotku na 4 jádrech a zbylá dvě nechat flákat.
Možná by to běhalo o chloupek jinak s rychlejšími pamětmi, jsou tam HyperX Predator 16GB (2x8GB) DDR4 3200.
Je vidět, že levnější i5-9600K pěkně šlape na paty jen o málo starší i7-8700K. A to ta i5 není nijak ručně taktovaná, jen má v biosu zapnuto, že turbo má aplikovat na všechna jádra, jede pak na 4,6 GHz. Ta i7 má delid a přetakt na 4,8 GHz.

Kdyby se v tom chtěl někdo hrabat, tak výsledky testů uvádím níže (neprůměroval jsem, tak tam jsou měření opakovaně.)

Kód: Vybrat vše

Timings for 2560K FFT length (6 cores, 1 worker):  3.59 ms.  Throughput: 278.52 iter/sec.
Timings for 2560K FFT length (6 cores, 2 workers):  6.58,  6.64 ms.  Throughput: 302.44 iter/sec.
Timings for 2560K FFT length (6 cores, 3 workers): 10.55, 10.16,  9.64 ms.  Throughput: 297.01 iter/sec.
Timings for 2560K FFT length (6 cores, 4 workers): 23.01, 19.76, 10.27, 10.01 ms.  Throughput: 291.39 iter/sec.
Timings for 2560K FFT length (6 cores, 5 workers): 22.32, 19.51, 18.79, 22.10,  9.80 ms.  Throughput: 296.57 iter/sec.
Timings for 2560K FFT length (6 cores, 6 workers): 22.54, 19.94, 19.01, 22.35, 20.41, 19.05 ms.  Throughput: 293.31 iter/sec.

Timings for 2560K FFT length (6 cores, 1 worker):  3.24 ms.  Throughput: 309.08 iter/sec.
Timings for 2560K FFT length (6 cores, 2 workers):  6.58,  6.71 ms.  Throughput: 301.01 iter/sec.
Timings for 2560K FFT length (6 cores, 3 workers): 10.19, 10.07,  9.75 ms.  Throughput: 299.98 iter/sec.
Timings for 2560K FFT length (6 cores, 4 workers): 22.34, 19.39, 10.35,  9.80 ms.  Throughput: 295.04 iter/sec.
Timings for 2560K FFT length (6 cores, 5 workers): 22.92, 19.67, 18.85, 22.55,  9.88 ms.  Throughput: 293.11 iter/sec.
Timings for 2560K FFT length (6 cores, 6 workers): 23.90, 20.11, 19.36, 23.84, 21.92, 20.91 ms.  Throughput: 278.60 iter/sec.

Timings for 2560K FFT length (6 cores, 1 worker):  3.27 ms.  Throughput: 306.12 iter/sec.
Timings for 2560K FFT length (6 cores, 2 workers):  6.52,  6.74 ms.  Throughput: 301.64 iter/sec.
Timings for 2560K FFT length (6 cores, 3 workers): 10.43, 10.19,  9.80 ms.  Throughput: 296.03 iter/sec.
Timings for 2560K FFT length (6 cores, 4 workers): 22.45, 19.33, 10.18,  9.80 ms.  Throughput: 296.57 iter/sec.
Timings for 2560K FFT length (6 cores, 5 workers): 22.75, 19.69, 18.67, 22.81,  9.88 ms.  Throughput: 293.32 iter/sec.
Timings for 2560K FFT length (6 cores, 6 workers): 22.68, 19.71, 18.88, 22.85, 20.58, 19.35 ms.  Throughput: 291.79 iter/sec.


Timings for 2560K FFT length (5 cores, 1 worker):  3.50 ms.  Throughput: 285.99 iter/sec.
Timings for 2560K FFT length (5 cores, 2 workers):  8.13,  5.34 ms.  Throughput: 310.37 iter/sec.
Timings for 2560K FFT length (5 cores, 3 workers): 17.48,  7.83,  8.44 ms.  Throughput: 303.35 iter/sec.
Timings for 2560K FFT length (5 cores, 4 workers): 17.76, 16.06, 15.74,  8.58 ms.  Throughput: 298.69 iter/sec.
Timings for 2560K FFT length (5 cores, 5 workers): 17.68, 16.16, 15.90, 17.72, 16.76 ms.  Throughput: 297.45 iter/sec.

Timings for 2560K FFT length (5 cores, 1 worker):  3.09 ms.  Throughput: 323.14 iter/sec.
Timings for 2560K FFT length (5 cores, 2 workers):  8.04,  5.33 ms.  Throughput: 311.85 iter/sec.
Timings for 2560K FFT length (5 cores, 3 workers): 17.28,  7.76,  8.32 ms.  Throughput: 306.89 iter/sec.
Timings for 2560K FFT length (5 cores, 4 workers): 17.60, 15.93, 15.79,  8.52 ms.  Throughput: 300.29 iter/sec.
Timings for 2560K FFT length (5 cores, 5 workers): 17.70, 16.03, 15.86, 17.69, 16.53 ms.  Throughput: 298.99 iter/sec.

Timings for 2560K FFT length (4 cores, 1 worker):  3.00 ms.  Throughput: 333.77 iter/sec.
Timings for 2560K FFT length (4 cores, 2 workers):  6.23,  6.23 ms.  Throughput: 320.99 iter/sec.
Timings for 2560K FFT length (4 cores, 3 workers): 13.81, 12.90,  6.98 ms.  Throughput: 293.09 iter/sec.
Timings for 2560K FFT length (4 cores, 4 workers): 13.50, 12.66, 12.51, 13.06 ms.  Throughput: 309.59 iter/sec.

Timings for 2560K FFT length (4 cores, 1 worker):  3.02 ms.  Throughput: 330.62 iter/sec.
Timings for 2560K FFT length (4 cores, 2 workers):  6.26,  6.23 ms.  Throughput: 320.14 iter/sec.
Timings for 2560K FFT length (4 cores, 3 workers): 12.96, 12.39,  6.26 ms.  Throughput: 317.60 iter/sec.
Timings for 2560K FFT length (4 cores, 4 workers): 13.58, 12.86, 12.74, 13.44 ms.  Throughput: 304.26 iter/sec.

Timings for 2560K FFT length (3 cores, 1 worker):  3.18 ms.  Throughput: 314.08 iter/sec.
Timings for 2560K FFT length (3 cores, 2 workers):  9.76,  4.77 ms.  Throughput: 311.92 iter/sec.
Timings for 2560K FFT length (3 cores, 3 workers): 10.04,  9.76,  9.63 ms.  Throughput: 305.95 iter/sec.

Timings for 2560K FFT length (3 cores, 1 worker):  3.17 ms.  Throughput: 315.20 iter/sec.
Timings for 2560K FFT length (3 cores, 2 workers): 10.57,  5.24 ms.  Throughput: 285.43 iter/sec.
Timings for 2560K FFT length (3 cores, 3 workers):  9.96,  9.65,  9.57 ms.  Throughput: 308.48 iter/sec.

Timings for 2560K FFT length (2 cores, 1 worker):  4.21 ms.  Throughput: 237.42 iter/sec.
Timings for 2560K FFT length (2 cores, 2 workers):  8.36,  8.17 ms.  Throughput: 242.05 iter/sec.


Re: PG Turnaj 2019 - testy a nastavení

Napsal: sob 05 led, 2019 21:39
od forest
Započal jsem předturnajové testování. Zatím zde nikdo nepostnul nastavení app_configu, tak zde přikládám jedno funkční pro výpočty čtyř CPU jader na jedné jednotce:
<app_config>
<app>
<name>llrSOB</name>
<fraction_done_exact/>
</app>
<app_version>
<app_name>llrSOB</app_name>
<cmdline>-t 4</cmdline>
<avg_ncpus>4</avg_ncpus>
<max_ncpus>4</max_ncpus>
</app_version>
</app_config>
Můžete si již sami případně přepracovat dle vlastních potřeb. Při každé změně je ale potřeba BOINC Managera i BOINC Core vypnout a znovu pustit, jinak se změna nastavení neprojeví.
Pro ty kdo nevědí, tak je to obsah souboru který si můžete sami založit a jeho jméno je přesně "app_config.xml". Funguje pouze v tom případě, pokud jej umístíte přímo do datového adresáře projektu Prime Grid na vašem PC. Ještě jednou připomínám, tak aby mohl fungovat, musí si jej BOINC Manager načíst při svém startu.

Re: PG Turnaj 2019 - testy a nastavení

Napsal: sob 05 led, 2019 22:14
od Honza
forest píše: sob 05 led, 2019 21:39 Započal jsem předturnajové testování. Zatím zde nikdo nepostnul nastavení app_configu, tak zde přikládám jedno funkční pro výpočty čtyř CPU jader na jedné jednotce:
Je to linkované v příspěvku oznamujícím tento turnaj.

Za mě tam pouze chybí informace o velikosti FFT.
V tomto ohledu bych doplnil, že naprostá většina jednotek bude pro 3 nižší k 2560K a pro zbývající dvě vyšší 2880K.
vkliber píše: pát 04 led, 2019 11:22 Conjunction of Venus & Jupiter Challenge
...

Počítání jednotky na více jádrech (MT) - pro zkušené uživatele:
Diskuse o aktuálním nastavení, kam také směřujte své výsledky, dotazy či připomínky. (Loňská diskuse zde.)
Pokud máte chuť a trochu času, tak se koukněte jak nastavit výpočty více procesorových jader na jedné jednotce (MT) a také na nejvhodnější nastavení poměru výpočetních jader a počtu zpracovávaných jednotek naráz. Při takovémto nastavení, je podpora a zapnutí HT v BIOSu velkou posilou. V každém případě se vyplatí si s nastavením pohrát a počítat méně jednotek, každou se zapojením několika CPU jader. Dosáhnete mnohdy i dvojnásobného výkonu, než při běžném spuštění bez MT nastavení. FFT = .

Re: PG Turnaj 2019 - testy a nastavení

Napsal: ned 06 led, 2019 01:21
od Honza1616
výsledky podle Prime95
intel 9900k vychází nejlépe 8 jáder = 1 jednotka .....za (do) 23,5h odhadem, spočítáno 2,2% jednotky za 30min, zbývá asi 22:45
intel 6700k vychází nejlépe 4 jádra = 1 jednotka
ryzen 1700 vychází nejlépe 8 jáder = 1 jednotka

EDIT: tomu říkám testování napříč komunitou :D
https://ctrlv.cz/shots/2019/01/06/VCe3.png

Re: PG Turnaj 2019 - testy a nastavení

Napsal: ned 06 led, 2019 09:39
od Dzordzik
Co teploty na 9900K po nějaké delší době počítání?

Re: PG Turnaj 2019 - testy a nastavení

Napsal: ned 06 led, 2019 10:37
od Czech Human
Honza1616 píše: ned 06 led, 2019 01:21 EDIT: tomu říkám testování napříč komunitou :D
https://ctrlv.cz/shots/2019/01/06/VCe3.png
Jo tomu říkám testování... Já bych na to řekl snad jen že kdo chce víc, nemá nic a evidentně se smysl projektu - matematické výsledky - dostává do pozadí. Chápu že správci PG serverů by asi byli nejradši kdyby celá boinc komunita závodila 365 dní v roce jen na jejich projektech, které jí vyberou ale takhle to u dobrovolného počítání nefunguje, alespoň u mě ne.

Re: PG Turnaj 2019 - testy a nastavení

Napsal: ned 06 led, 2019 10:52
od Honza1616
Dzordzik píše: ned 06 led, 2019 09:39 Co teploty na 9900K po nějaké delší době počítání?
teploty jsou krásné 45hh 76° bylo maximum za 9 hodin monitoringu, a to bývá jen při startu jednotky první asi 2-3 vteřiny
https://ctrlv.cz/shots/2019/01/06/TWlO.png
momentálně počítám na této frekvenci kde jsem našel optimální nastavení vůči spotřebě a rychlosti odevzdávání jednotek
takže ještě mám rezervu asi 0,3GHz pokud bych to chtěl o pár minut popohnat ale za cenu vyšší spotřeby 100W
ale tak vysoká spotřeba za 0,3GHz se mi při běžném počítání nevyplatí když odevzdávám i tak mezi prvními 45hh ...llrSR5 za 40minut

jinak stále počítám tu jednotku u které jsem psal že se spočítá za 23,5 hodin a už tam je 48,8% za 9h:08:min a zbývá 9:35 takže nějakých 18:45 na celou jednotku, a spotřeba 250W na zásuvce,
ryzen 7 1700....33,44% za 9h:12min zbývá 18:19
intel i7-6700k ....27,2% za 9h:11min zbývá 1den:00h:35min

Re: PG Turnaj 2019 - testy a nastavení

Napsal: ned 06 led, 2019 15:43
od Honza1616
tak musím přehodnotit testování 9900k na současný turnaj a tady je ještě jeden zajímavý test
https://ctrlv.cz/shots/2019/01/06/PIn9.png
6 jáder na 1 jednotce, a zbylé 2 ponechat volné
tak jsem upravil config a jsem zvědav o kolik se ta současná jednotka zrychlí, z posledního příspěvku kde jsem psal dnes dopoledne že zbývá 9:35 do konce jsem odhadl že jednotka by měla trvat 23,5h a ted to vypadá na 18:45 hodin počítání
že by až takové zrychlení? nebo že by se ten odhad ještě upravil za tu dobu od dnešního dopoledne do ted? :smt017 čekal bych že ten odhad na 10-20% bude použitelný a to jsem ráno byl skoro v polovině ale že by to pořád i na 70% přepočítávalo čas a pořád zrychlovalo??
no jsem zvědav co to udělá ted zbývá....
Obrázek

Re: PG Turnaj 2019 - testy a nastavení

Napsal: ned 06 led, 2019 18:37
od forest
Přikládám výsledky testů:
Na Bivoji chodí nejlépe 5 jednotek naráz, s časem 31h (5 hotových jednotek)
Ryzen 2700X jedna jednotka na 10 jádrech, čas 22h
Threadripper 1950X počítá nejlépe při dvou jednotkách, každé na 15 jádrech, čas 18h (2 hotové jednotky)
7700K jedna jednotka na 6 jádrech 37h
8700K dvě jednotky každá na 4 jádrech, čas 53h (2 hotové jednotky)
PC Jirka Eisler nejlépe chodí jedna jednotka na 16 jádrech a to za 14h

Na všech strojích bylo výhodné ponechat zapnuté HT.

Je to asi první test na LLR PG, kde jsem zaznamenal kratší čas výpočtu u Ryzena 2700K oproti Intelu 8700K. Výsledky Threadripperu jsou ještě překvalivější. Zjevně tento podprojekt AMD sedí.

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 00:46
od Honza1616
no tak mi to nedalo a musel jsem otestovat ještě i na HT
můůůže mi někdo prosím vysvětlit rozdíly ve výsledcích a jak to číst abych to nastavil správně
llrSoB bez HT nejlepší na 6 jádrech 1 jednotka 391 inter/sec
https://ctrlv.cz/shots/2019/01/07/HeCH.png
llrSoB s HT nejlepší na 6 jádrech 1 jednotka ....418,5 inter/sec
https://ctrlv.cz/shots/2019/01/07/6zo2.png
co to kurv@ je počítač byl při prvním testu v klidu tak by výsledky měly být stejné, no ne ? proč tedy v prvním testu byl výsledek 391 a ted 418
kdyby tam byl rozdíl v jednotkách tak to chápu ale toto je už dost

jak to mám jako chápat, mám mít v biosu aktivní HT a v configu
nastavení... a v boincu omezeno využití na 50% ?

Kód: Vybrat vše

<app>
<name>llrSOB</name>
<fraction_done_exact/>
</app>
<app_version>
<app_name>llrSOB</app_name>
<cmdline>-t 6</cmdline>
<avg_ncpus>6</avg_ncpus>
</app_version>
:smt017
:roll:
- - - - - - - - - - - - - - - - - - - - -
22sss
to stejné platí i pro llr SR5
nejlepší 1 jednotka na 4 jádra, tedy 2 jednotky současně s 3679 inter/sec
https://ctrlv.cz/shots/2019/01/07/7O5W.png
zapnu HT a 3836 inter/sec ......mám to chápat tak že SR5 s HT zapnuté, boinc omezený na 50% a počítat 2 jednotky každou na 4 jádrech ?
https://ctrlv.cz/shots/2019/01/07/AXKZ.png
:roll:
- - - - - - - - - - - - - - - - - - - - -
mám to chápat tak že CPU pracuje nejlépe se zapnutým HT protože využívá nějakou jeho komponentu nebo featuru která já aktivní jen při HT ale musí být omezené aby nevytěžovalo například cache nebo propustnost pamětí a proto 50% vláken respektive jen vytížení jen fyzických jáder?

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 05:25
od Dzordzik
Chápeš to správně, ale s tím že HT necháš zapnuté ale počet spuštěných jednotek omezíš přes app config. Holt někdy vyjde lépe když systému ponecháš volných víc HT jader s tím že ale bude výpočet využívat ty fyzická a ty HT jádra budou volná pro systém a zbytek aplikací. Teoreticky by to tak nemělo být, ale je.

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 10:54
od Honza
forest píše: ned 06 led, 2019 18:37 Je to asi první test na LLR PG, kde jsem zaznamenal kratší čas výpočtu u Ryzena 2700K oproti Intelu 8700K. Výsledky Threadripperu jsou ještě překvalivější. Zjevně tento podprojekt AMD sedí.
A co kdyby to bylo tak, že SoB obecně hůře škáluje, než například 321, takže rozdíl mezi Intel a AMD není takový.
Tedy v rámci MT nesedí pořádně ani jednomu a tím se rozdíly stírají.

Každopádně je třeba jet na optimaálním nastavení pro ten či onen CPU, na tom se nic nemění.

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 14:12
od forest
Všechny týmové stroje se od rána potí na turnajových jednotkách. Jsem opravdu zvědav, jak ten úvod do sezóny zvládneme. Přecejen v CPU turnajích jsme si minulý rok vedli bezkonkurenčně.

Co se týče toho HT, tak mně minulý rok vycházelo u všech kol na Intelech i AMD lépe (nebo stejně) HT mít zapnuté a většinou do výpočtů zapojit i nějaké to HT jádro. Proč tomu tak je, jsem se nepídil. Občas zde ale někdo psal, že mu to vycházelo hůře, takže se to musí prostě otestovat. Na konkrétní nastavení stroje mají vliv i grafiky (a co se na nich počítá), nebo počet a parametry paměťových bloků. Častokrát hrála roli i základní deska.

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 18:19
od Albert
Hlásím stejnou podivnost jako Honza1616. Od rána jsem na i7 6700 počítal s vypnutým HT, čtyři jádra počítaly 1WU. Po spočítání 10% vycházel celkový čas 86 hodin, což jsem nechápal. Zapl jsem tedy HT a začala se počítat druhá WU (také čtyři jádra) u které to vypadá, po spočítání 2%, na celkový čas jen 45 hodin!
Po zapnutí HT se začal zkracovat i očekávaný celkový čas pro první jednotku.
Stručně napsáno se zapnutým HT je výpočet cca čtyřikrát rychlejší než s vypnutým HT!

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 18:47
od Honza1616
Albert píše: pon 07 led, 2019 18:19 Hlásím stejnou podivnost jako Honza1616. Od rána jsem na i7 6700 počítal s vypnutým HT, čtyři jádra počítaly 1WU. Po spočítání 10% vycházel celkový čas 86 hodin, což jsem nechápal. Zapl jsem tedy HT a začala se počítat druhá WU (také čtyři jádra) u které to vypadá, po spočítání 2%, na celkový čas jen 45 hodin!
Po zapnutí HT se začal zkracovat i očekávaný celkový čas pro první jednotku.
Stručně napsáno se zapnutým HT je výpočet cca čtyřikrát rychlejší než s vypnutým HT!
to je něco trošku jiného ale taky docela extrém

je fakt že odhad času je absolutně nespolehlivý i když mám v configu <fraction_done_exact/> abych čas odhadl relativně přesně musím spočítat aspoň 70-80% jednotky co jsem včera pozoroval :smt102
jak je to ted nevím.... před pár hodinami jsem přišel z práce a ještě jsem na to ani nekoukl ale co si pamatuji z té včerejší testovací jednotky tak je čas o několik hodin horší takže zase bych si nebyl tak moc sebejistý že je lepší mít HT zapnuté a FFT mám zkontrolované počítá se to stejné :roll:
takže HT asi zase vypnu a další jednotku spočítám bez HT :smt102
každopádně ta mnou popisovaná chyba je opravdu prazvláštní,
momentálně 9900k počítá s HT a pouze na 6 vláknech tedy využití asi 38% CPU, ,,,,zapnout HT v biosu, a do configu napsat aby se počítalo na 6 jádrech a boinc omezit na 50%
- - - - - - - - - - - - - - - - - - - - -
tady máte screen můžete porovnat se včerejším testováním
Obrázek

+ bych měl dotaz co napsat do configu aby tam neměl stažené ty 2 úkoly navíc žlutě označené? když už dělám tak dlouhé jednotky a náhodou bych stáhl jednotku která je prvočíslo nerad bych byl doublechecker 33aaa

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 19:17
od LookAS
Honza1616 píše: pon 07 led, 2019 18:47

+ bych měl dotaz co napsat do configu aby tam neměl stažené ty 2 úkoly navíc žlutě označené? když už dělám tak dlouhé jednotky a náhodou bych stáhl jednotku která je prvočíslo nerad bych byl doublechecker 33aaa
co vím, tak jde o bug boinc manageru. ten při stahování první várky jednotek, kdy máš nulovou zásobu, stáhne MT jednotky pro všechna jádra, tzn na např. 8jádrovém cpu stáhne 8 MT jednotek, i když máš v appconfig nastaveno -t 8. Při dalším dotahování jednotek v průběhu už stahuje jednotky správně po jedné.
Já to dělám tak, že před stáhnutím prvních jednotek do prázdného bufferu nastavím v manageru "využití cpu XX%", tzn. např. pro 8jádrový cpu nastavím 12% a manager stáhne jednotku pouze jednu. :roll:

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 21:12
od Honza1616
to vííím že když ty jednotky smažu tak ty další už se stahují po 1
ale mě to teď nefunguje, já ty 2 smáznu a stejně se mi stáhnou další 45hh

Re: PG Turnaj 2019 - testy a nastavení

Napsal: pon 07 led, 2019 21:45
od nenym
Nojo, ty máš ale osmijádro a boincu říkáš, že máš obsazených 6 jader, takže se chová tak, jak je naprogramován. Máš dvě možnosti
- v app_config nastavit avg_cpus na 8, nebo
- boincu říct, že máš 6 jader (přes cc_config, nebo GUI).