PG Turnaj 2019 - testy a nastavení
Napsal: pát 04 led, 2019 11:05
Vlákno pro testování nastavení PG turnajů pro rok 2019.
Týmové fórum
https://forum.czechnationalteam.cz/
Kód: Vybrat vše
Timings for 2560K FFT length (6 cores, 1 worker): 3.04 ms. Throughput: 328.65 iter/sec.
Timings for 2560K FFT length (5 cores, 1 worker): 2.91 ms. Throughput: 343.49 iter/sec.
Timings for 2560K FFT length (4 cores, 1 worker): 2.81 ms. Throughput: 355.74 iter/sec.
Timings for 2560K FFT length (3 cores, 1 worker): 2.95 ms. Throughput: 339.35 iter/sec.
Kód: Vybrat vše
Timings for 2560K FFT length (6 cores, 1 worker): 3.59 ms. Throughput: 278.52 iter/sec.
Timings for 2560K FFT length (6 cores, 2 workers): 6.58, 6.64 ms. Throughput: 302.44 iter/sec.
Timings for 2560K FFT length (6 cores, 3 workers): 10.55, 10.16, 9.64 ms. Throughput: 297.01 iter/sec.
Timings for 2560K FFT length (6 cores, 4 workers): 23.01, 19.76, 10.27, 10.01 ms. Throughput: 291.39 iter/sec.
Timings for 2560K FFT length (6 cores, 5 workers): 22.32, 19.51, 18.79, 22.10, 9.80 ms. Throughput: 296.57 iter/sec.
Timings for 2560K FFT length (6 cores, 6 workers): 22.54, 19.94, 19.01, 22.35, 20.41, 19.05 ms. Throughput: 293.31 iter/sec.
Timings for 2560K FFT length (6 cores, 1 worker): 3.24 ms. Throughput: 309.08 iter/sec.
Timings for 2560K FFT length (6 cores, 2 workers): 6.58, 6.71 ms. Throughput: 301.01 iter/sec.
Timings for 2560K FFT length (6 cores, 3 workers): 10.19, 10.07, 9.75 ms. Throughput: 299.98 iter/sec.
Timings for 2560K FFT length (6 cores, 4 workers): 22.34, 19.39, 10.35, 9.80 ms. Throughput: 295.04 iter/sec.
Timings for 2560K FFT length (6 cores, 5 workers): 22.92, 19.67, 18.85, 22.55, 9.88 ms. Throughput: 293.11 iter/sec.
Timings for 2560K FFT length (6 cores, 6 workers): 23.90, 20.11, 19.36, 23.84, 21.92, 20.91 ms. Throughput: 278.60 iter/sec.
Timings for 2560K FFT length (6 cores, 1 worker): 3.27 ms. Throughput: 306.12 iter/sec.
Timings for 2560K FFT length (6 cores, 2 workers): 6.52, 6.74 ms. Throughput: 301.64 iter/sec.
Timings for 2560K FFT length (6 cores, 3 workers): 10.43, 10.19, 9.80 ms. Throughput: 296.03 iter/sec.
Timings for 2560K FFT length (6 cores, 4 workers): 22.45, 19.33, 10.18, 9.80 ms. Throughput: 296.57 iter/sec.
Timings for 2560K FFT length (6 cores, 5 workers): 22.75, 19.69, 18.67, 22.81, 9.88 ms. Throughput: 293.32 iter/sec.
Timings for 2560K FFT length (6 cores, 6 workers): 22.68, 19.71, 18.88, 22.85, 20.58, 19.35 ms. Throughput: 291.79 iter/sec.
Timings for 2560K FFT length (5 cores, 1 worker): 3.50 ms. Throughput: 285.99 iter/sec.
Timings for 2560K FFT length (5 cores, 2 workers): 8.13, 5.34 ms. Throughput: 310.37 iter/sec.
Timings for 2560K FFT length (5 cores, 3 workers): 17.48, 7.83, 8.44 ms. Throughput: 303.35 iter/sec.
Timings for 2560K FFT length (5 cores, 4 workers): 17.76, 16.06, 15.74, 8.58 ms. Throughput: 298.69 iter/sec.
Timings for 2560K FFT length (5 cores, 5 workers): 17.68, 16.16, 15.90, 17.72, 16.76 ms. Throughput: 297.45 iter/sec.
Timings for 2560K FFT length (5 cores, 1 worker): 3.09 ms. Throughput: 323.14 iter/sec.
Timings for 2560K FFT length (5 cores, 2 workers): 8.04, 5.33 ms. Throughput: 311.85 iter/sec.
Timings for 2560K FFT length (5 cores, 3 workers): 17.28, 7.76, 8.32 ms. Throughput: 306.89 iter/sec.
Timings for 2560K FFT length (5 cores, 4 workers): 17.60, 15.93, 15.79, 8.52 ms. Throughput: 300.29 iter/sec.
Timings for 2560K FFT length (5 cores, 5 workers): 17.70, 16.03, 15.86, 17.69, 16.53 ms. Throughput: 298.99 iter/sec.
Timings for 2560K FFT length (4 cores, 1 worker): 3.00 ms. Throughput: 333.77 iter/sec.
Timings for 2560K FFT length (4 cores, 2 workers): 6.23, 6.23 ms. Throughput: 320.99 iter/sec.
Timings for 2560K FFT length (4 cores, 3 workers): 13.81, 12.90, 6.98 ms. Throughput: 293.09 iter/sec.
Timings for 2560K FFT length (4 cores, 4 workers): 13.50, 12.66, 12.51, 13.06 ms. Throughput: 309.59 iter/sec.
Timings for 2560K FFT length (4 cores, 1 worker): 3.02 ms. Throughput: 330.62 iter/sec.
Timings for 2560K FFT length (4 cores, 2 workers): 6.26, 6.23 ms. Throughput: 320.14 iter/sec.
Timings for 2560K FFT length (4 cores, 3 workers): 12.96, 12.39, 6.26 ms. Throughput: 317.60 iter/sec.
Timings for 2560K FFT length (4 cores, 4 workers): 13.58, 12.86, 12.74, 13.44 ms. Throughput: 304.26 iter/sec.
Timings for 2560K FFT length (3 cores, 1 worker): 3.18 ms. Throughput: 314.08 iter/sec.
Timings for 2560K FFT length (3 cores, 2 workers): 9.76, 4.77 ms. Throughput: 311.92 iter/sec.
Timings for 2560K FFT length (3 cores, 3 workers): 10.04, 9.76, 9.63 ms. Throughput: 305.95 iter/sec.
Timings for 2560K FFT length (3 cores, 1 worker): 3.17 ms. Throughput: 315.20 iter/sec.
Timings for 2560K FFT length (3 cores, 2 workers): 10.57, 5.24 ms. Throughput: 285.43 iter/sec.
Timings for 2560K FFT length (3 cores, 3 workers): 9.96, 9.65, 9.57 ms. Throughput: 308.48 iter/sec.
Timings for 2560K FFT length (2 cores, 1 worker): 4.21 ms. Throughput: 237.42 iter/sec.
Timings for 2560K FFT length (2 cores, 2 workers): 8.36, 8.17 ms. Throughput: 242.05 iter/sec.
Můžete si již sami případně přepracovat dle vlastních potřeb. Při každé změně je ale potřeba BOINC Managera i BOINC Core vypnout a znovu pustit, jinak se změna nastavení neprojeví.<app_config>
<app>
<name>llrSOB</name>
<fraction_done_exact/>
</app>
<app_version>
<app_name>llrSOB</app_name>
<cmdline>-t 4</cmdline>
<avg_ncpus>4</avg_ncpus>
<max_ncpus>4</max_ncpus>
</app_version>
</app_config>
Je to linkované v příspěvku oznamujícím tento turnaj.
vkliber píše: ↑pát 04 led, 2019 11:22 Conjunction of Venus & Jupiter Challenge
...
Počítání jednotky na více jádrech (MT) - pro zkušené uživatele:
Diskuse o aktuálním nastavení, kam také směřujte své výsledky, dotazy či připomínky. (Loňská diskuse zde.)
Pokud máte chuť a trochu času, tak se koukněte jak nastavit výpočty více procesorových jader na jedné jednotce (MT) a také na nejvhodnější nastavení poměru výpočetních jader a počtu zpracovávaných jednotek naráz. Při takovémto nastavení, je podpora a zapnutí HT v BIOSu velkou posilou. V každém případě se vyplatí si s nastavením pohrát a počítat méně jednotek, každou se zapojením několika CPU jader. Dosáhnete mnohdy i dvojnásobného výkonu, než při běžném spuštění bez MT nastavení. FFT = .
Jo tomu říkám testování... Já bych na to řekl snad jen že kdo chce víc, nemá nic a evidentně se smysl projektu - matematické výsledky - dostává do pozadí. Chápu že správci PG serverů by asi byli nejradši kdyby celá boinc komunita závodila 365 dní v roce jen na jejich projektech, které jí vyberou ale takhle to u dobrovolného počítání nefunguje, alespoň u mě ne.Honza1616 píše: ↑ned 06 led, 2019 01:21 EDIT: tomu říkám testování napříč komunitou
https://ctrlv.cz/shots/2019/01/06/VCe3.png
teploty jsou krásné 76° bylo maximum za 9 hodin monitoringu, a to bývá jen při startu jednotky první asi 2-3 vteřiny
Kód: Vybrat vše
<app>
<name>llrSOB</name>
<fraction_done_exact/>
</app>
<app_version>
<app_name>llrSOB</app_name>
<cmdline>-t 6</cmdline>
<avg_ncpus>6</avg_ncpus>
</app_version>
A co kdyby to bylo tak, že SoB obecně hůře škáluje, než například 321, takže rozdíl mezi Intel a AMD není takový.
to je něco trošku jiného ale taky docela extrémAlbert píše: ↑pon 07 led, 2019 18:19 Hlásím stejnou podivnost jako Honza1616. Od rána jsem na i7 6700 počítal s vypnutým HT, čtyři jádra počítaly 1WU. Po spočítání 10% vycházel celkový čas 86 hodin, což jsem nechápal. Zapl jsem tedy HT a začala se počítat druhá WU (také čtyři jádra) u které to vypadá, po spočítání 2%, na celkový čas jen 45 hodin!
Po zapnutí HT se začal zkracovat i očekávaný celkový čas pro první jednotku.
Stručně napsáno se zapnutým HT je výpočet cca čtyřikrát rychlejší než s vypnutým HT!
co vím, tak jde o bug boinc manageru. ten při stahování první várky jednotek, kdy máš nulovou zásobu, stáhne MT jednotky pro všechna jádra, tzn na např. 8jádrovém cpu stáhne 8 MT jednotek, i když máš v appconfig nastaveno -t 8. Při dalším dotahování jednotek v průběhu už stahuje jednotky správně po jedné.