Aplikace

Fórum o projektu

Moderátoři: petnek, nenym, Zelvuska

Odpovědět
Zpráva
Autor
Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#141 Příspěvek od Honza » pon 05 lis, 2018 18:32

Dzordzik píše:
pon 05 lis, 2018 11:43
Kolik ti žere to PC s RTX při počítání GFN-21 cca?
Kolik žere sestava nevím, ale u AP27 bere GPU orientačně 190W, PPS Sieve je přibližně 220-230W a GFN méně (tuším 150W u GFN17Mega, pak to stoupá).
Když budu mít čas a budu u stroj, mohu zkusit změřit...

EDIT: Tak GFN18 si bere 175-180W, GFN21 kolem 230W a slibuje čas kolem 7:15 hodin.

Dzordzik
52.6315789474 %
52.6315789474 %
Příspěvky: 1799
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#142 Příspěvek od Dzordzik » úte 06 lis, 2018 13:22

Honza píše:
pon 05 lis, 2018 07:59
Dzordzik píše:
pon 05 lis, 2018 06:11
Zkusil jsem na Albertovi cvičně pustit GFN21 a po 18h a 10m z něj vypadly 4 jednotky, tj. jedna jednotka průměrně co 4 a půl hodiny. Spotřeba 415W pod Windows. Zatím jsem s tím nějak nelaboroval, zkusil jsem jedno nastavení a z něj vypadlo tohle.
To je velmi slušný výsledek 22rrr
RTX 2080 udělá jednotku asi za 7 hodin.
Tak jsem zkusil ještě jedno nastavení a je to opět o velký kus lepší, skoro o hodinu na sadu! Aktuálně nejlepší výsledek je teda pro GFN-21 místo víc jak 18h lehce přes 17h na sadu, takže z něj vypadne 1WU průměrně za 15433s, tj. za 4h a 17min.

Co je ale ještě důležitější je, že spotřeba při tomto nastavení spadla ze 415W na 326W, tj. skoro o 90W dolů, tj. cca o 20%! Výpočet jede na FMA3 transformacích.

Ještě zkusím jedno nastavení a víc už s tím asi laborovat nebudu a zkusím AP27 co to udělá ...
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Dzordzik
52.6315789474 %
52.6315789474 %
Příspěvky: 1799
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#143 Příspěvek od Dzordzik » úte 06 lis, 2018 17:33

Mohl by mi prosím někdo v PG zdatnější poradit co mám blbě? Chci omezit počet souběžně počítaných tasků pro CPU AP27.

<app_version>
<app_name>ap26</app_name>
<fraction_done_exact/>
<plan_class>CPU_AP27</plan_class>
<max_concurrent>2</max_concurrent>
</app_version>
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7059
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Aplikace

#144 Příspěvek od nenym » úte 06 lis, 2018 19:24

Řekl bych, že to nejde, <max_concurrent> lze použít v sekci <app>, nikoli v sekci <app_version> (stejně jako <fraction_done_exact/>). Správně by mělo být <plan_class>cpu_AP27</plan_class>, ale to IMHO nepomůže.
Blíže zde.
Blíží se další krize; jím plesnivé sýry, piji staré víno a jezdím v autě bez střechy.
UotD 505x
Obrázek 2xObrázek 7xObrázek 10xObrázek Obrázek
Obrázek

Dzordzik
52.6315789474 %
52.6315789474 %
Příspěvky: 1799
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#145 Příspěvek od Dzordzik » úte 06 lis, 2018 20:28

Tak se nakonec podařilo a funguje to jak jsem potřeboval, tj. jenom 40 CPU tasků a 1 GPU task. Díky za nakopnutí správným směrem. Potřeboval jsem si pohrát s počtem CPU tasků spuštěných najednou, abych uvolnil jádra na obou CPU.

Kdyby si někdo chtěl hrát tak šémhamforáš je:

<app>
<name>ap26</name>
<fraction_done_exact/>
<max_concurrent>41</max_concurrent>
<app_version>
<plan_class>cpu_AP27</plan_class>
</app_version>
</app>

Počítejte s tím že počet v max concurent je součtem CPU i GPU jednotek, proto tam mám 41.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#146 Příspěvek od Honza » úte 06 lis, 2018 20:52

Někdo to na PG řešil 4 CPU a 1 GPU nebo 4 CPU a 2 GPU, ale nemůžu to najít.
Že by mohl byt plan_class case sensitive mě také napadlo.

Hlavně že to fungá a že ostatní ví, jak na to.

Mimochodem, zkoušel ty ruční testy, jak jsme se dnes po telefonu bavili?
Kolik vypadá čas?

Dzordzik
52.6315789474 %
52.6315789474 %
Příspěvky: 1799
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#147 Příspěvek od Dzordzik » stř 07 lis, 2018 06:37

Zkoušel, fungovalo, ale nepomohlo, jestli bude čas, zavolám. Tohle je na psaní na dlouho - standardní problém - afinita.
-
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Dzordzik
52.6315789474 %
52.6315789474 %
Příspěvky: 1799
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#148 Příspěvek od Dzordzik » stř 07 lis, 2018 12:33

Zeptám se, spočítal jsem snad po 50 letech prvních 44 jednotek a hned mi došlo že ve 3 z nich byly nalezeny prvočísla. Předpokládám že to není až tak neobvyklé, ale nedokážu posoudit nakolik je nález důvec k něčemu užitečný. Od jaké délky je to opravdu zásadní objev?

Jeden z objevů je tento:
Congratulations! Our records indicate that a computer registered by you has found a unique Arithmetic Progression of primes of length 21. This computer is assigned to the AP27 project. Since primes found in this subproject are not large enough to report to the Top 5000 Primes List, your AP20 sequence is visible immediately.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1311
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Aplikace

#149 Příspěvek od Czech Human » stř 07 lis, 2018 12:52

Tak nedostaly se ti do Top 5000 ale pořád se jedná o pěkně velká prvočísla. Uděláš tím největší radost patrně ČEZu, následovanému nějakým matematikem a možná i kryptoanalytikem. Sám ses už mohl dostatečně potěšit tím, jak dlouho sis mohl nahřívat nohy u bedny 45hh.
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Dzordzik
52.6315789474 %
52.6315789474 %
Příspěvky: 1799
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#150 Příspěvek od Dzordzik » stř 07 lis, 2018 13:16

No právě že prd. Albert moc netopí, tak mi ani nevyhřeje dílnu.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#151 Příspěvek od Honza » stř 07 lis, 2018 13:20

O významnosti jednotlivých AP21-27 jsem psal v pátek tady.
Shrnuji tam nálezy své, šanci na badge AP26 a výsledky projektu AP27.

Dzordzik
52.6315789474 %
52.6315789474 %
Příspěvky: 1799
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#152 Příspěvek od Dzordzik » stř 07 lis, 2018 13:59

Jj, to jsem četl, ale tomu projektu nerozumíc mi unikly souvislosti. Teď už jsem v obraze, děkuju.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#153 Příspěvek od Honza » stř 12 pro, 2018 18:28

Asi to není úplně k aplikaci, spíše k aplikaci AP vs verze ovladačů.
Zajímavé čtení.
Výsledek z nVidie čtu tak, že: upravte si aplikaci, drivery upravovat nebudeme.
Alespoň je zajímavé, kde je potíž a úprava aplikace nevypadá složitě.

FYI
https://devtalk.nvidia.com/default/topi ... 6/#5303366

Topic: GeForce Drivers 4xx.xx drop more than 2/3 in OpenCL Performance from the 3xx.xx Drivers



There is no point in testing newer drivers; I don't expect any changes in this respect. Changes are required in the application if they want to restore performance with the newer drivers.

Current Scenario in ap26 app:

1. App queries CL_KERNEL_WORK_GROUP_SIZE in order to decide local work group size of either 1024 (seems optimal) or 64 (sub-optimal). If app gets value for query <1024 it reduces local work group size to 64 assuming device doesn't support 1024.

2. Nvidia OpenCL Driver changed return value for CL_KERNEL_WORK_GROUP_SIZE from 1024 to 256.

3. App is not using CL_KERNEL_WORK_GROUP_SIZE returned by driver as is, but just choosing a non-optimal local work-group size (64) based on this query.


What should developers do:

• Query CL_KERNEL_WORK_GROUP_SIZE to get just hint about work group size from driver and use it to launch kernel with that specific value. It need not be optimal for all kernels.

• App is free to choose any value from range [1 , CL_DEVICE_MAX_WORK_GROUP_SIZE] to get best possible work group size for different kernels, irrespective of CL_KERNEL_WORK_GROUP_SIZE returned by driver.


Suggestions specific to ap26:

• App can query CL_DEVICE_MAX_WORK_GROUP_SIZE and set work group size accordingly instead of using CL_KERNEL_WORK_GROUP_SIZE.

• Simplest solution for ap26 would be to use 1024 work group size directly if it comes in range [1 , CL_DEVICE_MAX_WORK_GROUP_SIZE].


I don't know how to best communicate the above information to the developers. If there is a good way to do that, please advise

Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#154 Příspěvek od Honza » pon 15 dub, 2019 09:08

K testování je novější LLR aplikace s číslem 3.8.23

Z pohledu novinek je zásadní podpora AVX 512 instrukcí...kdo má to štěstí na procesor.

LookAS
42.1052631579 %
42.1052631579 %
Příspěvky: 796
Registrován: ned 02 pro, 2007 14:34
rok narození: 12 čer 1981
ID CNT statistics: 9215
Bydliště: Přelouč
Kontaktovat uživatele:

Re: Aplikace

#155 Příspěvek od LookAS » pon 15 dub, 2019 09:16

paráda, omezím mersenne (prime95) a vyzkouším.

edit: rychlý manuální bench vypadá pěkně jako na mersenne (ještě aby ne :))
llr.exe -d -q"152267*2^15220227+1" -t12

AVX2/FMA3 3500MHz: ~0.700ms/iter, CPU Power 189W, teplota nejteplejšího jádra 69C, llr 3.8.21
AVX512 3000MHz: ~0.550ms/iter, CPU Power 160W, teplota nejteplejšího jádra 61C, llr 3.8.23

stejně jako na mersene je to i při nižší frekvenci cpu při AVX512 rychlejší, s bonusem menší spotřeby a teploty. a to se vyplatí.
-LookAS- ~ Core i9-7920X + AiO Corsair H110i GT, ASRock Taichi, 32GB Corsair 4133MHz , 2x Gigabyte GTX 1080 Ti Gaming OC, Win 10 x64
PG: Obrázek

Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#156 Příspěvek od Honza » pon 15 dub, 2019 10:30

Jj, je to zásadně rychlejší a vůbec to přináší dost výhod, proto jsem to zmiňoval.
Zatím ve fázi testování, což ještě pár týdnů bude...a pak to bude oficiální verzí.

Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#157 Příspěvek od Honza » čtv 16 kvě, 2019 13:33

Právě probíhá oficiální testovaní LLR 3.8.23, která podporuje AVX-512.

Je to docela fuška zkompletovat všechny testy - Win vs Linux vs Mac, BOINC single thread, BOINC multi-thread, manual single thread, manual multi-thread, také AVX-512, FMA3, AVX, SSE3, 32-bit varianty.
A pro každou variantu různé druhy tasků jako PPSE, SoB, SR5, Woo, SGS.
Celkově do stovek testů.
Vzal jsem si na startost Windows a AVX-512, pro BOINC i manual, single-thread i multi-thread varianty.

Pokud s tím chcete pomoci, tak viz LLR 3.8.23 Testing
Proběhnout-li testy ok, bude verze nasazena jako standardní aplikace.
Kredit se standardně přiděluje.

Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#158 Příspěvek od Honza » úte 21 kvě, 2019 08:26

LLR 3.8.23, která podporuje AVX-512, je částečně venku jako oficiální verze.
Pro 64-bit systémy, pro 32-bit Linux; 32-bit Win se ještě čeká na výsledky testů.

Dzordzik
52.6315789474 %
52.6315789474 %
Příspěvky: 1799
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#159 Příspěvek od Dzordzik » úte 21 kvě, 2019 10:04

Je tam nějaká optimalizace i pro CPU, které 512ku nemají nebo je to jenom o tom?
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Honza
57.8947368421 %
57.8947368421 %
Příspěvky: 2380
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#160 Příspěvek od Honza » úte 21 kvě, 2019 10:45

LLR 3.8.23 nemá nové funkce, obsahuje novou verzi gwnum knihovny, která přináší podporu AVX-512.
A pak nějaké opravy proti verzi 3.8.22.

Trhákem je AVX-512: zvýšení výkonu o desítky procent a přitom bez navýšení resp. dokonce snížení spotřeby třeba o 15-20% - narozdíl od FMA3.

Odpovědět

Zpět na „PrimeGrid“