Aplikace

Fórum o projektu
Odpovědět
Zpráva
Autor
Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#141 Příspěvek od Honza »

Dzordzik píše: pon 05 lis, 2018 11:43Kolik ti žere to PC s RTX při počítání GFN-21 cca?
Kolik žere sestava nevím, ale u AP27 bere GPU orientačně 190W, PPS Sieve je přibližně 220-230W a GFN méně (tuším 150W u GFN17Mega, pak to stoupá).
Když budu mít čas a budu u stroj, mohu zkusit změřit...

EDIT: Tak GFN18 si bere 175-180W, GFN21 kolem 230W a slibuje čas kolem 7:15 hodin.

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#142 Příspěvek od Dzordzik »

Honza píše: pon 05 lis, 2018 07:59
Dzordzik píše: pon 05 lis, 2018 06:11Zkusil jsem na Albertovi cvičně pustit GFN21 a po 18h a 10m z něj vypadly 4 jednotky, tj. jedna jednotka průměrně co 4 a půl hodiny. Spotřeba 415W pod Windows. Zatím jsem s tím nějak nelaboroval, zkusil jsem jedno nastavení a z něj vypadlo tohle.
To je velmi slušný výsledek 22rrr
RTX 2080 udělá jednotku asi za 7 hodin.
Tak jsem zkusil ještě jedno nastavení a je to opět o velký kus lepší, skoro o hodinu na sadu! Aktuálně nejlepší výsledek je teda pro GFN-21 místo víc jak 18h lehce přes 17h na sadu, takže z něj vypadne 1WU průměrně za 15433s, tj. za 4h a 17min.

Co je ale ještě důležitější je, že spotřeba při tomto nastavení spadla ze 415W na 326W, tj. skoro o 90W dolů, tj. cca o 20%! Výpočet jede na FMA3 transformacích.

Ještě zkusím jedno nastavení a víc už s tím asi laborovat nebudu a zkusím AP27 co to udělá ...
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#143 Příspěvek od Dzordzik »

Mohl by mi prosím někdo v PG zdatnější poradit co mám blbě? Chci omezit počet souběžně počítaných tasků pro CPU AP27.

<app_version>
<app_name>ap26</app_name>
<fraction_done_exact/>
<plan_class>CPU_AP27</plan_class>
<max_concurrent>2</max_concurrent>
</app_version>
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Aplikace

#144 Příspěvek od nenym »

Řekl bych, že to nejde, <max_concurrent> lze použít v sekci <app>, nikoli v sekci <app_version> (stejně jako <fraction_done_exact/>). Správně by mělo být <plan_class>cpu_AP27</plan_class>, ale to IMHO nepomůže.
Blíže zde.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#145 Příspěvek od Dzordzik »

Tak se nakonec podařilo a funguje to jak jsem potřeboval, tj. jenom 40 CPU tasků a 1 GPU task. Díky za nakopnutí správným směrem. Potřeboval jsem si pohrát s počtem CPU tasků spuštěných najednou, abych uvolnil jádra na obou CPU.

Kdyby si někdo chtěl hrát tak šémhamforáš je:

<app>
<name>ap26</name>
<fraction_done_exact/>
<max_concurrent>41</max_concurrent>
<app_version>
<plan_class>cpu_AP27</plan_class>
</app_version>
</app>

Počítejte s tím že počet v max concurent je součtem CPU i GPU jednotek, proto tam mám 41.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#146 Příspěvek od Honza »

Někdo to na PG řešil 4 CPU a 1 GPU nebo 4 CPU a 2 GPU, ale nemůžu to najít.
Že by mohl byt plan_class case sensitive mě také napadlo.

Hlavně že to fungá a že ostatní ví, jak na to.

Mimochodem, zkoušel ty ruční testy, jak jsme se dnes po telefonu bavili?
Kolik vypadá čas?

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#147 Příspěvek od Dzordzik »

Zkoušel, fungovalo, ale nepomohlo, jestli bude čas, zavolám. Tohle je na psaní na dlouho - standardní problém - afinita.
-
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#148 Příspěvek od Dzordzik »

Zeptám se, spočítal jsem snad po 50 letech prvních 44 jednotek a hned mi došlo že ve 3 z nich byly nalezeny prvočísla. Předpokládám že to není až tak neobvyklé, ale nedokážu posoudit nakolik je nález důvec k něčemu užitečný. Od jaké délky je to opravdu zásadní objev?

Jeden z objevů je tento:
Congratulations! Our records indicate that a computer registered by you has found a unique Arithmetic Progression of primes of length 21. This computer is assigned to the AP27 project. Since primes found in this subproject are not large enough to report to the Top 5000 Primes List, your AP20 sequence is visible immediately.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1372
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Aplikace

#149 Příspěvek od Czech Human »

Tak nedostaly se ti do Top 5000 ale pořád se jedná o pěkně velká prvočísla. Uděláš tím největší radost patrně ČEZu, následovanému nějakým matematikem a možná i kryptoanalytikem. Sám ses už mohl dostatečně potěšit tím, jak dlouho sis mohl nahřívat nohy u bedny 45hh.
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#150 Příspěvek od Dzordzik »

No právě že prd. Albert moc netopí, tak mi ani nevyhřeje dílnu.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#151 Příspěvek od Honza »

O významnosti jednotlivých AP21-27 jsem psal v pátek tady.
Shrnuji tam nálezy své, šanci na badge AP26 a výsledky projektu AP27.

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#152 Příspěvek od Dzordzik »

Jj, to jsem četl, ale tomu projektu nerozumíc mi unikly souvislosti. Teď už jsem v obraze, děkuju.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#153 Příspěvek od Honza »

Asi to není úplně k aplikaci, spíše k aplikaci AP vs verze ovladačů.
Zajímavé čtení.
Výsledek z nVidie čtu tak, že: upravte si aplikaci, drivery upravovat nebudeme.
Alespoň je zajímavé, kde je potíž a úprava aplikace nevypadá složitě.

FYI
https://devtalk.nvidia.com/default/topi ... 6/#5303366

Topic: GeForce Drivers 4xx.xx drop more than 2/3 in OpenCL Performance from the 3xx.xx Drivers



There is no point in testing newer drivers; I don't expect any changes in this respect. Changes are required in the application if they want to restore performance with the newer drivers.

Current Scenario in ap26 app:

1. App queries CL_KERNEL_WORK_GROUP_SIZE in order to decide local work group size of either 1024 (seems optimal) or 64 (sub-optimal). If app gets value for query <1024 it reduces local work group size to 64 assuming device doesn't support 1024.

2. Nvidia OpenCL Driver changed return value for CL_KERNEL_WORK_GROUP_SIZE from 1024 to 256.

3. App is not using CL_KERNEL_WORK_GROUP_SIZE returned by driver as is, but just choosing a non-optimal local work-group size (64) based on this query.


What should developers do:

• Query CL_KERNEL_WORK_GROUP_SIZE to get just hint about work group size from driver and use it to launch kernel with that specific value. It need not be optimal for all kernels.

• App is free to choose any value from range [1 , CL_DEVICE_MAX_WORK_GROUP_SIZE] to get best possible work group size for different kernels, irrespective of CL_KERNEL_WORK_GROUP_SIZE returned by driver.


Suggestions specific to ap26:

• App can query CL_DEVICE_MAX_WORK_GROUP_SIZE and set work group size accordingly instead of using CL_KERNEL_WORK_GROUP_SIZE.

• Simplest solution for ap26 would be to use 1024 work group size directly if it comes in range [1 , CL_DEVICE_MAX_WORK_GROUP_SIZE].


I don't know how to best communicate the above information to the developers. If there is a good way to do that, please advise

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#154 Příspěvek od Honza »

K testování je novější LLR aplikace s číslem 3.8.23

Z pohledu novinek je zásadní podpora AVX 512 instrukcí...kdo má to štěstí na procesor.

LookAS
42.1052631579 %
42.1052631579 %
Příspěvky: 830
Registrován: ned 02 pro, 2007 14:34
rok narození: 12 čer 1981
ID CNT statistics: 9215
Bydliště: Přelouč
Kontaktovat uživatele:

Re: Aplikace

#155 Příspěvek od LookAS »

paráda, omezím mersenne (prime95) a vyzkouším.

edit: rychlý manuální bench vypadá pěkně jako na mersenne (ještě aby ne :))
llr.exe -d -q"152267*2^15220227+1" -t12

AVX2/FMA3 3500MHz: ~0.700ms/iter, CPU Power 189W, teplota nejteplejšího jádra 69C, llr 3.8.21
AVX512 3000MHz: ~0.550ms/iter, CPU Power 160W, teplota nejteplejšího jádra 61C, llr 3.8.23

stejně jako na mersene je to i při nižší frekvenci cpu při AVX512 rychlejší, s bonusem menší spotřeby a teploty. a to se vyplatí.
-LookAS- ~ Core i9-7920X + Be quiet! Dark Rock PRO 4, ASRock Taichi, 32GB Corsair 4133MHz , RTX 3070 + RTX A4000, Win 10 x64
PG: Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#156 Příspěvek od Honza »

Jj, je to zásadně rychlejší a vůbec to přináší dost výhod, proto jsem to zmiňoval.
Zatím ve fázi testování, což ještě pár týdnů bude...a pak to bude oficiální verzí.

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#157 Příspěvek od Honza »

Právě probíhá oficiální testovaní LLR 3.8.23, která podporuje AVX-512.

Je to docela fuška zkompletovat všechny testy - Win vs Linux vs Mac, BOINC single thread, BOINC multi-thread, manual single thread, manual multi-thread, také AVX-512, FMA3, AVX, SSE3, 32-bit varianty.
A pro každou variantu různé druhy tasků jako PPSE, SoB, SR5, Woo, SGS.
Celkově do stovek testů.
Vzal jsem si na startost Windows a AVX-512, pro BOINC i manual, single-thread i multi-thread varianty.

Pokud s tím chcete pomoci, tak viz LLR 3.8.23 Testing
Proběhnout-li testy ok, bude verze nasazena jako standardní aplikace.
Kredit se standardně přiděluje.

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#158 Příspěvek od Honza »

LLR 3.8.23, která podporuje AVX-512, je částečně venku jako oficiální verze.
Pro 64-bit systémy, pro 32-bit Linux; 32-bit Win se ještě čeká na výsledky testů.

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Aplikace

#159 Příspěvek od Dzordzik »

Je tam nějaká optimalizace i pro CPU, které 512ku nemají nebo je to jenom o tom?
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#160 Příspěvek od Honza »

LLR 3.8.23 nemá nové funkce, obsahuje novou verzi gwnum knihovny, která přináší podporu AVX-512.
A pak nějaké opravy proti verzi 3.8.22.

Trhákem je AVX-512: zvýšení výkonu o desítky procent a přitom bez navýšení resp. dokonce snížení spotřeby třeba o 15-20% - narozdíl od FMA3.

Odpovědět

Zpět na „PrimeGrid“