Aplikace pro nVidia GPU

Fórum o projektu
Zpráva
Autor
zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Aplikace pro nVidia GPU

#1 Příspěvek od zdenek »

Takže pomalu nastává čas pro nové téma. Poprosím kyonga o přesun ve fóru nahoru k tématu "Aplikace".

Nejprve je nutné uvést, že je otázka, zda se vyplatí počítat na nVidia GPU kartách. Vzhledem ke skutečnosti, že od 6xx karet konzumuje aplikace také jedno jádro CPU, tak to jedno jádro by to na sse3/avx spočítalo rychleji.

Každopádně se ukázalo, že je nutné aplikaci totálně rozložit na malé části, což s sebou přineslo docela masivní přeprogramování. A jestě není všemu konec, jelikož se jeví jako jediné schůdné řešení ještě navíc zparalelizovat výpočet jednotlivých kousků a to každý jinak podle pokrytí karty v závislosti na povaze daného výpočtu.

Současný stav je takový:

GTX Titan spočítá jednu 120 kreditovou úlohu za cca 58 min, současnou 240 kreditovou za dvojnásobek. Potřebuje k tomu 4G GPURAM 45hh a zapnute double precision. Paměti se nelekejte, čas je ještě stále mimo mísu, ale vypadá to, že to spíše vadne na velikostech lokání paměti v kombinaci s nízkým pokrytím na kartě (cca 12 %). Každopádně úpravou kódu a přeskládáváním se mi podařilo stáhnou čas z cca 8h na těch 58 min. Takže prostor tam určitě je, jen to zabere další čas.

Z

jiri kovar
47.3684210526 %
47.3684210526 %
Příspěvky: 1187
Registrován: ned 20 črc, 2008 09:31

Re: Aplikace pro nVidia GPU

#2 Příspěvek od jiri kovar »

Možná dotaz blba, ale i tak ho sem dám:
Má při současném výkonu, který bude pravděpodobně ještě stoupat, smysl trápit se s GPU aplikací?
Anebo taky, za jak dlouho by byly spočítány všechny známé asteroidy při současném výkonu? Jistě budou v čase nabíhat další objekty či data ke zpracování, ale tipuju, že ne tak rychle, jak budeme schopni je spočítat.
Pokud ten základní soubor známých dat vychází s tímto výkonem na desítky let, tak asi GPU smysl má (bude-li efektivní např. jako u Milky way - ne jako u Einsteina či SETI), ale jestli je to jen na jednotky roků, tak by to byla spíš aplikace pro radost z toho, že máme GPU aplikaci (a pro nabytí zkušeností, což bych bral taky jako argument).
Zatím podle toho, že je potřeba double precision, mi vychází, že snad to dobře budou počítat karty s jádrem 110, či ze starší série karty řady 5xx, ale ty ostatní stejně budou málo efektivní.
Pro srovnání: cca 1 hodina výpočtu wu je u 3930K na 4,0 GHz při 8 (slovy osmi) souběžně počítaných wu.
Kdyby se podařilo čas zkrátit 8x, tedy na cca 7 minut, tak jsme pořád "jen" na výkonu 3930K při spotřebě 130W (a to nemluvím o aplikaci s AVX 2.0, která má časy asi poloviční a a při vědomí, že stroje s AVX 2.0 se budou stále množit).
Aby se to vyrovnalo na waty, které spotřebuje grafická karta, tak by se musely časy výpočtu snížit někam kolem 4 minut. To je zároveň přibližná hranice toho, kde by teoreticky výpočet začal být efektivnější na vydanou energii (ovšem jen začal, neb do toho nepočítám součinnost CPU)...
Na závěr se omlouvám, že jsem takový pesimista a držím palec :smt023

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#3 Příspěvek od zdenek »

jiri kovar píše:Možná dotaz blba, ale i tak ho sem dám:
Má při současném výkonu, který bude pravděpodobně ještě stoupat, smysl trápit se s GPU aplikací?
Anebo taky, za jak dlouho by byly spočítány všechny známé asteroidy při současném výkonu? Jistě budou v čase nabíhat další objekty či data ke zpracování, ale tipuju, že ne tak rychle, jak budeme schopni je spočítat.
Pokud ten základní soubor známých dat vychází s tímto výkonem na desítky let, tak asi GPU smysl má (bude-li efektivní např. jako u Milky way - ne jako u Einsteina), ale jestli je to jen na jednotky roků, tak by to byla spíš aplikace pro radost z toho, že máme GPU aplikaci (a pro nabytí zkušeností, což bych bral taky jako argument).
Tam těch šutrů je. Navíc je před námi ještě zdroj dat z infračerveného spektra.
Zatím podle toho, že je potřeba double precision, mi vychází, že snad to dobře budou počítat karty s jádrem 110, či ze starší série karty řady 5xx, ale ty ostatní stejně budou málo efektivní.
I to double precision se zkoumá.
Na závěr se omlouvám, že jsem takový pesimista a držím palec
Nejsi pesimista, jen realista. Taky se uvidí do budoucna.

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19635
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: Aplikace pro nVidia GPU

#4 Příspěvek od forest »

:smt038

O množství dat se nemusíme do budoucna bát. Pan-starrs ještě není ukončen a ten by měl právě naše data chrlit ve velkém a to už ani nemluvím o době zhruba za 5 let, kdy se vrátí Gaia. Čím lépe budou vyladěné všechny aplikace, tím dříve a lépe budeme moci dodávaná data zpracovat. Do té doby by to chtělo otestovat a vyladit i tu aplikaci pro infračervěné spektrum, kde náročnost na výkon stoupne zhruba stonásobně.

Jsem moc rád za práci na GPU aplikaci a rád ji budu testovat. Mám doma 650ti a 560ti, takže mohu porovnávat. Osobně na nich jedu občasně jen Seti@home a Einstein, takže případný nízký příděl kreditu mně vůbec nevadí.

Uživatelský avatar
Murphy.cz
42.1052631579 %
42.1052631579 %
Příspěvky: 661
Registrován: pát 06 kvě, 2011 18:18
ID CNT statistics: 16550
Kontaktovat uživatele:

Re: Aplikace pro nVidia GPU

#5 Příspěvek od Murphy.cz »

No jo, mám 650ti a 660ti, nějaká pěkná práce pro ně by byla fajn :smt006
Obrázek

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Aplikace pro nVidia GPU

#6 Příspěvek od nenym »

Ani tak moc nejde o mizerný či dobrý kredit, ale dost podstatná je efektivita spotřeby elektřiny. Dokud bude CPU efektivnější, je počítání na GPU spíše fandovství.
Jinak klobouk dolů, že jsi dospěl až do tohoto stadia v krátké době 22rrr . Pokud si dobře pamatuji, na POEM trval vývoj aplikace přes rok. S Einsteinem se trápí téměř tři roky a pořád je to celkem bída a utrpení zejména na ATI, nejefektivnější je počítání na intel_gpu.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

Uživatelský avatar
vinn
42.1052631579 %
42.1052631579 %
Příspěvky: 802
Registrován: ned 03 bře, 2013 22:13
rok narození: 12 zář 1975
ID CNT statistics: 14137
Bydliště: Praha

Re: Aplikace pro nVidia GPU

#7 Příspěvek od vinn »

pokud budete potrebovat, nabizim 660, 770, k20 k testovani, staci jen napsat :)
Obrázek
PrimeGrid: My PRIMES | Asteroids: 7782 Mony | The SkyNet: My TROPHIES | Yoyo: My ECM found factors | UOTD
-----------------------------------------------------------------------------------------------------------------------------------------------
RoG: AMD Ryzen 7 2700X | Asus ROG CROSSHAIR VII HERO | G.Skill Ripjaws V 4x8192MB DDR4 3000 | 2x EVGA GeForce GTX 980 Ti SC | Windows 10 Home x64 Edition

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#8 Příspěvek od zdenek »

Zajímavé je, že hlavním problémem není výkon karet, což jsem očekával. Naopak je hlavním problémem architektura, šitá samozřejmě na míru grafice. Je velký problém obsadit celou kartu. Těch 58 minut je s 10% obazeností, takže by to teoreticky mělo počítat za 5 minut. Jenže jenom teoreticky. Occupancy má tak limitující pravidla, že se to jen těžko upravuje. Sharedmem je úplně mimo, 48kb pro celý smx je pro asteroidy málo, když double má 8 bajtů. Registry jsou tochu lepší, především u 6xx a výše a dají se naštěstí limitovat překladačem.

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#9 Příspěvek od zdenek »

Momentální stav:

24 min. na Titanu

45nn

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#10 Příspěvek od zdenek »

Poslední stav:

cca 14 min na titanu (120 kreditová). Lepší už to nebude. Obsazení karty je cca 62%. Lze udělat i 100% ale je to pomalejší.

Příštý týden připravím testovací vezi s app_info jako náhradu za cpu verzi.

Z

Doktor
52.6315789474 %
52.6315789474 %
Příspěvky: 1267
Registrován: pon 22 lis, 2010 17:40
rok narození: 30 črc 1981
ID CNT statistics: 15029
Bydliště: Hřebeč
Kontaktovat uživatele:

Re: Aplikace pro nVidia GPU

#11 Příspěvek od Doktor »

zdenku a nejdou tedy počítat dvě naráz, aby se ta karta využila?
Počítadlo: Intel C2D 2.66 GHz, MSI P-35 Platinum,A-Data 2x(1+2)GB Ram (dual channel)5-5-5-15, Gigabyte ATI HD5870 840/900MHz Catalysty 11.12, Boinc 7.4.42, Windows 7 64-bit
Od 1.11.2015 do 27.2.2016 hrdý sponzor GOLEMa
Obrázek

jiri kovar
47.3684210526 %
47.3684210526 %
Příspěvky: 1187
Registrován: ned 20 črc, 2008 09:31

Re: Aplikace pro nVidia GPU

#12 Příspěvek od jiri kovar »

No to je v loji :smt022 hlavně proto, že efektivita je v háji a na CPU to jede mnohem efektivněji (SSE2 a pokročilejší instrukce).
Co s tím? Lze-li vůbec něco. Nabízí se ještě open CL s vědomím, že někdy bývá rychlejší a někdy pomalejší než CUDA.
Pak ještě AMD karty s open CL a to je asi tak všechno. Navíc s tím, že se těžko najde v komunitě programátor na open CL.
Pak ještě možnost oslovit dr. Ďurecha, aby to zadal jako studentskou práci (byla by možnost i mezifakultní spolupráce?).

2 Zdeněk: Opravdu 22rrr před tvým entuziasmem. Nechci nějak předbíhat, ale i slepé cestičky je třeba prošlapat (BOINC jako takový je toho příkladem).
Když jsem nedávno četl cosi o akademii věd a spolupráci s průmyslem, tak mi to připadalo, že se rezignuje na základní výzkum a jedou se jenom ty věci, které mají rychlý efekt...jenže někde se začít musí.

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#13 Příspěvek od zdenek »

Doktor píše:zdenku a nejdou tedy počítat dvě naráz, aby se ta karta využila?
Tím si nepomůžeš, karte jede 100%. Jen není možné ve stejnou dobu využít všechny jednotky, hlavně kvůli nedostatku registrů.

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#14 Příspěvek od zdenek »

jiri kovar píše:No to je v loji :smt022 hlavně proto, že efektivita je v háji a na CPU to jede mnohem efektivněji (SSE2 a pokročilejší instrukce).
Co s tím? Lze-li vůbec něco. Nabízí se ještě open CL s vědomím, že někdy bývá rychlejší a někdy pomalejší než CUDA.
Pak ještě AMD karty s open CL a to je asi tak všechno. Navíc s tím, že se těžko najde v komunitě programátor na open CL.
Pak ještě možnost oslovit dr. Ďurecha, aby to zadal jako studentskou práci (byla by možnost i mezifakultní spolupráce?).

2 Zdeněk: Opravdu 22rrr před tvým entuziasmem. Nechci nějak předbíhat, ale i slepé cestičky je třeba prošlapat (BOINC jako takový je toho příkladem).
Když jsem nedávno četl cosi o akademii věd a spolupráci s průmyslem, tak mi to připadalo, že se rezignuje na základní výzkum a jedou se jenom ty věci, které mají rychlý efekt...jenže někde se začít musí.
Na opencl jsem se už díval, z té cuda verze už by se dalo. Je to trochu Cimrmanovský závěr.

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#15 Příspěvek od zdenek »

Tak je zajímavé, že jsem vypnul double precision a karta jede na 1006 MHz plus dorbné úpravy a je to 11,5 min. Paměťový řadič 40-50%.

Edit: 10,5 min.

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#16 Příspěvek od zdenek »

Tak se mi "podařilo" zrušit komentář na jedom řádku, který jsem tam já blbec dal a výsledek je, že už není potřeba cpu jádro. Zatížení CPU nula nula nic.

Rychlost 10,5 min + čas na úvodní optimalizaci cca 1 min.

Uživatelský avatar
Murphy.cz
42.1052631579 %
42.1052631579 %
Příspěvky: 661
Registrován: pát 06 kvě, 2011 18:18
ID CNT statistics: 16550
Kontaktovat uživatele:

Re: Aplikace pro nVidia GPU

#17 Příspěvek od Murphy.cz »

Jen tak dál, za chvíli už vystačíš s tužkou a řeznickou kalkulačkou 33zzz
Obrázek

Uživatelský avatar
Ondra@SF.cz
36.8421052632 %
36.8421052632 %
Příspěvky: 597
Registrován: pon 22 úno, 2010 16:36
rok narození: 09 úno 1993
ID CNT statistics: 8123
Bydliště: Space Family
Kontaktovat uživatele:

Re: Aplikace pro nVidia GPU

#18 Příspěvek od Ondra@SF.cz »

Hmm, OpenCL aplikace by byla na bakalarku asi overkill, ale docela me to jako studenta druhaku na FIT CVUT (obor Teoreticka Informatika) zajima 45cc
Pocitadlo : Deska - ASRock Fatal1ty Z77 Killer, CPU - Intel Pentium G3220(Haswell), 8GB RAM DDR3, GPU - ASUS DCIIOC AMD Radeon HD7790, Case - Chieftec LBX-02B-B-B, zdroj Seasonic X-1050 Gold, systém - dualboot ArchLinux (AntergOS) + Windows 8.1 64bit
Moje statistiky : BoincStats, B.Mundayweb, PrimeGrid a statistiky CNT od vklibera ;)
PG medaile : Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek
WCG medaile : ObrázekObrázekObrázekObrázekObrázekObrázekObrázekObrázek
Poslouchám asi tak tohle (my Last.fm music profile)...
Obrázek

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1361
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace pro nVidia GPU

#19 Příspěvek od zdenek »

Chces poslat zdrojaky?

Uživatelský avatar
Ondra@SF.cz
36.8421052632 %
36.8421052632 %
Příspěvky: 597
Registrován: pon 22 úno, 2010 16:36
rok narození: 09 úno 1993
ID CNT statistics: 8123
Bydliště: Space Family
Kontaktovat uživatele:

Re: Aplikace pro nVidia GPU

#20 Příspěvek od Ondra@SF.cz »

Bylo by to fajn 45cc O vanocich bych si urcite udelal cas a mrknul bych na to. Predpokladam, ze je to v C/C++. Diky 45cc
Pocitadlo : Deska - ASRock Fatal1ty Z77 Killer, CPU - Intel Pentium G3220(Haswell), 8GB RAM DDR3, GPU - ASUS DCIIOC AMD Radeon HD7790, Case - Chieftec LBX-02B-B-B, zdroj Seasonic X-1050 Gold, systém - dualboot ArchLinux (AntergOS) + Windows 8.1 64bit
Moje statistiky : BoincStats, B.Mundayweb, PrimeGrid a statistiky CNT od vklibera ;)
PG medaile : Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek
WCG medaile : ObrázekObrázekObrázekObrázekObrázekObrázekObrázekObrázek
Poslouchám asi tak tohle (my Last.fm music profile)...
Obrázek

Odpovědět

Zpět na „Asteroids@home“