Aplikace pro nVidia GPU
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Aplikace pro nVidia GPU
Takže pomalu nastává čas pro nové téma. Poprosím kyonga o přesun ve fóru nahoru k tématu "Aplikace".
Nejprve je nutné uvést, že je otázka, zda se vyplatí počítat na nVidia GPU kartách. Vzhledem ke skutečnosti, že od 6xx karet konzumuje aplikace také jedno jádro CPU, tak to jedno jádro by to na sse3/avx spočítalo rychleji.
Každopádně se ukázalo, že je nutné aplikaci totálně rozložit na malé části, což s sebou přineslo docela masivní přeprogramování. A jestě není všemu konec, jelikož se jeví jako jediné schůdné řešení ještě navíc zparalelizovat výpočet jednotlivých kousků a to každý jinak podle pokrytí karty v závislosti na povaze daného výpočtu.
Současný stav je takový:
GTX Titan spočítá jednu 120 kreditovou úlohu za cca 58 min, současnou 240 kreditovou za dvojnásobek. Potřebuje k tomu 4G GPURAM a zapnute double precision. Paměti se nelekejte, čas je ještě stále mimo mísu, ale vypadá to, že to spíše vadne na velikostech lokání paměti v kombinaci s nízkým pokrytím na kartě (cca 12 %). Každopádně úpravou kódu a přeskládáváním se mi podařilo stáhnou čas z cca 8h na těch 58 min. Takže prostor tam určitě je, jen to zabere další čas.
Z
Nejprve je nutné uvést, že je otázka, zda se vyplatí počítat na nVidia GPU kartách. Vzhledem ke skutečnosti, že od 6xx karet konzumuje aplikace také jedno jádro CPU, tak to jedno jádro by to na sse3/avx spočítalo rychleji.
Každopádně se ukázalo, že je nutné aplikaci totálně rozložit na malé části, což s sebou přineslo docela masivní přeprogramování. A jestě není všemu konec, jelikož se jeví jako jediné schůdné řešení ještě navíc zparalelizovat výpočet jednotlivých kousků a to každý jinak podle pokrytí karty v závislosti na povaze daného výpočtu.
Současný stav je takový:
GTX Titan spočítá jednu 120 kreditovou úlohu za cca 58 min, současnou 240 kreditovou za dvojnásobek. Potřebuje k tomu 4G GPURAM a zapnute double precision. Paměti se nelekejte, čas je ještě stále mimo mísu, ale vypadá to, že to spíše vadne na velikostech lokání paměti v kombinaci s nízkým pokrytím na kartě (cca 12 %). Každopádně úpravou kódu a přeskládáváním se mi podařilo stáhnou čas z cca 8h na těch 58 min. Takže prostor tam určitě je, jen to zabere další čas.
Z
-
- 47.3684210526 %
- Příspěvky: 1187
- Registrován: ned 20 črc, 2008 09:31
Re: Aplikace pro nVidia GPU
Možná dotaz blba, ale i tak ho sem dám:
Má při současném výkonu, který bude pravděpodobně ještě stoupat, smysl trápit se s GPU aplikací?
Anebo taky, za jak dlouho by byly spočítány všechny známé asteroidy při současném výkonu? Jistě budou v čase nabíhat další objekty či data ke zpracování, ale tipuju, že ne tak rychle, jak budeme schopni je spočítat.
Pokud ten základní soubor známých dat vychází s tímto výkonem na desítky let, tak asi GPU smysl má (bude-li efektivní např. jako u Milky way - ne jako u Einsteina či SETI), ale jestli je to jen na jednotky roků, tak by to byla spíš aplikace pro radost z toho, že máme GPU aplikaci (a pro nabytí zkušeností, což bych bral taky jako argument).
Zatím podle toho, že je potřeba double precision, mi vychází, že snad to dobře budou počítat karty s jádrem 110, či ze starší série karty řady 5xx, ale ty ostatní stejně budou málo efektivní.
Pro srovnání: cca 1 hodina výpočtu wu je u 3930K na 4,0 GHz při 8 (slovy osmi) souběžně počítaných wu.
Kdyby se podařilo čas zkrátit 8x, tedy na cca 7 minut, tak jsme pořád "jen" na výkonu 3930K při spotřebě 130W (a to nemluvím o aplikaci s AVX 2.0, která má časy asi poloviční a a při vědomí, že stroje s AVX 2.0 se budou stále množit).
Aby se to vyrovnalo na waty, které spotřebuje grafická karta, tak by se musely časy výpočtu snížit někam kolem 4 minut. To je zároveň přibližná hranice toho, kde by teoreticky výpočet začal být efektivnější na vydanou energii (ovšem jen začal, neb do toho nepočítám součinnost CPU)...
Na závěr se omlouvám, že jsem takový pesimista a držím palec
Má při současném výkonu, který bude pravděpodobně ještě stoupat, smysl trápit se s GPU aplikací?
Anebo taky, za jak dlouho by byly spočítány všechny známé asteroidy při současném výkonu? Jistě budou v čase nabíhat další objekty či data ke zpracování, ale tipuju, že ne tak rychle, jak budeme schopni je spočítat.
Pokud ten základní soubor známých dat vychází s tímto výkonem na desítky let, tak asi GPU smysl má (bude-li efektivní např. jako u Milky way - ne jako u Einsteina či SETI), ale jestli je to jen na jednotky roků, tak by to byla spíš aplikace pro radost z toho, že máme GPU aplikaci (a pro nabytí zkušeností, což bych bral taky jako argument).
Zatím podle toho, že je potřeba double precision, mi vychází, že snad to dobře budou počítat karty s jádrem 110, či ze starší série karty řady 5xx, ale ty ostatní stejně budou málo efektivní.
Pro srovnání: cca 1 hodina výpočtu wu je u 3930K na 4,0 GHz při 8 (slovy osmi) souběžně počítaných wu.
Kdyby se podařilo čas zkrátit 8x, tedy na cca 7 minut, tak jsme pořád "jen" na výkonu 3930K při spotřebě 130W (a to nemluvím o aplikaci s AVX 2.0, která má časy asi poloviční a a při vědomí, že stroje s AVX 2.0 se budou stále množit).
Aby se to vyrovnalo na waty, které spotřebuje grafická karta, tak by se musely časy výpočtu snížit někam kolem 4 minut. To je zároveň přibližná hranice toho, kde by teoreticky výpočet začal být efektivnější na vydanou energii (ovšem jen začal, neb do toho nepočítám součinnost CPU)...
Na závěr se omlouvám, že jsem takový pesimista a držím palec
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Tam těch šutrů je. Navíc je před námi ještě zdroj dat z infračerveného spektra.jiri kovar píše:Možná dotaz blba, ale i tak ho sem dám:
Má při současném výkonu, který bude pravděpodobně ještě stoupat, smysl trápit se s GPU aplikací?
Anebo taky, za jak dlouho by byly spočítány všechny známé asteroidy při současném výkonu? Jistě budou v čase nabíhat další objekty či data ke zpracování, ale tipuju, že ne tak rychle, jak budeme schopni je spočítat.
Pokud ten základní soubor známých dat vychází s tímto výkonem na desítky let, tak asi GPU smysl má (bude-li efektivní např. jako u Milky way - ne jako u Einsteina), ale jestli je to jen na jednotky roků, tak by to byla spíš aplikace pro radost z toho, že máme GPU aplikaci (a pro nabytí zkušeností, což bych bral taky jako argument).
I to double precision se zkoumá.Zatím podle toho, že je potřeba double precision, mi vychází, že snad to dobře budou počítat karty s jádrem 110, či ze starší série karty řady 5xx, ale ty ostatní stejně budou málo efektivní.
Nejsi pesimista, jen realista. Taky se uvidí do budoucna.Na závěr se omlouvám, že jsem takový pesimista a držím palec
- forest
- Admin webu a fóra CNT
- Příspěvky: 19635
- Registrován: pát 27 říj, 2006 10:19
- rok narození: 03 bře 1977
- ID CNT statistics: 71
- Bydliště: Újezd u Brna
Re: Aplikace pro nVidia GPU
O množství dat se nemusíme do budoucna bát. Pan-starrs ještě není ukončen a ten by měl právě naše data chrlit ve velkém a to už ani nemluvím o době zhruba za 5 let, kdy se vrátí Gaia. Čím lépe budou vyladěné všechny aplikace, tím dříve a lépe budeme moci dodávaná data zpracovat. Do té doby by to chtělo otestovat a vyladit i tu aplikaci pro infračervěné spektrum, kde náročnost na výkon stoupne zhruba stonásobně.
Jsem moc rád za práci na GPU aplikaci a rád ji budu testovat. Mám doma 650ti a 560ti, takže mohu porovnávat. Osobně na nich jedu občasně jen Seti@home a Einstein, takže případný nízký příděl kreditu mně vůbec nevadí.
-
- 78.9473684211 %
- Příspěvky: 7610
- Registrován: úte 13 led, 2009 15:33
- rok narození: 0- 0-1956
- ID CNT statistics: 10124
Re: Aplikace pro nVidia GPU
Ani tak moc nejde o mizerný či dobrý kredit, ale dost podstatná je efektivita spotřeby elektřiny. Dokud bude CPU efektivnější, je počítání na GPU spíše fandovství.
Jinak klobouk dolů, že jsi dospěl až do tohoto stadia v krátké době . Pokud si dobře pamatuji, na POEM trval vývoj aplikace přes rok. S Einsteinem se trápí téměř tři roky a pořád je to celkem bída a utrpení zejména na ATI, nejefektivnější je počítání na intel_gpu.
Jinak klobouk dolů, že jsi dospěl až do tohoto stadia v krátké době . Pokud si dobře pamatuji, na POEM trval vývoj aplikace přes rok. S Einsteinem se trápí téměř tři roky a pořád je to celkem bída a utrpení zejména na ATI, nejefektivnější je počítání na intel_gpu.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x
1x 3x 9x 12x
UotD 767x
1x 3x 9x 12x
- vinn
- 42.1052631579 %
- Příspěvky: 802
- Registrován: ned 03 bře, 2013 22:13
- rok narození: 12 zář 1975
- ID CNT statistics: 14137
- Bydliště: Praha
Re: Aplikace pro nVidia GPU
pokud budete potrebovat, nabizim 660, 770, k20 k testovani, staci jen napsat
PrimeGrid: My PRIMES | Asteroids: 7782 Mony | The SkyNet: My TROPHIES | Yoyo: My ECM found factors | UOTD
-----------------------------------------------------------------------------------------------------------------------------------------------
RoG: AMD Ryzen 7 2700X | Asus ROG CROSSHAIR VII HERO | G.Skill Ripjaws V 4x8192MB DDR4 3000 | 2x EVGA GeForce GTX 980 Ti SC | Windows 10 Home x64 Edition
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Zajímavé je, že hlavním problémem není výkon karet, což jsem očekával. Naopak je hlavním problémem architektura, šitá samozřejmě na míru grafice. Je velký problém obsadit celou kartu. Těch 58 minut je s 10% obazeností, takže by to teoreticky mělo počítat za 5 minut. Jenže jenom teoreticky. Occupancy má tak limitující pravidla, že se to jen těžko upravuje. Sharedmem je úplně mimo, 48kb pro celý smx je pro asteroidy málo, když double má 8 bajtů. Registry jsou tochu lepší, především u 6xx a výše a dají se naštěstí limitovat překladačem.
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Momentální stav:
24 min. na Titanu
24 min. na Titanu
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Poslední stav:
cca 14 min na titanu (120 kreditová). Lepší už to nebude. Obsazení karty je cca 62%. Lze udělat i 100% ale je to pomalejší.
Příštý týden připravím testovací vezi s app_info jako náhradu za cpu verzi.
Z
cca 14 min na titanu (120 kreditová). Lepší už to nebude. Obsazení karty je cca 62%. Lze udělat i 100% ale je to pomalejší.
Příštý týden připravím testovací vezi s app_info jako náhradu za cpu verzi.
Z
-
- 52.6315789474 %
- Příspěvky: 1267
- Registrován: pon 22 lis, 2010 17:40
- rok narození: 30 črc 1981
- ID CNT statistics: 15029
- Bydliště: Hřebeč
- Kontaktovat uživatele:
Re: Aplikace pro nVidia GPU
zdenku a nejdou tedy počítat dvě naráz, aby se ta karta využila?
Počítadlo: Intel C2D 2.66 GHz, MSI P-35 Platinum,A-Data 2x(1+2)GB Ram (dual channel)5-5-5-15, Gigabyte ATI HD5870 840/900MHz Catalysty 11.12, Boinc 7.4.42, Windows 7 64-bit
Od 1.11.2015 do 27.2.2016 hrdý sponzor GOLEMa
Od 1.11.2015 do 27.2.2016 hrdý sponzor GOLEMa
-
- 47.3684210526 %
- Příspěvky: 1187
- Registrován: ned 20 črc, 2008 09:31
Re: Aplikace pro nVidia GPU
No to je v loji hlavně proto, že efektivita je v háji a na CPU to jede mnohem efektivněji (SSE2 a pokročilejší instrukce).
Co s tím? Lze-li vůbec něco. Nabízí se ještě open CL s vědomím, že někdy bývá rychlejší a někdy pomalejší než CUDA.
Pak ještě AMD karty s open CL a to je asi tak všechno. Navíc s tím, že se těžko najde v komunitě programátor na open CL.
Pak ještě možnost oslovit dr. Ďurecha, aby to zadal jako studentskou práci (byla by možnost i mezifakultní spolupráce?).
2 Zdeněk: Opravdu před tvým entuziasmem. Nechci nějak předbíhat, ale i slepé cestičky je třeba prošlapat (BOINC jako takový je toho příkladem).
Když jsem nedávno četl cosi o akademii věd a spolupráci s průmyslem, tak mi to připadalo, že se rezignuje na základní výzkum a jedou se jenom ty věci, které mají rychlý efekt...jenže někde se začít musí.
Co s tím? Lze-li vůbec něco. Nabízí se ještě open CL s vědomím, že někdy bývá rychlejší a někdy pomalejší než CUDA.
Pak ještě AMD karty s open CL a to je asi tak všechno. Navíc s tím, že se těžko najde v komunitě programátor na open CL.
Pak ještě možnost oslovit dr. Ďurecha, aby to zadal jako studentskou práci (byla by možnost i mezifakultní spolupráce?).
2 Zdeněk: Opravdu před tvým entuziasmem. Nechci nějak předbíhat, ale i slepé cestičky je třeba prošlapat (BOINC jako takový je toho příkladem).
Když jsem nedávno četl cosi o akademii věd a spolupráci s průmyslem, tak mi to připadalo, že se rezignuje na základní výzkum a jedou se jenom ty věci, které mají rychlý efekt...jenže někde se začít musí.
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Tím si nepomůžeš, karte jede 100%. Jen není možné ve stejnou dobu využít všechny jednotky, hlavně kvůli nedostatku registrů.Doktor píše:zdenku a nejdou tedy počítat dvě naráz, aby se ta karta využila?
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Na opencl jsem se už díval, z té cuda verze už by se dalo. Je to trochu Cimrmanovský závěr.jiri kovar píše:No to je v loji hlavně proto, že efektivita je v háji a na CPU to jede mnohem efektivněji (SSE2 a pokročilejší instrukce).
Co s tím? Lze-li vůbec něco. Nabízí se ještě open CL s vědomím, že někdy bývá rychlejší a někdy pomalejší než CUDA.
Pak ještě AMD karty s open CL a to je asi tak všechno. Navíc s tím, že se těžko najde v komunitě programátor na open CL.
Pak ještě možnost oslovit dr. Ďurecha, aby to zadal jako studentskou práci (byla by možnost i mezifakultní spolupráce?).
2 Zdeněk: Opravdu před tvým entuziasmem. Nechci nějak předbíhat, ale i slepé cestičky je třeba prošlapat (BOINC jako takový je toho příkladem).
Když jsem nedávno četl cosi o akademii věd a spolupráci s průmyslem, tak mi to připadalo, že se rezignuje na základní výzkum a jedou se jenom ty věci, které mají rychlý efekt...jenže někde se začít musí.
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Tak je zajímavé, že jsem vypnul double precision a karta jede na 1006 MHz plus dorbné úpravy a je to 11,5 min. Paměťový řadič 40-50%.
Edit: 10,5 min.
Edit: 10,5 min.
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Tak se mi "podařilo" zrušit komentář na jedom řádku, který jsem tam já blbec dal a výsledek je, že už není potřeba cpu jádro. Zatížení CPU nula nula nic.
Rychlost 10,5 min + čas na úvodní optimalizaci cca 1 min.
Rychlost 10,5 min + čas na úvodní optimalizaci cca 1 min.
- Ondra@SF.cz
- 36.8421052632 %
- Příspěvky: 597
- Registrován: pon 22 úno, 2010 16:36
- rok narození: 09 úno 1993
- ID CNT statistics: 8123
- Bydliště: Space Family
- Kontaktovat uživatele:
Re: Aplikace pro nVidia GPU
Hmm, OpenCL aplikace by byla na bakalarku asi overkill, ale docela me to jako studenta druhaku na FIT CVUT (obor Teoreticka Informatika) zajima
Pocitadlo : Deska - ASRock Fatal1ty Z77 Killer, CPU - Intel Pentium G3220(Haswell), 8GB RAM DDR3, GPU - ASUS DCIIOC AMD Radeon HD7790, Case - Chieftec LBX-02B-B-B, zdroj Seasonic X-1050 Gold, systém - dualboot ArchLinux (AntergOS) + Windows 8.1 64bit
Moje statistiky : BoincStats, B.Mundayweb, PrimeGrid a statistiky CNT od vklibera
PG medaile :
WCG medaile :
Poslouchám asi tak tohle (my Last.fm music profile)...
Moje statistiky : BoincStats, B.Mundayweb, PrimeGrid a statistiky CNT od vklibera
PG medaile :
WCG medaile :
Poslouchám asi tak tohle (my Last.fm music profile)...
-
- 52.6315789474 %
- Příspěvky: 1361
- Registrován: pon 30 dub, 2012 20:55
- ID CNT statistics: 6334
- Bydliště: Brno
Re: Aplikace pro nVidia GPU
Chces poslat zdrojaky?
- Ondra@SF.cz
- 36.8421052632 %
- Příspěvky: 597
- Registrován: pon 22 úno, 2010 16:36
- rok narození: 09 úno 1993
- ID CNT statistics: 8123
- Bydliště: Space Family
- Kontaktovat uživatele:
Re: Aplikace pro nVidia GPU
Bylo by to fajn O vanocich bych si urcite udelal cas a mrknul bych na to. Predpokladam, ze je to v C/C++. Diky
Pocitadlo : Deska - ASRock Fatal1ty Z77 Killer, CPU - Intel Pentium G3220(Haswell), 8GB RAM DDR3, GPU - ASUS DCIIOC AMD Radeon HD7790, Case - Chieftec LBX-02B-B-B, zdroj Seasonic X-1050 Gold, systém - dualboot ArchLinux (AntergOS) + Windows 8.1 64bit
Moje statistiky : BoincStats, B.Mundayweb, PrimeGrid a statistiky CNT od vklibera
PG medaile :
WCG medaile :
Poslouchám asi tak tohle (my Last.fm music profile)...
Moje statistiky : BoincStats, B.Mundayweb, PrimeGrid a statistiky CNT od vklibera
PG medaile :
WCG medaile :
Poslouchám asi tak tohle (my Last.fm music profile)...