zvýšení výkonu v GPUGRID

Fórum o projektu
Odpovědět
Zpráva
Autor
Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19635
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

zvýšení výkonu v GPUGRID

#1 Příspěvek od forest »

Když už mám dočasně pod palcem jednoho toho Titána X a nemusím mít černé svědomí z mrhání výkonem na cizí účet, testuji ho na různých projektech a nastaveních. Aktuálně jsem na projektu GPUGRID a narazil jsem na zajímavou věc. Karta zpracuje jeden úkol za cca 11,5 hodiny. Přitom vytížená je kolem 60%, tak jsem se tomu chtěl mrknout na zoubek. Zjistil jsem, že při počítání dvou úkolů naráz, se čas výpočtu posune sice na 16 hodin, ale za něj jsou zpracované dvě, tedy významné navýšení výkonu. Přitom ale karta je vytížena stále jen na 80%. Uvolnil jsem vždy na jednu úlohu jedno CPU jádro. Ideální by asi bylo, pustit tři ty úlohy naráz. Troufám si tvrdit, že by je to stále stihlo zpracovat do 24hodin (za což je nejvyšší bonus 50%) a odvedený výkon by se ještě zvýšil. Ale projekt má limit 2 jednotky na PC, nevíte náhodou někdo, jak z něj ty 3 jednotky vyždímat?

Toto nemusí být pomoc pro navýšení výkonu pouze u takto supervýkonných grafik, ale může to fungovat i u těch pomalejších, které jednu jednotku do 24 hodin nestihnou, ale do druhé úrovně bonusu (ten je 25% a je za jednotky do 48 hodin) mají velkou rezervu. Je dost možné, že i ty by dvě jednotky zaráz zpracovaly rychleji než dvě jednotlivě po sobě a tedy by dostaly i více kreditu, za jednotku času.

Uživatelský avatar
gigadisk
47.3684210526 %
47.3684210526 %
Příspěvky: 933
Registrován: ned 27 kvě, 2007 18:54
rok narození: 26 dub 1985
ID CNT statistics: 11430
Bydliště: Lanškroun

Re: zvýšení výkonu v GPUGRID

#2 Příspěvek od gigadisk »

Jestli projekt na mašinu nepošle víc jak dvě jednotky zaráz, tak tu třetí tam nepustíš. Leda, že by ta třetí jednotka byla z jiného projektu. Ale kdo bude to appinfo upravovat, tak se zblázní. :-))
Mé největší nalezená prvočísla: 6863*2^1595297+1 (480,237 digits) 2983*2^1566580+1 (471592 digits), 4883907833457*2^1290000-1 (388,342 digits).

eisler jiri
73.6842105263 %
73.6842105263 %
Příspěvky: 4528
Registrován: sob 15 kvě, 2010 17:27
rok narození: 14 zář 1947
ID CNT statistics: 13496
Bydliště: praha 8
Kontaktovat uživatele:

Re: zvýšení výkonu v GPUGRID

#3 Příspěvek od eisler jiri »

forest zajímavá informace. ale pro celkový výkon je to pro titána mrhání. moje GTX 760 to udělá za cca 15 hodin a tak jí na GPUgrid převedu pro jeho větší slávu. ale titán musí šlapat na výkon. rozdíl mezi ním (a 760) na GPUgrid je jen 60%. a to se dá unést. titán na koláči vede 7X:
titán na koláči 4 700 000, 760tka 750 000
titán na GPUgrid odhaduji necelí meloun, na 760tce asi 430 000
jen odhad pro jednu WU na GPU
Obrázek
Obrázek

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19635
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: zvýšení výkonu v GPUGRID

#4 Příspěvek od forest »

To s kreditem a poměrem ke starším kartám je pravda, ale znáš mé priority. Já žádnou nVidii aktuálně nemám, takže ji po ty tŕi týdny jednak testuji, abych získal lepší přehled o potenciálu a zároveň využívám tam, kde osobně potřebuji přitlačit.

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: zvýšení výkonu v GPUGRID

#5 Příspěvek od nenym »

Na základě tohoto vlákna jsem udělal vlastní pokusy na GTX 750Ti a GTX 970 s aktuálně posledními drivery CUDA 7.5 (359.06) a CUDA 8 (368.81). Protože se po přechodu 7.5 -> 8 aktualizovaly widle (WDDM), počkal jsem na ověření po zpětném přechodu 8 -> 7.5. Výsledek je jednoznačný - na driverech CUDA 7.5 je stejný brand tasků na GTX 970 o cca 20 % rychlejší, na GTX 750Ti je rozdíl cca 10 % .
V tabulce je Run time/CPU time v sekundách pro brand GERARD_FXCXCL12RX (základní kredit bez bonusu 178 600).

Kód: Vybrat vše

                359.06            368.81
GTX 970     44 548/15 476     53 373/25 830    
GTX 750Ti  108 984/12 835    119 523/14 753
Podmínky: vždy vyhrazené CPU Intel Haswell core s vypnutým počítáním na Intel_GPU, karta GTX 750Ti podtaktovaná na referenční kmitočet, GTX 970 má nepatrný tovární přetakt, který nevadí. GPU tasky přiřazeny pomocí ProcessLasso jednomu jádru.
Teoreticky dosažitelný RAC na GTX 970 s drivery 359.06 je tedy přibližně 510 k - 520 k.

Na GTX 970 ověřeno na mnoha úlohách různých brandů, na GTX 750Ti po třech úlohách stejného brandu. GTX 750Ti jsem přesunul z GPUGRIDu jinam (Folding, Einstein, PG), anžto nestíhají 50 % bonus za dokončení tasku do 24 hodin.

OT:

1. Počítání Collatzu na Intel_GPU zpomaluje GTX 750 Ti o cca 5 %, GTX 970 o cca 10 %. Počítání Seti či Einsteina má ještě vyšší dopad.

2. Na Foldingu/GTX750Ti je tomu naopak.
359.06 -> 368.81: beta klient + 20 % výkonu, advanced klient + 5 % až + 10 % výkonu, záleží na projektu. GTX 970 jsem na Foldingu ještě nezkoušel.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: zvýšení výkonu v GPUGRID

#6 Příspěvek od nenym »

Shrnutí výsledků pokusů, které jsem dělal na strojích svých (GTX 750 Ti, GTX 970), Big Jerryho (GTX 1080) a týmových (TITAN X, GTX 960).

Co potřebujeme:
- GPU-Z
- Porcess Lasso https://bitsum.com/get-lasso-pro/ pro manipulaci s prioritami procesu a další finty (ProBalance)
- MSI Afterburner https://www.msi.com/page/afterburner zejména pro efektivní regulaci teploty
- pevné nervy
- udici na GPUGRID
- několik desítek minut času pro stažení, instalaci a základní nastavení, pro dokonalé doladění celkem tak dvě až tři hodiny
- nenastavovat SWAP_SYNC, pokud máte nastaveno, tak proměnnou vymazat (účinnější a zejména bezpečnější se ukázala býti manipulace s prioritou procesu)

Základní nastavení pro GPUGRID
- na dvě GPU (možná i na víc, nemám jak vyzkoušet) stačí jedno volné CPU jádro

Kód: Vybrat vše

<app_config>
  <app>
    <name>acemdlong</name>
    <fraction_done_exact/>
    <gpu_versions>
      <gpu_usage>1</gpu_usage>
      <cpu_usage>0.5</cpu_usage>
    </gpu_versions>
  </app>
  <app>
    <name>acemdshort</name>
    <fraction_done_exact/>
    <gpu_versions>
      <gpu_usage>1</gpu_usage>
      <cpu_usage>0.5</cpu_usage>
    </gpu_versions>
  </app>
</app_config>
nicméně i jediná GPU to volné jádro potřebuje. Takže si cpu_usage případně upravte dle vlastních potřeb.

Process Lasso
- zvýšit prioritu samotného procesu Process Lassa na HIGH
- nastavit prioritu GPU procesu na RealTime
- povolit ProBalance pro procesy všech priorit; nutné, zejména pokud na stroji pracujete
Moje nastavení ProBalance:
ProcessLasso.PNG
ProcessLasso.PNG (30.26 KiB) Zobrazeno 3259 x
Afterburner (zobrazeno na skinu MSI Cyborg ..... by Drerex Design)
- nastavit rozumnou křivku závislosti otáček ventilátoru na teplotě
AftBrn_fan.PNG
AftBrn_fan.PNG (21.18 KiB) Zobrazeno 3259 x
- povolit maximální možné překročení TDP
- rozpojit závislost TDP a mezní teploty
- mezní teplotu nastavit jako prioritní na 82° C
AftBrn_zaklad.PNG
AftBrn_zaklad.PNG (353.42 KiB) Zobrazeno 3239 x
Doladění
GPU-Z: sledovat vytížení GPU a zejména % TDP, čím výše, tím lépe při manipulaci s
- počtem volných jader
- prioritou GPU procesu
- vypnutým/zapnutým počítáním na intel_gpu. Mně vyšlo, že jediné, co nebrzdí výpočty na velkých GPU, je Collatz,
- detailisté si mohou nastavit v registrech TdrDelay, já jsem zjistil, že návod https://www.reddit.com/r/battlefield_4/ ... ast_patch/ nemá chybu. Od nastavení na doporučenou hodnotu 10D (=0AH) mi nespadl ani jeden GPU task.

Až bude vše naladěné, lze začít velmi opatrně s přetaktem GPU, ale já jsem dospěl k tomu, že je to na GPUGRIDu (a PG GFN a Foldingu: client-type advanced či beta) příliš riskantní. Bezpečná cesta je pouze přes povolené překročení TDP. Pokud screen moc laguje, snižte prioritu GPU procesu na High.
<edit>
Dzordzik píše:Jinak moje zkušenost s taktování 1080Ti je, že jednotky jsou validní i když jdu s taktováním na krev
Ano, PASCALy snášejí přetakt. Naopak na některých X50 a X60, kde X>5 && X<9 se musí až na referenční takt = zrušení továrního přetaktu.
</edit>

Pozn: Process Lasso stačí free, akorát při startu prudí - nutno vyčkat, až uběhne zobrazená doba.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: zvýšení výkonu v GPUGRID

#7 Příspěvek od Dzordzik »

Tak jak to píšeš jsem to měl, kromě hodnoty delay, kde jsem měl 8, lehce jsem si podle tebe přenastavil ProBalance, uvidíme jestli to bude k lepšímu. Dal bych vědět. Jinak moje zkušenost s taktování 1080Ti je, že jednotky jsou validní i když jdu s taktováním na krev, tím ale neříkám že to tak platí obecně nebo že to doporučuju. A to samé mám když počítám GFN, nevím proč to u mě nepadá a u jiných lidí ano, těžko říct.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Odpovědět

Zpět na „GPUGRID“