Ostatní diskuze k projektu

Fórum o projektu
Odpovědět
Zpráva
Autor
Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Ostatní diskuze k projektu

#321 Příspěvek od Michal Kinďura »

1 vlákno = 1 jednotka, 32 vláken najednou. Na nastavení jsem nic neměnil. Jenom jsem nastravil SoB, stáhnul jednotky a zase CPU v nastavení primegrid odškrtnul aby nenatahoval další.

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19635
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: Ostatní diskuze k projektu

#322 Příspěvek od forest »

To je ale u TR velice nevhodné nastavení. Nejlépe vycházely právě ty tři jednotky na celý CPU a je potřeba nějaké to jádro nechat také volné.

U AMD je to nastavení docela složité. Na Ryzenu je nejlepší počítat jen jednu na všech jádrech a opět několik ponechat volných.
V obou případech je výhodné zapnout HT.

Jiné je to ale ještě u Epiců, kde psal Czech Human, že mu vychází nejvýhodnější na každém jádru jedna jednotka.

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1372
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Ostatní diskuze k projektu

#323 Příspěvek od Czech Human »

Jo, ale je to časově velice náročné - cca 12 dnů na kompletní sadu 32 jednotek. Použít dvě jádra je jen o něco málo horší ale čas výpočtu je cca poloviční. Pro dlouhodobé počítání to ale sedí, že 1 jádro na 1 vlákno poskytne nejlepší výkon ač na 1 RAM kanál jsou 4 jednotky. Zajímavé je že 4 jádra na 1 vlákno to poskytuje ještě o něco horší výsledek než na 2 CPU a na 1 RAM kanál vychází 1 jednotka a od 8 jader na jednotku efektivita prudce klesá. Asi se tu už projevuje amdahlův zákon a architektura CPU, kdy přenos dat mezi moduly je přeci jen pomalejší než z přímo připojené RAM, což této aplikaci podráží nožičky.
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19635
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: Ostatní diskuze k projektu

#324 Příspěvek od forest »

Evidentně je v oblasti provozu velkého počtu jednotek naráz na tom Epic nelépe ze všech testovaných strojů. Bivoj končil s nejvyšší efektivitou na pěti jádrech na jednotku, ale se zapnutým HT. Chápu to tedy tak, že bys zpracoval za 12 dní 32 jednotek, což by vycházelo na jednu jednotku za 8h, tedy o 1/3 lepší čas, než Threadripper 1950X. V podstatě to vychází ale na obdobný rozdíl, jaký je mezi těmi dvěma stroji ve spotřebě.

Bylo by zajímavé toto ještě zjistit u TR2, tedy 2990WX. Pokusím se kontaktovat Viktora, zda mě na test na jeden ze svých strojů pustí.

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1372
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Ostatní diskuze k projektu

#325 Příspěvek od Czech Human »

V efektivitě možná, ale v rychlosti ne, počítá prostě příliš dlouho. Proto jsem byl smutný z trvání turnajového kola, že nutí lidi do méně až nejméně efektivních konfigurací s AMD mnohojádry, intelská CPU mají díky svému vysokému výkonu v AVX na jádro pro závodní počítání výhodu. Odhadem aplikace mi to vycházelo na cyklus 32 ku 26/28 jednotek za stejný čas no a 4 nebo 6 jednotek rozdíl to je hodně.

Ono se jedná v průměru jen o nějaké desetiny hodiny na jednotku 1:2 jádrům, takže zase tak velký rozdíl tam ještě do těch 4 jader na jednotku není, ale pak už je to v řádu hodin na jednotku až téměř dvojnásobek při použití všech jader na 1 jednotku. Vycházelo mi to na cca 8 hodin v konfiguraci 1x32 a 14-15 hodin v konfiguraci 32x1, to by se dalo porovnat s 2990WX, které má zde ale nevýhodu s řadičem pamětí. A běželo mi to vždy na linuxu, pro případné testy GNF-21 v linuxu se dá dobře použít balíček co mám odkaz v podpisu pokud v.svantner na těchto strojích linux provozuje.
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Ostatní diskuze k projektu

#326 Příspěvek od Dzordzik »

forest píše: úte 25 pro, 2018 20:40 Evidentně je v oblasti provozu velkého počtu jednotek naráz na tom Epic nelépe ze všech testovaných strojů. Bivoj končil s nejvyšší efektivitou na pěti jádrech na jednotku, ale se zapnutým HT. Chápu to tedy tak, že bys zpracoval za 12 dní 32 jednotek, což by vycházelo na jednu jednotku za 8h, tedy o 1/3 lepší čas, než Threadripper 1950X. V podstatě to vychází ale na obdobný rozdíl, jaký je mezi těmi dvěma stroji ve spotřebě.

Bylo by zajímavé toto ještě zjistit u TR2, tedy 2950X. Pokusím se kontaktovat Viktora, zda mě na test na jeden ze svých strojů pustí.
U mě to vycházelo nejlépe při 11 (HT on) jádrech na jednotku a za turnaj CPU spočítaly 47 jednotek, většina z nich je už zvalidovaná.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1372
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Ostatní diskuze k projektu

#327 Příspěvek od Czech Human »

A máš nějaké hodnoty od 1 CPU do X CPU? Jak se ty časy vyvíjí? To by totiž bylo velice přínosné k porovnání. Tvým Xeonům asi nejvíc chutná 2 jednotky na 1 RAM kanál ale jaký je rozdíl když je jich méně/víc? Já bych si to pak dal do grafu :-)
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Ostatní diskuze k projektu

#328 Příspěvek od Dzordzik »

Bohužel ne, nechal jsem si jenom 10/11 jader na 1 WU, tam je to téměř stejné, rozdíl je minimální ale 11 je o fousek lepší. U mě to vychází téměř na 3 jádra na kanál, což je podivné, člověk by čekal sudé číslo, něco jako 8, 10 atd. Ne vždy se to chová tak jak by člověk čekal. největší problém je tak jako tak to že ty si něco otestuješ, najdeš optimální nastavení ale stejně nedokážeš donutit OS aby držel po dlouhou dobu stále stejné přiřazení jader k taskům a peklo nastane pokud si OS usmyslí že je dobrý nápad prokřížit jádra z různých CPU k jednomu tasku. Rychlost výpočtu tasku se prodlouží klídně na téměř dvojnásobek. Kdyby se toto nedělo, tak jsem spočítal za tu dobu turnaje o dost víc jednotek. To je stinná stránka MT počítání na víc jak jednom socketu. zajímavé je že pro nápravu nestačí dát pauzu a pak pokračovat. Přiřazení zústane. Pokud ale BM vypnu a zapnu, OS jádra přiřadí znovu a správně. Někdy mu to vydrží dny, někdy hodiny, je potřeba to hlídat.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19635
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: Ostatní diskuze k projektu

#329 Příspěvek od forest »

Já si pár poznámek uchoval:
- TR 1950X - při dvou jednotkách, na každé= 15 jader čas 16h/WU, při čtyřech jednotkách, na každé 7 jader čas 14,5h/WU a nejlépe vycházely tři jednotky na každé 10 jader čas 13,5h/WU.
- Bivojovi dva Xeony Gold - při provozu šesti jednotek na každé 10 jader 9,2h/WU, při provozu pěti jednotek na každé 12 jader 5h/WU, při provozu čtyř jednotek na každé 14 jader 4,5h/WU a nejlepší čas byl při provozu tří jednotech (dle teorie naprostá uchylárna když jsou to dva CPU) na každé 18 jader čas necelé 3h/WU, při provozu dvou jednotek, na každé 30 jader už byl čas horší 3,5h/WU.

Není to tedy snadné najít to nejlepší nastavení. Při více jádrech existuje prostě nastavení, které je to nejlepší a nebývá to (až na Czechhumanův Epic) ani všechna jádra na jednu jednotku, ani každé jádro jednu jednotku. Prostě od určitého nastavení každým směrem se to zhoršuje a tím naleznete optimum.

U každé PG aplikace je to nastavení ale trochu jiné. Jen u čtyřjádrových CPU bez HT mně to vždy vycházelo nejlépe poslat na jednu jednotku všechna jádra. U vyššího počtu a HT CPU už se to různilo CPU od CPU a bylo jedno, zda AMD, nebo Intel.

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1372
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Ostatní diskuze k projektu

#330 Příspěvek od Czech Human »

Tak jsem si to prošel a hodil do grafu a vyšlo mi následující postřehy: pro Xeony je asi obecně nejlepší nastavení 2 kanály na jednotku a přiměřený ale vyšší počet CPU - bivoj ma 6, tedy děleno 2 = 3 jednotky, Albert má 4, tedy děleno 2 = 2 jednotky na CPU. U AMD TR je to spíš 1.5/1 kanál na 1 jednotku a vyšší počet CPU, které ovšem 16jádru už trochu schází. Zajímavé je že 2 kanály na 16 vláken poskytnou horší výsledek jak 1,5 kanálu na 10 jader - asi už úřaduje amdahl. A 1 kanál na 7 jader má o 30% méně procesorů ale stále dá 93% výkonu, tedy jen 7% propad.

Když do této teorie napasuju i9 9900k tak mi vychází že buď budete mít problémy s amdahlem díky mnoha vláknům naráz na 1 jednotku nebo budete mít nedostatek propustnosti protože máte kanály jen na 1 jednotku efektivně a potřebujete ty nejrychlejší RAM díky vysokému výkonu na jádro = musíte to ukrmit. Tedy lépe by měla vycházet 8vláknová verze tohoto CPU, která má přiměřený počet CPU aby ještě amdahl neskákal po zádech a zároveň 2 kanály. Kdo toto CPU má může se vyjádřit zda to tak vychází nebo ne. A pro 8700k jedna jednotka na 6/12 vláken, možná i 2x3/6 protože těch jader už je méně tak to jeden rychlý RAM kanál třeba uživí.

Co do této teorie tak trochu nezapadá, je Epyc - má 8 kanálů a 32 jader ale +/- obdobný výkon poskytne v rozsahu 1/4 až 2 kanály na jednotku s čím méně jader na jednotku tím lépe. Takže buď ten odhad aplikace není přesný a muselo by se počkat až se reálně dopočítá v různých konfiguracích, nebo jsem někde udělal chybu, nebo jeho vnitřní architektura je tak exoticky odlišná od toho co ta aplikace očekává, že SMP efektivita je v kopru a vychází nejlépe konzervativní řešení (1 vlákno na 1 CPU). Kdovíjak bych se tomu nedivil protože vevnitř je to jakoby čtyřprocesorový počítač i když to CPU sedí v jednom socketu.

Velmi vysoký počet vláken (30...) zabíjí efektivitu u AMD i Intelu, amdahla ve finále neukecáme nikdo. Zároveň případný nízký počet CPU na jednotku to asi nedovede "upočítat" a využít tak kapacitu RAM plně. Intel díky velkému výkonu na jádro má proti AMD výhodu, protože nepotřebuje tolik jader na stejný výkon, na druhou stranu ho může snadněji uškrtit řadič, když těch jader je dost na to aby se už projevil amdahl ale máte jen dvoukanál protože nemůžete počítat efektivně víc jednotek naráz - paměti to neukrmí. 16jádru od AMD zase snadno dojdou zdroje, nemá dost kanálů na to aby buď počítalo na menším množství jader efektivněji více jednotek, nebo je zase bito amdahlem když počítá hodně CPU menší množství jednotek s dostatečnou propustností pamětí podobně jako 9900k. To by se ale muselo ještě více otestovat, spustit stejný počet CPU na různý počet kanálů co to udělá a zabralo by to docela dlouhou dobu :-).
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Dzordzik
57.8947368421 %
57.8947368421 %
Příspěvky: 2448
Registrován: ned 12 úno, 2017 00:26
rok narození: 18 zář 1980
ID CNT statistics: 503
Bydliště: Zdounky (u Kroměříže)
Kontaktovat uživatele:

Re: Ostatní diskuze k projektu

#331 Příspěvek od Dzordzik »

U mě je v každém případě problém propustnost pamětí, jednak jedou na 2400 MHz a jednak "jenom" 4 kanálově. V tomto má Bivoj díky modernější architektuře náskok. každopádně jsem dneska zkoušel Foretovo "Bivoj" nastavení a pro Alberta je úplně mimo. Je to výrazně horší než to nastavení co jsem jel já. Každopádně jeho nastavení zní sice dívně kdy jsou 3 jednotky na 2 sockety, tj. by se to teoreticky mělo při přerozdělování jader mezi sockety být a ono určitě i bije, ale i tak je to podle všeho nejefektivnější.
Albert: Dual Xeon E5-2696 V4, Supermicro X10DRG-Q, 64GB DDR4 ECC, 1x GTX 1070, Enermax Platimax 1700W

Uživatelský avatar
® Plšák Ráďa ®
52.6315789474 %
52.6315789474 %
Příspěvky: 1306
Registrován: čtv 10 led, 2013 00:41
rok narození: 0- 7-1977
ID CNT statistics: 15767

Re: Ostatní diskuze k projektu

#332 Příspěvek od ® Plšák Ráďa ® »

Zdarec, jak to vypadá prosím s TOUR ? Bude letos v únoru ?
Motto: "Pokrok vědy nezastavíš, ale i ty ho můžeš urychlit." © 2014 Plšák Ráďa User of The Day
Obrázek

(Pozn. veškeré informace jsou z českých médií rozhlasových, televizních a nějaké fake news z internetu. Proto informační hodnota mého příspěvku je vždy nulová a radši to nečtěte. Televizní zprávy po 19 hodině sleduji minimálně a nehodlám se otečkovat vakcínou C19 verzí č.1 až 3, počkám si na revizi vakcíny splňující normy paní MUDr. S. Pekové, PhD..) 45cc

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Ostatní diskuze k projektu

#333 Příspěvek od Honza »

Ano.

Tour de Primes will be the whole month of February as usual.

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Ostatní diskuze k projektu

#334 Příspěvek od Honza »

Oficiálně TdP 2019

Uživatelský avatar
® Plšák Ráďa ®
52.6315789474 %
52.6315789474 %
Příspěvky: 1306
Registrován: čtv 10 led, 2013 00:41
rok narození: 0- 7-1977
ID CNT statistics: 15767

Re: Ostatní diskuze k projektu

#335 Příspěvek od ® Plšák Ráďa ® »

Zdravím všechny,

Honzovi gratuluji k Tour 2019 a k jeho rozšířené sbírce, bohužel mne to minulo, abych se mohl účasnit ve větším výkonu a k větší šanci k nějakému úlovku. Tož asi takhle 22rrr
Motto: "Pokrok vědy nezastavíš, ale i ty ho můžeš urychlit." © 2014 Plšák Ráďa User of The Day
Obrázek

(Pozn. veškeré informace jsou z českých médií rozhlasových, televizních a nějaké fake news z internetu. Proto informační hodnota mého příspěvku je vždy nulová a radši to nečtěte. Televizní zprávy po 19 hodině sleduji minimálně a nehodlám se otečkovat vakcínou C19 verzí č.1 až 3, počkám si na revizi vakcíny splňující normy paní MUDr. S. Pekové, PhD..) 45cc

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1438
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: Aplikace

#336 Příspěvek od RoKro »

A to jsem si nedávnou pořizoval novej procesor a zase potřebuju ještě novější s podporou AVX-512 :-)
Obrázek

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1372
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Aplikace

#337 Příspěvek od Czech Human »

Potřebuješ potřebuješ....nepotřebuješ ;-). Buď rád že nemáš CPU s AVX-512, z bezpečnostního hlediska už se teď mít Intel skoro rovná mít v počítači oficiální backdoor otevřený světu dokořán, nebo si odečteš 50% z 50% z X% co se výkou týká a stejně ti to všechny varianty možných útoků nezalepí :-). Když už ti jakékoliv klíče a data z RAM a tak vůbec načte i blbej javascript z nějakého webu, na který se jen podíváš tak to by mi za hodně příplatkové AVX-512 nestálo. GPU bude stejně rychlejší :-).
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Uživatelský avatar
RoKro
52.6315789474 %
52.6315789474 %
Příspěvky: 1438
Registrován: pon 31 srp, 2009 08:57
rok narození: 29 črc 1970
ID CNT statistics: 10234
Bydliště: Beroun
Kontaktovat uživatele:

Re: Aplikace

#338 Příspěvek od RoKro »

Jo, já samozřejmě žertoval, Ale intel mi tu v tom tiká, jen ne úplně nejnovější.
Obrázek

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1372
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Aplikace

#339 Příspěvek od Czech Human »

No tak to se taky na slunečnou stranu ulice koukáš z té strany kde padají kroupy a prší... Ty poslední chyby co v těch CPU intel napáchal už opravdu i hodně malé paranoiky motivují hodit to ze skály, vybrati ti data jen tak mimochodem přes prohlížeč při vypnutém HT a ztátě doslova desítek procent výkonu už mi přijde zu viel. Teď už jen čekám kdy se něco podobného objeví i na (zatím...) celkem neprůstřelných AMD. Zvažovat já teď nové PC, Intel bych si musel rovnou vyškrtnout ať by byl jaký byl.
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Honza
63.1578947368 %
63.1578947368 %
Příspěvky: 3245
Registrován: pát 03 lis, 2006 10:46

Re: Aplikace

#340 Příspěvek od Honza »

Prosím, dejte off-topic příspěvky stranou.

Odpovědět

Zpět na „PrimeGrid“