Aplikace

Fórum o projektu

Moderátoři: petnek, nenym, Zelvuska

Odpovědět
Zpráva
Autor
Uživatelský avatar
Kyong
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 1506
Registrován: pát 03 lis, 2006 13:43
rok narození: 29 kvě 1984
ID CNT statistics: 19525
Bydliště: Olomouc
Kontaktovat uživatele:

Re: Aplikace

#201 Příspěvek od Kyong » stř 31 črc, 2013 20:12

Vzhledem k tomu, že jako vždy s tím mám na windowsu problém, tak možná prvně bude optimalizovaná verze pro linux. Jinak ještě info k těm polákům, ty zdrojové kódy jsem dostal od jednoho z jejich týmu, komu jsem je původně posílal, ale optimalizaci dělal někdo jiný, ten je prý na dovolené, tak se k tomu ani zatím nevyjádřil. Zdeněk v tom narazil na nějaké nevhodné optimalizace, tak to zkusím opravit, ale ten jejich solution pro Visual Studio není kompletní, závislosti jsou rozházené přes absolutní adresy na části BOINC source, nastaveno pro Intel C++ compiler a po opravě to opět nejde, takže možná to nejdříve zkusím na linuxu. Doma už mám konečně jeden stroj s i5, takže můžu zkoušet i ty AVX instrukce.
Jsem vždycky někde na netu. Vždyť síť je přece rozlehlá a nekonečná.

Jifox.cz
Blog
Czech National Team
Asteroids@home - český projekt - zkoumání tvaru planetek z fotometrických dat

Uživatelský avatar
Kyong
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 1506
Registrován: pát 03 lis, 2006 13:43
rok narození: 29 kvě 1984
ID CNT statistics: 19525
Bydliště: Olomouc
Kontaktovat uživatele:

Re: Aplikace

#202 Příspěvek od Kyong » čtv 01 srp, 2013 10:56

Tak první testy, prozatím SSE3, protože jsem to testoval na jiném procesoru a tady je výsledek:

počítáno na C2D E8400 3.00 GHz
neoptimalizovaná verze: 9,285.16 s
optimalizovaná verze: 2,481.80 s

Opět jsou ve ve výsledku rozdíly v hodnotách, i když jsou to stejné procesory, ale naštěstí je to v toleranci.
Jsem vždycky někde na netu. Vždyť síť je přece rozlehlá a nekonečná.

Jifox.cz
Blog
Czech National Team
Asteroids@home - český projekt - zkoumání tvaru planetek z fotometrických dat

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1351
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Aplikace

#203 Příspěvek od Czech Human » čtv 01 srp, 2013 12:00

To už je slušné zkrácení na stejném železe :smt023
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

eisler jiri
73.6842105263 %
73.6842105263 %
Příspěvky: 4528
Registrován: sob 15 kvě, 2010 17:27
rok narození: 14 zář 1947
ID CNT statistics: 13496
Bydliště: praha 8
Kontaktovat uživatele:

Re: Aplikace

#204 Příspěvek od eisler jiri » čtv 01 srp, 2013 12:28

kyong, mi widláci na tom zase proděláme :smt022 asi se dám do zemědělství gde ty widle uplatním
Obrázek
Obrázek

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1335
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace

#205 Příspěvek od zdenek » čtv 01 srp, 2013 14:18

Kyong píše:Opět jsou ve ve výsledku rozdíly v hodnotách, i když jsou to stejné procesory, ale naštěstí je to v toleranci.
To je dáno jiným pořadím ve výpočtu a taky jestli tam mají tu stejnou chybu jako v AVX to to může být tím.

Uživatelský avatar
Kyong
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 1506
Registrován: pát 03 lis, 2006 13:43
rok narození: 29 kvě 1984
ID CNT statistics: 19525
Bydliště: Olomouc
Kontaktovat uživatele:

Re: Aplikace

#206 Příspěvek od Kyong » čtv 01 srp, 2013 15:14

eisler jiri píše:kyong, mi widláci na tom zase proděláme :smt022 asi se dám do zemědělství gde ty widle uplatním
Můžeš sem hodit screen z programu CPU-Z, ať vím, co to má všechno za instrukce?
Jsem vždycky někde na netu. Vždyť síť je přece rozlehlá a nekonečná.

Jifox.cz
Blog
Czech National Team
Asteroids@home - český projekt - zkoumání tvaru planetek z fotometrických dat

Uživatelský avatar
Kyong
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 1506
Registrován: pát 03 lis, 2006 13:43
rok narození: 29 kvě 1984
ID CNT statistics: 19525
Bydliště: Olomouc
Kontaktovat uživatele:

Re: Aplikace

#207 Příspěvek od Kyong » čtv 01 srp, 2013 15:20

Takže konečně mám dotestováno, takže tady jsou výsledky na porovnání. Vše počítáno na stejném stroji s procesorem i5-3230M 2.60 GHz.

bez optimalizace - 6,515.04 s
SSE2 - 1,871.06
SSE3 - 1,694.48
AVX - 1,680.52 s

AVX budu teď opravovat, ty časy u něho 13.96 sekund rozdíl teda moc není. 45hh
Jsem vždycky někde na netu. Vždyť síť je přece rozlehlá a nekonečná.

Jifox.cz
Blog
Czech National Team
Asteroids@home - český projekt - zkoumání tvaru planetek z fotometrických dat

Uživatelský avatar
Czech Human
52.6315789474 %
52.6315789474 %
Příspěvky: 1351
Registrován: sob 30 bře, 2013 14:16
rok narození: 0- 0-1981
ID CNT statistics: 19867
Bydliště: Praha

Re: Aplikace

#208 Příspěvek od Czech Human » čtv 01 srp, 2013 15:57

Pokud to není proto, že optimalizace na AVX instrukce někde kulhá, umožní to i relativně "starým" CPU dost výrazně urychlit výpočty a relativně držet krok s aktuální špičkou. Určitě je tu víc majitelů CPU vybavených SSE3, než AVX instrukcemi a imho výkon šedé masy rapidně změní statistiku, ne výkon několika technologicky zapálených špiček. Taky je vidět, jak relativně málo výkonu navíc už jsou schopné nové specializované instrukční sady přinést oproti těm předchozím - těžko je pilovat již vypilované 45ff .
Vzhůru pro body na linuxu :-).

Linuxová verze CNT 2018 balíčku: https://uloz.to/!yhQoPwu9UIel/cnt2018linux-7z
Linuxová verze PG CPU testu na GNF-21 https://uloz.to/!gXPiQ9BD2IF6/pgtest-tar-gz

Obrázek

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 681
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Aplikace

#209 Příspěvek od Michal Kinďura » čtv 01 srp, 2013 16:26

SSE3 by měl podporovat i můj Phenom :smt038

Kdy to vyleze ven? 45hh

Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 17777
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Re: Aplikace

#210 Příspěvek od forest » čtv 01 srp, 2013 16:41

Chápu to správně, že dojde ke čtyřnásobnému zvýšení současného odváděného výkonu pro projekt :?:

Uživatelský avatar
Kyong
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 1506
Registrován: pát 03 lis, 2006 13:43
rok narození: 29 kvě 1984
ID CNT statistics: 19525
Bydliště: Olomouc
Kontaktovat uživatele:

Re: Aplikace

#211 Příspěvek od Kyong » čtv 01 srp, 2013 17:05

Jj, ale podle toho, kolik lidí bude na čem počítat. Je už i dost lidí s ARM procesory, takže ti zatím asi zlepšení mít nebudou, hlavně musím zjistit, proč to na BOINCu 7.2.7 nechce počítat. Jinak dále nevím, jak se to bude chovat na AMD, tak to bude muset někdo otestovat, a kdy to vypustím, to ještě nevím, protože zítra jedu na pár dnů do Prahy a tam se k tomu zřejmě vůbec nedostanu a ještě jsem pořád nezjišťoval, jak to je s posláním konkrétní verze podle instrukcí na serveru.
Pak další problém, BOINC v současné oficiální verzi nepředává serveru informaci o podpoře AVX instrukcí, už se to řešilo v developer mailingu, takže už je to tam sice přidáno, ale tím to samozřejmě je v poslední testovací verzi BOINCu, takže kdo bude používat oficiální, tak do vydání nové oficiální verze bude muset pro AVX bude muset použít anonymní platformu. Já to ještě budu upravovat, takže uvidíme, o kolik se ten čas u AVX ještě zkrátí, zatím jsem to testoval na jediném procesoru ty rozdíly všech verzí. Ohdaduji teda, že tak během dvou týdnu bych to mohl vydat.

P.S. co se týče té podpory AMD, je to právě kompilované Intel C++ kompilerem, takže netuším, jestli to vůbec na AMD procesorech bude fungovat.
Jsem vždycky někde na netu. Vždyť síť je přece rozlehlá a nekonečná.

Jifox.cz
Blog
Czech National Team
Asteroids@home - český projekt - zkoumání tvaru planetek z fotometrických dat

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1335
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace

#212 Příspěvek od zdenek » čtv 01 srp, 2013 17:32

forest píše:Chápu to správně, že dojde ke čtyřnásobnému zvýšení současného odváděného výkonu pro projekt :?:
Jo správně.

Period search je pro SSE+ instrukce jako dělaný. Je tam velkém množství C=A+B*D kombinací, ktečré se do nekonečna opakují v cyklech.

SSE2 zvládne najednou dvě operace s double čísly (4 se single) = 128bit registr
SSE3 je jen pár instrukcí navíc, takže nezajímavé
AVX je totéž (přibližně) jako SSE2 ale dělá 2x tolik = 256bit registr (jen u intela, amd to simuluje opakováním SSE2 intrukcí dvakrát, takže žádné zrychlení)

tam je potřeba si dát pozor na režii, která vzniká konverzí mezi resitry a pamětí (z a do xmm nebo ymm resitrů), takže část kódu může být i pomalejší. To je potřebazměřit a zjistit.

eisler jiri
73.6842105263 %
73.6842105263 %
Příspěvky: 4528
Registrován: sob 15 kvě, 2010 17:27
rok narození: 14 zář 1947
ID CNT statistics: 13496
Bydliště: praha 8
Kontaktovat uživatele:

Re: Aplikace

#213 Příspěvek od eisler jiri » čtv 01 srp, 2013 17:45

kyong 22rrr :smt023 :smt023 :smt023 nenech se od nás otrávit. to co si udělal už je o řád vyšší než bych předpokládal 33ttt
a nejezdi na dovolenou do prahy (jen adrenalinový sport)
Obrázek
Obrázek

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7075
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Aplikace

#214 Příspěvek od nenym » pát 02 srp, 2013 11:46

Kyong píše: Jinak dále nevím, jak se to bude chovat na AMD, tak to bude muset někdo otestovat, a kdy to vypustím, to ještě nevím, protože zítra jedu na pár dnů do Prahy a tam se k tomu zřejmě vůbec nedostanu a ještě jsem pořád nezjišťoval, jak to je s posláním konkrétní verze podle instrukcí na serveru.
Nabízím testování na AMD:
1. X6 1090T: W7 64bit (core 7.0.25) + Ubuntu 10.04 64bit (core 6.12.34)
2. Turion RM 70: W XP 32bit (core 6.12.34) + Ubuntu 10.04 64bit (core 6.12.34)
Bacha, SSE3 se hlásí jako pni.
Blíží se další krize; jím plesnivé sýry, piji staré víno a jezdím v autě bez střechy.
UotD 525x
Obrázek 3xObrázek 8xObrázek 10xObrázek Obrázek
Obrázek

Uživatelský avatar
Kyong
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 1506
Registrován: pát 03 lis, 2006 13:43
rok narození: 29 kvě 1984
ID CNT statistics: 19525
Bydliště: Olomouc
Kontaktovat uživatele:

Re: Aplikace

#215 Příspěvek od Kyong » pát 02 srp, 2013 12:15

Poslána PM, a SSE3 se hlásí jako pni? Co to zase má AMD za identifikaci? Nebo to tak hlásí BOINC manager? Musím právě pak podle toho udělat to nastavení na serveru, ať ví, kterou aplikaci podle instrukcí komu poslat.
Jsem vždycky někde na netu. Vždyť síť je přece rozlehlá a nekonečná.

Jifox.cz
Blog
Czech National Team
Asteroids@home - český projekt - zkoumání tvaru planetek z fotometrických dat

ETNyx
10.5263157895 %
10.5263157895 %
Příspěvky: 93
Registrován: ned 11 zář, 2011 17:06
ID CNT statistics: 8944

Re: Aplikace

#216 Příspěvek od ETNyx » pát 02 srp, 2013 13:25

pokud vím tak PNI je název od Intelu, aby v tom nebyl nepořádak že? A hlási to tak systém viz cpuinfo

Kód: Vybrat vše

processor       : 0
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 5
model name      : AMD Athlon(tm) II X3 445 Processor
stepping        : 3
microcode       : 0x10000c8
cpu MHz         : 800.000
cache size      : 512 KB
physical id     : 0
siblings        : 3
core id         : 0
cpu cores       : 3
apicid          : 0
initial apicid  : 0
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc extd_apicid pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt hw_pstate npt lbrv svm_lock nrip_save
bogomips        : 6229.91
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate
v připadě potřeby mohu taky testnout

Kód: Vybrat vše

x86_64 GNU/Linux, Boinc 7.0.65

Uživatelský avatar
Kyong
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 1506
Registrován: pát 03 lis, 2006 13:43
rok narození: 29 kvě 1984
ID CNT statistics: 19525
Bydliště: Olomouc
Kontaktovat uživatele:

Re: Aplikace

#217 Příspěvek od Kyong » pát 02 srp, 2013 13:39

To se skvěle plete, jsem si to mezitím přečetl na wikipedii o tom značení ještě. 45hh Aplikace pro linux bude snad příští týden, za chvíli pojedu, takže budu celou dobu zřejmě jenom na telefonu.
Jsem vždycky někde na netu. Vždyť síť je přece rozlehlá a nekonečná.

Jifox.cz
Blog
Czech National Team
Asteroids@home - český projekt - zkoumání tvaru planetek z fotometrických dat

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7075
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Aplikace

#218 Příspěvek od nenym » pát 02 srp, 2013 14:28

BM hlásají

Kód: Vybrat vše

Starting BOINC client version 6.12.34 for x86_64-pc-linux-gnu
Processor: 2 AuthenticAMD AMD Turion(tm)X2 Dual Core Mobile RM-70 [Family 17 Model 3 Stepping 1]
Processor: 512.00 KB cache
Processor features: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt rdtscp lm 3dnowext 3dnow constant_tsc rep_good nonstop_tsc extd_apicid pni cx16 lahf_lm cmp_legacy svm extapic cr8_leg
OS: Linux: 2.6.32-50-generic
Memory: 1.71 GB physical, 255.99 MB virtual

Kód: Vybrat vše

Starting BOINC client version 7.0.25 for windows_x86_64
Processor: 6 AuthenticAMD AMD Phenom(tm) II X6 1090T Processor [Family 16 Model 10 Stepping 0]
Processor: 512.00 KB cache
Processor features: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 htt pni cx16 syscall nx lm svm sse4a osvw ibs skinit wdt page1gb rdtscp 3dnowext 3dnow
OS: Microsoft Windows 7: Professional x64 Edition, Service Pack 1, (06.01.7601.00)
Memory: 16.00 GB physical, 56.41 GB virtual
Both X6 1090T & Turion na SSE3 okamžitý výbuch, zkus dát link ještě na SSE2.

Poměry CPU time stock aplikace/SSE3 aplikace na Intelech:

C2D E4800 3,0 GHz XP 32bit: netestováno/2 970s
Xeon E3110 3,0 GHz XP 32bit: netestováno/2 900s
C2D 6420 2,13 GHz XP 32 bit: 29 300s/4 300s
Xeon X3360 2,83GHz XP 64bit: 10 400s/2 700s
i7- 3770K s HT 4,0 GHz W7 64 bit: 8 100s/3 300s

Zatím se se SSE3 nic nezvalidovalo, případné invalidy budu hlásat (nesnese se sestrou, tedy nesnese se SSE3).
Naposledy upravil(a) nenym dne pon 05 srp, 2013 17:30, celkem upraveno 1 x.
Blíží se další krize; jím plesnivé sýry, piji staré víno a jezdím v autě bez střechy.
UotD 525x
Obrázek 3xObrázek 8xObrázek 10xObrázek Obrázek
Obrázek

zdenek
52.6315789474 %
52.6315789474 %
Příspěvky: 1335
Registrován: pon 30 dub, 2012 20:55
ID CNT statistics: 6334
Bydliště: Brno

Re: Aplikace

#219 Příspěvek od zdenek » sob 03 srp, 2013 11:16

Tak jsem si chvíli v pátek hrál s AVX a podařilo se mi stáhnout čas na i 3770 na polovinu z 8900s na cca 4200s. Upravil jsem jen jednu část kódu.

Akorát se mi na konci sekne aplikace v paměti, využitím procesoru 0% ale aplikace je v paměti. To zas bude nějaká boinc vymoženost v knihovně boincapi. Tím pádem si boinc myslí, že je tam chyba a napíše "chyba při výpočtu".

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 681
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Aplikace

#220 Příspěvek od Michal Kinďura » sob 03 srp, 2013 22:37

Musí to frčet i na AMD, tam bude zase nějaká proprietální blbost 45hh

Odpovědět

Zpět na „Asteroids@home“