už se těším, škoda jen, že to nestihnou do turnaje.technik007.cz píše: ↑ned 28 črc, 2024 09:42 A nové zeny mají zpoždění 14dní oproti plánovanému vydání.
PG Turnaj 2024 - testy a nastavení
-
- 5.26315789474 %
- Příspěvky: 34
- Registrován: stř 24 lis, 2021 16:47
- rok narození: 16 zář 1990
- ID CNT statistics: 2496
- Bydliště: Praha
Re: PG Turnaj 2024 - testy a nastavení
Re: PG Turnaj 2024 - testy a nastavení
PRST aplikace a primorial s velikost cache pro CPU je to...takové zamotané, alespoň pro mě.
Už jen to, že se používá FFT trochu jinak.
"Using Montgomery reduction AVX-512 FFT length 2x336K".
Proč 2x?
It is 2 * 8 * FFT length read/write memory (for m and x) + 2 * 8 * FFT length read-only memory (for N^{−1} and N).
Takže pak by to mělo vyžadovat 4x336K.
Jenže: If memory bandwidth is sufficient, L3 cache = 3 * 8 * FFT length may be enough, considering that N^{−1} and N are stored at the same place.
Read-only se lépe krmí z RAM, než read/write - tu je opravdu lepší mít v CPU cache.
Což je možná případ DDR5 a pak by 3xFFT mohla stačit bez propadu výkonu.
A to je možná důvod, proč 7800X3D dává relativně stejně jako 5950X.
V případě 7950X3D se to asi začne lámat, jakmile nároky na FFT přesáhnout určitou mez a bude potřeba je ne 2T, ale 4T.
Což je pro mě blbé, když jedu 7x2...pak je možnost 4x3.
Budu znovu zkoumat v dalších dnech.
Už jen to, že se používá FFT trochu jinak.
"Using Montgomery reduction AVX-512 FFT length 2x336K".
Proč 2x?
It is 2 * 8 * FFT length read/write memory (for m and x) + 2 * 8 * FFT length read-only memory (for N^{−1} and N).
Takže pak by to mělo vyžadovat 4x336K.
Jenže: If memory bandwidth is sufficient, L3 cache = 3 * 8 * FFT length may be enough, considering that N^{−1} and N are stored at the same place.
Read-only se lépe krmí z RAM, než read/write - tu je opravdu lepší mít v CPU cache.
Což je možná případ DDR5 a pak by 3xFFT mohla stačit bez propadu výkonu.
A to je možná důvod, proč 7800X3D dává relativně stejně jako 5950X.
V případě 7950X3D se to asi začne lámat, jakmile nároky na FFT přesáhnout určitou mez a bude potřeba je ne 2T, ale 4T.
Což je pro mě blbé, když jedu 7x2...pak je možnost 4x3.
Budu znovu zkoumat v dalších dnech.
Re: PG Turnaj 2024 - testy a nastavení
Tak jsme někde kolem 4.77M a FFT 360K.
Od cca 4.858M bude 384K FFT.
To jsme 8 dní od turnaje, ale FFT teď poroste pomaleji (i kvůli resendům starých jednotek), pokud se zásadně nezvýší výkon.
V současnosti na některých strojích (Desktopové AMD, stará Intel s AVX-512) mi přijde, že 2T a 4T již dává tak nějak stejný výkon.
U EPYCu 7xxx stále 2T, a novější EPYC 9xxx je to stále na 2T.
Takže nejspíše nastane situace, že na některé platformě bude lepší 2T, někde 4T. A to nejedu nikde HT/SMT.
Jinde třeba 3T podle počtu vytížených jader nebo HT/SMT.
Od cca 4.858M bude 384K FFT.
To jsme 8 dní od turnaje, ale FFT teď poroste pomaleji (i kvůli resendům starých jednotek), pokud se zásadně nezvýší výkon.
V současnosti na některých strojích (Desktopové AMD, stará Intel s AVX-512) mi přijde, že 2T a 4T již dává tak nějak stejný výkon.
U EPYCu 7xxx stále 2T, a novější EPYC 9xxx je to stále na 2T.
Takže nejspíše nastane situace, že na některé platformě bude lepší 2T, někde 4T. A to nejedu nikde HT/SMT.
Jinde třeba 3T podle počtu vytížených jader nebo HT/SMT.
Re: PG Turnaj 2024 - testy a nastavení
Ted jsme na ~5.12M a FFT 384k u AVX-512
Další FFT je 400k kolem 5.181M, což vydrží tak do 5.396M.
Předpokládám, že tady někde budeme začátkem turnaje a kolem těchto hodnot bych doporučoval testovat.
Další FFT je 400k kolem 5.181M, což vydrží tak do 5.396M.
Předpokládám, že tady někde budeme začátkem turnaje a kolem těchto hodnot bych doporučoval testovat.
- forest
- Admin webu a fóra CNT
- Příspěvky: 19849
- Registrován: pát 27 říj, 2006 10:19
- rok narození: 03 bře 1977
- ID CNT statistics: 71
- Bydliště: Újezd u Brna
Re: PG Turnaj 2024 - testy a nastavení
Díky za upřesnění těsně před startem. Večer protestuji AMD 5950X a dám sem výsledky.
- forest
- Admin webu a fóra CNT
- Příspěvky: 19849
- Registrován: pát 27 říj, 2006 10:19
- rok narození: 03 bře 1977
- ID CNT statistics: 71
- Bydliště: Újezd u Brna
Re: PG Turnaj 2024 - testy a nastavení
Vychází mně nejlépe výpočet tří jednotek, každé na 10 vláknech.
Moc se mi tomu nechtělo věřit, ale ověřil jsem to na druhé mašině a vyšlo to stejně.
Moc se mi tomu nechtělo věřit, ale ověřil jsem to na druhé mašině a vyšlo to stejně.
Re: PG Turnaj 2024 - testy a nastavení
Očekávám, že optimální nastavení jednotlivých sestav bude nezvykle individuální, ale popravdě tuto kombinaci bych nečekal.
Kolik to dělá jednotek za den nebo časový průměr jednotky...ať je nějaké rozumné srovnání, jak jsem dříve doporučoval.
Kolik to dělá jednotek za den nebo časový průměr jednotky...ať je nějaké rozumné srovnání, jak jsem dříve doporučoval.
- forest
- Admin webu a fóra CNT
- Příspěvky: 19849
- Registrován: pát 27 říj, 2006 10:19
- rok narození: 03 bře 1977
- ID CNT statistics: 71
- Bydliště: Újezd u Brna
Re: PG Turnaj 2024 - testy a nastavení
Vycházím jako vždy z rychlosti zpracování v testovacím balíčku, dle doporučené náročnosti jednotek v "ms". Tedy čím rychlejší zpracování (po vydělení počtem aktuálně zpracovávaných jenotek) tím lépe nastavení sedí dané sestavě.
Jediné optimální srovnání by bylo jako dříve, kdybychom zde zveřejnili jednu konkrétní jednotku a tu testovali všichni na svých strojích. Můžeš Honzo třeba nějakou postnout. Jen k dalšímu testování se dostanu až ve středu. Tedy večer před startem.
Jediné optimální srovnání by bylo jako dříve, kdybychom zde zveřejnili jednu konkrétní jednotku a tu testovali všichni na svých strojích. Můžeš Honzo třeba nějakou postnout. Jen k dalšímu testování se dostanu až ve středu. Tedy večer před startem.
Re: PG Turnaj 2024 - testy a nastavení
Doporučuji testovat například tohoto kandidáta: 5432123#+1
(není to číslo jako Fauciho rozestup 6 stop, které tak nějak přišlo = vycucáno z prstu)
Leading edge je 5,49M, ale to spíše někdo přehnal zásobu, protože jednotky aktuálně odevzdávané jsou spíše 5,23M a 20k rozpočítaných jednotek je proti předchozím číslům relativně hodně...nebo už někdo žhaví na turnaj, do kterého je 48 hodin.
Zvolil jsem 5,43M, protože už má FFT 432k.
Zohlednil jsem to v balíčku (stejná verze) - https://czechnationalteam.cz/storage/kestazeni/testovaci_balicek/pg/Testovaci_balicek_CNT_2024cPG.7z
Budu to během turnaje sledovat, jak se situace průběžně mění a případně doporučím jiného aktuálního kandidáta.
(není to číslo jako Fauciho rozestup 6 stop, které tak nějak přišlo = vycucáno z prstu)
Leading edge je 5,49M, ale to spíše někdo přehnal zásobu, protože jednotky aktuálně odevzdávané jsou spíše 5,23M a 20k rozpočítaných jednotek je proti předchozím číslům relativně hodně...nebo už někdo žhaví na turnaj, do kterého je 48 hodin.
Zvolil jsem 5,43M, protože už má FFT 432k.
Zohlednil jsem to v balíčku (stejná verze) - https://czechnationalteam.cz/storage/kestazeni/testovaci_balicek/pg/Testovaci_balicek_CNT_2024cPG.7z
Budu to během turnaje sledovat, jak se situace průběžně mění a případně doporučím jiného aktuálního kandidáta.
-
- 15.7894736842 %
- Příspěvky: 145
- Registrován: stř 10 kvě, 2023 15:46
- rok narození: 01 led 1981
- ID CNT statistics: 15985
- Bydliště: ostrovy
Re: PG Turnaj 2024 - testy a nastavení
Zkusil jsem těsně před turnajem tuto kombinaci na 5950X s reálnými jednotkami a nevypadá to dobře ve prospěch 3*10.
2*8 se zarovnáním na CCD a fyz jádra jsou stavy C1 u všech jader v průměru pod 1% a ideálnější situace není. Při počítání na 32 threads to byla hrůza.
Kreditove srovnání budu mít po zvalidovani 1. jednotek.
-
- 15.7894736842 %
- Příspěvky: 145
- Registrován: stř 10 kvě, 2023 15:46
- rok narození: 01 led 1981
- ID CNT statistics: 15985
- Bydliště: ostrovy
Re: PG Turnaj 2024 - testy a nastavení
Bohužel si nepamatuju kdy jsem měnil PBO směrem nahoru, takže výsledek srovnání asi není správný. Nicméně jsem kreditově 8% nad. Nebudu už zkoumat proč a jak, hlavně že to jede.
Zvalidovana ma 7735s a 10859 kredit.
Omlouvám se testerům.
Ten stroj s 5950x je headless a má systém na USB 3.1 flashce. Tudíž žádné přebytečné komponenty. A spotřebu na zásuvce má cca 230W. PBO 142/120/200
Zvalidovana ma 7735s a 10859 kredit.
Omlouvám se testerům.
Ten stroj s 5950x je headless a má systém na USB 3.1 flashce. Tudíž žádné přebytečné komponenty. A spotřebu na zásuvce má cca 230W. PBO 142/120/200
Re: PG Turnaj 2024 - testy a nastavení
Bacha na to, jaké jednotky se počítají. Jednotky za 10k kreditů jsou ty větší.
Na 5950X jsou kandidáti kolem 5.1M s FFT 384K, ale kolem 5.3M už 480K a jsou třeba u mě výpočtově o 1/2 náročnější, ačkoli kreditově jen o 1/3, což se může zdát podhodnocené.
Ale na 7950X3D (podobně Intel Xeon) jsou rozdíly ve výpočtu do 10%, protože cache 384K vs 400K, což se ve výsledku může zdát kreditově nadhodnocené.
Na 5950X jsou kandidáti kolem 5.1M s FFT 384K, ale kolem 5.3M už 480K a jsou třeba u mě výpočtově o 1/2 náročnější, ačkoli kreditově jen o 1/3, což se může zdát podhodnocené.
Ale na 7950X3D (podobně Intel Xeon) jsou rozdíly ve výpočtu do 10%, protože cache 384K vs 400K, což se ve výsledku může zdát kreditově nadhodnocené.
Re: PG Turnaj 2024 - testy a nastavení
Některé rozpočítané jednotky 5.825M mají FFT 432K, ale jiné od 5.83M už mají s FFT 448K.
FMA má stále FFT 480K.
FMA má stále FFT 480K.
-
- 15.7894736842 %
- Příspěvky: 145
- Registrován: stř 10 kvě, 2023 15:46
- rok narození: 01 led 1981
- ID CNT statistics: 15985
- Bydliště: ostrovy
Re: PG Turnaj 2024 - testy a nastavení
Momentalne muj Ryzen 5950X 16c/32t odevzdava cca 10k kreditu/hodinu (2*8 threads). Je trochu postouchnuty nahoru, ale to muze dat cca 10-20% max.
miniPC 7940HS 8c/16t - 5.8k/h (2*8 threads)
Tymove stroje CNT - CIMRMAN jsou na 5k/h. (3*10 threads) pri cca 24000s/jednotku, ale jsou tam i stroje s 30000s/jednotku.
Zajimave jak hrubym souctem 24 cores muze porazit 48 cores pokud je neco s nastavenim zle.
miniPC 7940HS 8c/16t - 5.8k/h (2*8 threads)
Tymove stroje CNT - CIMRMAN jsou na 5k/h. (3*10 threads) pri cca 24000s/jednotku, ale jsou tam i stroje s 30000s/jednotku.
Zajimave jak hrubym souctem 24 cores muze porazit 48 cores pokud je neco s nastavenim zle.
Re: PG Turnaj 2024 - testy a nastavení
Někde jsem zahlédl, že 9700X je tak o 1/4 - 1/3 rychlejší, než 7700X na PRST.
(u LLR2 by to mohlo být podobné).
Tato recenze není na první pohled pro PG a BOINC zas tak relevantní (testy jsou z jiných oblastí), ale pro mě jasně říká, že 9950X si z hlediska spotřeby a teplot vede v průměru lépe než 7950X a přidává i více či méně výkonu navrch.
Quantifying The AVX-512 Performance Impact With AMD Zen 5 - Ryzen 9 9950X Benchmarks
(u LLR2 by to mohlo být podobné).
Tato recenze není na první pohled pro PG a BOINC zas tak relevantní (testy jsou z jiných oblastí), ale pro mě jasně říká, že 9950X si z hlediska spotřeby a teplot vede v průměru lépe než 7950X a přidává i více či méně výkonu navrch.
Quantifying The AVX-512 Performance Impact With AMD Zen 5 - Ryzen 9 9950X Benchmarks
-
- 5.26315789474 %
- Příspěvky: 34
- Registrován: stř 24 lis, 2021 16:47
- rok narození: 16 zář 1990
- ID CNT statistics: 2496
- Bydliště: Praha
Re: PG Turnaj 2024 - testy a nastavení
mě už 9950x od mimozemšťana dorazil.... no takhle, u některých aplikací tam posun je, podobně jako na phoronix u avx512 aplikací +20% se stejnou spotřebou oproti 7950x. Někdy to dá víc a jindy tam není posun prakticky žádný. Zen 3 -> Zen 4 mi přišel jako výraznější posun, i když tam to bylo zároveň i kvůli rychlejším RAMkám a lepšímu procesu.
dost rozhodne, jak se bude vyvíjet cena. Není to špatný CPU, ale aktuálně je Zen 5 oproti Zen 4 jako novinka výrazně dražší než to co oproti starší generaci přináší...
btw byl třeba update biosu (B650E-AORUS-MASTER), bez něj CPU vůbec nenaběhl.
dost rozhodne, jak se bude vyvíjet cena. Není to špatný CPU, ale aktuálně je Zen 5 oproti Zen 4 jako novinka výrazně dražší než to co oproti starší generaci přináší...
btw byl třeba update biosu (B650E-AORUS-MASTER), bez něj CPU vůbec nenaběhl.
-
- 15.7894736842 %
- Příspěvky: 145
- Registrován: stř 10 kvě, 2023 15:46
- rok narození: 01 led 1981
- ID CNT statistics: 15985
- Bydliště: ostrovy
Re: PG Turnaj 2024 - testy a nastavení
On taky 9950X přináší nižší spotřebu z PL2 230W šel na 200W dle informací na netu.ahorek píše: ↑ned 18 srp, 2024 16:40 mě už 9950x od mimozemšťana dorazil.... no takhle, u některých aplikací tam posun je, podobně jako na phoronix u avx512 aplikací +20% se stejnou spotřebou oproti 7950x. Někdy to dá víc a jindy tam není posun prakticky žádný. Zen 3 -> Zen 4 mi přišel jako výraznější posun, i když tam to bylo zároveň i kvůli rychlejším RAMkám a lepšímu procesu.
dost rozhodne, jak se bude vyvíjet cena. Není to špatný CPU, ale aktuálně je Zen 5 oproti Zen 4 jako novinka výrazně dražší než to co oproti starší generaci přináší...
btw byl třeba update biosu (B650E-AORUS-MASTER), bez něj CPU vůbec nenaběhl.
... pak zvyšování IPC nejde donekonečna, bohužel. Naopak se těším na mobilní APU s nakombinovanými Zen5/5c jádry a ve formátu miniPC.