Všeobecné otázky a odpovědi o distribuovaných výpočtech

Sekce pro všeobecné rady a návody z oblasti DC projektů
Zamčeno
Zpráva
Autor
Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 18361
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Všeobecné otázky a odpovědi o distribuovaných výpočtech

#1 Příspěvek od forest »

Otázka: Když bude počítač stále vytížen, neporouchá se dříve?
Odpověď: Při špatném chlazení opravdu může docházet k přehřívání některých dílů počítače, ale to jen u špatně sestavených strojů. Každý počítač by měl mít dostatečně dimenzované chlazení na non-stop provoz a plné zatížení. Většina z PC dílů má zároveň v sobě čidlo, které přehřívání nedovolí. Některé díly restartují počítač, jiné zpomalí svou činnost, aby tak zatížení snížily, ale závada vlivem využití potenciálního výkonu by v žádném případě neměla nastat. Pro ty kteří se zapojit do výpočtů chtějí, ale zároveň mají obavu, nebo u nich opravdu dochází k problémům s chlazení, lze nastavit maximální vytížení distribuovanými výpočty. Přímo v programu BOINC Manager dnes již lze nastavit kolik procent celkového výkonu má být poskytováno a kolik % celkového času spuštění má být využito. Tím si lze regulovat nejen zatížení počítače a jeho případné zahřívání, ale i vlivem odpadního tepla se někdy více točící a hlučnější chlazení.

Otázka: Potřebuji stálé připojení k internetu?
Odpověď: Nepotřebujete a nepotřebujete ani nijak rychlý internet. Největší balíky dat se stahují při prvním přihlášení k projektu (většinou několik MB). Potom už se stahují jen samotné jednotky a odesílají zpracovaná data a to je většinou otázka spíše stovek kb. Také si lze nastavit jen časové období kdy bude mít který den BOINC Manager k internetu přístup a také jakou rychlostí maximálně může stahovat, nebo odesílat. Připojení k internetu tedy potřebují samotné projekty pouze k odevzdání hotové práce a stažení nové. To stačí i jen jednou za den, nebo i týden. Záleží na výkonu počítače a době jeho provozu.

Otázka: BOINC často vydává nové verze klientů, musím je stále aktualizovat?
Odpověď: Aktualizace klienta v podstatě není nutná, pokud s tím, kterého jste si nainstalovali nemáte žádné potíže. V klientech dochází vesměs k minimálním změnám, jako reakce na problémy některých počtářů a na jejich nové nápady na vylepšení. Dále se v nových klientech aktualizují národní překlady a doplňují projekty, takže nemusíte jejich adresu přímo zadávat a jednoduše jej vyberete ze seznamu. Shrnul bych to asi tak, že když si přeinstalujete klienta jednou ročně, nějaké drobné změny si všimnete, ale třeba na výkon to žádný vliv nikdy nemá.

Otázka: Proč bych se měl připojovat k nějakému týmu, co tím získám?
Odpověď: Počtář vstupem do týmu nezíská nic, stane se prostě součástí větší komunity, ze které může zase kdykoliv vystoupit, tato volba je na každém jednotlivci. Pro tým jsou počtáři důležití, jelikož čím více výkonu má tým, tím je na tom lépe v celkovém součtu a v tabulkách. Zároveň je to velká podpora pro další propagaci distribuovaných výpočtů, kterou se mnohé týmy zabývají. Například u nás Czech National Team ročně vydává několik článků o projektech, i všeobecných o problematice distribuovaných výpočtů, o nových možnostech, pořádá republikové srazy a další činnosti. Díky podpoře svých členů mají tyto aktivní týmy stále motivaci ve své dobrovolné a neziskové činnosti pokračovat a mají z toho radost. Zapojení do týmu vás jako počtáře nic tedy nestojí, ale v návaznosti na další věci pomáháte rozvoji samotných distribuovaných projektů v naší republice.
To že je český národní tým (Czech National Team) v současné době pátým týmem v systému BOINC na světě, je zároveň obrovskou propagací naší republiky ve světě. Ukazuje to, že i u nás lidé dokáží táhnout za jeden provaz a celkový počet přesahující 9000 členů, je toho důkazem.

Otázka: Co když budu zpracovávat data v projektu skrytá, která se ho vůbec nebudou týkat, nebo si na výsledcích někdo namastí kapsu?
Odpověď: Ano i takovéto domněnky panují ve veřejném mínění. Běžně se hovoří o lámání různých armádních šifer, či výpočtů dráhy jaderných raket atd. Mohl bych odpovědět jednou větou, jsou to nesmysly. Zdrojové kódy systému BOINC i některých projektů jsou otevřené a volně k dispozici a tak je vyloučeno, aby se mohly výpočty zneužít pro něco jiného, než jsou skutečné cíle projektu. Pokud nejste programátor a neumíte si zdrojáky prohlédnout (asi většina z nás), tak doporučuji si vybírat projekty hlavně podle jejich zřizovatele. Slavné instituce (například CERN, BBC, Computer Centre of the Institute of High Energy Physics, IBM...), nebo univerzity (Berkeley, University of Cambridge, Chinese Academy of Sciences, El Paso & Scripps (TSRI), Laboratoire de Biochimie (UMR CNRS 7654), by si nemohly dovolit skandál se zneužitím dobrovolného poskytování výkonu obyčejných lidí a ani by jim to za to nestálo. Projektů je již více než sto, takže je určitě z čeho vybírat i s ohledem na jejich zázemí.
To že na výsledcích výzkumů ve finále někdo vydělá, je skoro první co každého napadne (alespoň u nás). Přece nikdo ve finále nebude rozdávat zdarma šifrovací programy, léky, detektory seismické činnosti Země a podobné věci? To opravdu nebude, ale musíme si uvědomit, že jsme jen jednou z velmi důležitých součástí v celém procesu. Na začátku musí někdo vymyslet zaměření projektu, zřídit mu zázemí technické i lidské a až potom se k němu lidé připojí a dobrovolně pro něj poskytnou svůj výkon. Následně někdo musí výsledky zpracovat a vytvořit z nich finální produkt, nebo vědeckou zprávu. Pokud jde o pokroky v oblasti vědy, tak na těch nikdo nezbohatne, jelikož všechny projekty poskytují výsledky veřejně všem k dispozici, protože na jejich výzkumu pracovala veřejnost. Když těchto veřejně přístupných výsledků někdo využije ke stavbě nějakého zařízení, k výrobě léků, nebo něčemu jinému, už s tím má další velké náklady a výsledný produkt logicky nebude dávat nikomu zdarma. Například u léků jsou náklady na finální výrobu a testování tak obrovské, že se tomu snad nikdo ani nemůže divit.
To hlavní oč v distribuovaných výpočtech jde, je samotný pokrok v dané oblasti vědy. Pomáháme v pokroku tam, kde bychom se jinak dočkali výsledků o mnoho let později, nebo třeba nikdy, jelikož by nikdo výpočetní čas na superpočítačích pro daný vědecký nápad nezaplatil. Pomáháme například urychlit vývoj léků a je dost možné, že třeba zrovna někomu z rodiny takto zachráníme jednou život. Výpočetní čas na superpočítačích je velice drahý a stojí na něj dlouhý pořadník. Vlastní superpočítače a jejich provoz si většina institucí a univerzit nemůže dovolit a tak jsou distribuované výpočty jedinou jejich možností, jak svou myšlenku ověřit, vyvrátit, nebo rozvíjet dál. Neměli bychom hledat ve všem chamtivý zisk a zneužití, distribuované výpočty jsou dobrovolná činnost a tu si jen tak někdo zneužít netroufne. Za těch téměř dvacet let jejich existence alespoň k takovému případu nedošlo.

Otázka: Existují již nějaké konkrétní výsledky distribuovaných výpočtů?
Odpověď: Výsledků je za ta léta spousta. Dají se v základu rozdělit na tři druhy - dílčí výsledky na které navazují další výpočty pro postup ve výzkumu, finální výsledky a zjištěná slepá cesta výzkumu.
Dílčích výsledků je asi nejvíce ale jsou obrovsky důležité. Pokud například prostřednictvím výpočtů zredukujeme při výzkumu léků možné kombinace účinných látek z několika milionů na tisíce, je další podrobný výzkum přímo v laboratořích reálný a relativně rychlý. Bez této redukce výpočty by výzkum byl jen hledáním jehly v kupce sena. Dalšími dílčími výsledky jsou například prvočísla, kterých se denně v různých projektech různými metodami najde hned několik a která pomáhají v zabezpečování dat v bankovnictví, státní správě, ale i v domácnostech. Dílčími výsledky jsou modely předpovědi klimatu na Zemi v dalších desetiletích. Modelů je spousta a zkouší se různé vlivy a reakce prostředí na ně. Nezkoumá se tedy pouze konkrétní jeden model, ale zároveň modelování slouží k pochopení různých vlivů na celkové klima Země z dlouhodobého hlediska. Těchto příkladů je celá řada a dílčí výsledky jsou tedy každodenním přínosem distribuovaných výpočtů k lidskému poznání a pokroku.
Finálních výsledků již je mnohem méně, ale rozhodně jich není málo. Uvedu opět několik příkladů. V biologii je to například zkoumání desítek tisíců lidských bílkovin u kterých známe funkci pouze omezeného počtu z nich. Jelikož však již známe kompletní lidský genom (tedy posloupnost nukleotidů a genů), úkolem hned několika projektů je na jeho základě vypočíst tvar a z něho přímo vyplývající funkci těchto proteinů v našem organismu. Výsledky jsou zdarma odevzdávané do obecné vědecké databáze, ze které mohou čerpat všechny výzkumné týmy ve světě. Velká databáze proteinů se známým tvarem a funkcí umožní mnohem rychlejší vývoj účinných léků. V oblasti astronomie jsou to například nalezené rotující pulsary, které se hledají prostřednictvím zpracovávání radiového signálu z vesmíru, v matematice třeba extrémně velká prvočísla, nebo vyřešení matematického problému a dokonce existují i konkrétní hmatatelné výsledky, jakým je třeba i částicový urychlovač LHC v CERNu. Distribuované výpočty zpracovávaly modely oběžné dráhy částic v urychlovači, zjišťovaly kolik je třeba použít supravodivých magnetů a jak je rozmístit a tak pomáhaly přímo při stavění urychlovače, ale i s finální kalibrací a ověřováním bezpečného provozu před spuštěním. Poslední z velkých finálních výsledků je z projektu Einstein@home. Díky tomuto projektu se podařilo v srpnu tohoto roku najít první neutronovou hvězdu na základě rozboru radiového signálu z vesmíru.
Zjištěné slepé cesty výzkumu, nebo data ve kterých se nenalezne vůbec nic zajímavého, se mohou někomu zdát jako promrhaný výpočetní čas a energie, ovšem ve vědě mají stejnou hodnotu, jak skvělé objevy. Při výzkumech většinou existuje několik možností a metod a nikdo předem neví, která z nich je ta správná. Pokud dokážeme prostřednictvím distribuovaných výpočtů vyřadit některou z cest jako špatnou, ulehčíme vědcům spoustu času a ti se mohou nakonec soustředit na ten skutečný směr vývoje a nemrhat léty práce. Obdobné je to s daty, která se ukáží jako neužitečná - prázdná. Takových je spousta při radiovém zkoumání vesmíru, ve kterém se hledá jednak zpráva od mimozemských civilizací, ale také nové pulsary a další třeba i dosud neznámé jevy. To stejné platí u výzkumu gravitačních vln ve vesmíru, jejichž existence nebyla dosud přímo potvrzena. Záznamů ke zpracování je obrovské množství a bez distribuovaných výpočtů by se je nikdy nepodařilo zpracovat. Většina z nich se ovšem pouze vyřadí jako prázdné a jde se na další.
Musíme si uvědomit, že není v silách našich počítačů vyrobit přímo konkrétní lék na smrtelnou nemoc a spousta výzkumů se může táhnout léta i desetiletí, ale když už nemáme znalosti, nebo schopnosti se sami zasloužit o pokrok lidstva v dané oblasti, zapojení svého počítače do těchto výzkumů je nemalou pomocí. Distribuované výpočty jsou mnohdy jedinou zbraní, kterou mají vědci pro svůj výzkum a bez nás obyčejných lidí by mohla zaniknout spousta zajímavých myšlenek. Většina počtářů svůj přínos a zapojení do distribuovaných výpočtů bere jako přímou účast na výzkumu, tedy jako určitý sponzorský dar, který neposkytuje jako finanční prostředky nějaké nadaci, bez další možnosti zjištění na co a kde byly použity, ale mohou si přímo vybrat kde pomohou a v jaké míře. Mnohdy takto poskytnutý výpočetní čas a energie je mnohem užitečnější, než solidární příspěvek na následky nemocí, katastrof, nebo lidských tragédií. Distribuované výpočty jdou přímo k jádru věci, k výzkumu samotných nemocí, příčin katastrof, nebo modelování jak jim předcházet a to je mnohem efektivnější. Každý máme na výběr jak a kde pomůžeme, distribuované výpočty jsou zde jako jedna z dostupných možností moderní doby.

Zamčeno

Zpět na „Rady a návody“