Výpadky a plánované odstávky

Fórum o projektu
Odpovědět
Zpráva
Autor
Uživatelský avatar
forest
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 19635
Registrován: pát 27 říj, 2006 10:19
rok narození: 03 bře 1977
ID CNT statistics: 71
Bydliště: Újezd u Brna

Výpadky a plánované odstávky

#1 Příspěvek od forest »

Tento víkend bude výpadek v generování práce pro tento podprojekt. Doporučuji tedy pokud máte povolený jen FightAIDS@Home, zaškrtnout si dočasně ještě některý z dalších podprojektů WCG.

Uživatelský avatar
krahulik
52.6315789474 %
52.6315789474 %
Příspěvky: 1219
Registrován: úte 09 led, 2007 10:33

Re: Výpadky a plánované odstávky

#2 Příspěvek od krahulik »

Z projektu minuly tydne prisla zprava o zborceni RAID serveru. Oprava serveru a obnova zaloh nejaky patek potrva, takze zadaji o pochopeni. Projekt nyni docasne odesila a prijima cca 20 % obvykle zateze, az bude vse OK daji vedet.
Hi Everybody,
Last week the RAID server that stores all of our FightAIDS@Home results and that we use for transfering data to and from the World Community Grid died on us. Some catastrophic hardware failure occurred, and now our server is broken. We are currently trying to fix the issue and to recover all of the FAAH data that was on that server when it died. There are back-up copies of all of the results that your calculations have produced for us, but it will take a few weeks to fix the hardware issue(s) and to restore the ~ 4 TeraBytes of data that were on that server.

While we fix the server and rescue the data, we set up a small, temporary server that allows us to keep submitting new jobs to the World Community Grid. But since we do not yet have a new, large server for storing the incoming results, the WCG team at IBM has offered to store these new results for us for a few weeks. Due to the disk space issues involved in storing these results for us, we will have to temporarily decrease the number of FightAIDS@Home calculations that are performed on the WCG. For the next few weeks, we will be crunching around 20% of the number of jobs that normally run on the FightAIDS@Home section of the WCG.

Please be patient and wish us luck during this server re-build and data recovery process. In a few weeks we should be back to normal. We'll let you know when everything has been fixed.

Best wishes,
Dr. Alex L. Perryman
Obrázek

Uživatelský avatar
krahulik
52.6315789474 %
52.6315789474 %
Příspěvky: 1219
Registrován: úte 09 led, 2007 10:33

Re: Výpadky a plánované odstávky

#3 Příspěvek od krahulik »

Pred 2 dny byl ohlasen navrat do obvyklych koleji, byly zmineny take blizsi info ohledne RAIDU.
Hi everybody,
We have good news to report: our RAID server has been restored, and the most important data have been recovered. Communication with the WCG is up-and-running again. After they transfer the backlog of new results to us, FightAIDS@Home will resume its normal rate of operation.
Kudos to our Systems Admin., Sargis Dallakyan!
Some additional background info.:
Apparently, our RAID server previously had multiple issues. At least two disks failed on us. Since there was a software glitch on the server, as well, it did not notify us when the disks failed. Luckily, the hardware was still under warranty (just barely). We have now replaced the broken hardware and fixed the glitchy software.

After the FightAIDS@Home data has been compressed (i.e., tarred and g-zipped), it currently consumes around 5 TB. But thanks to us and to all of you, this mountain of many small files keeps growing and growing.

To obviate any future RAID-related issues, we just bought several 1.5 TB external hard drives. We're making an extra back-up copy of all of the FightAIDS@Home data on these external drives, and we're going to apply for access to the high-performance storage system at the San Diego Super-computer Center (SDSC), so that we can make an additional, long-term back-up copy of our data.
Thank you all very much for your patience and for your support,
Dr. Alex L. Perryman
Obrázek

Uživatelský avatar
xVlado
5.26315789474 %
5.26315789474 %
Příspěvky: 40
Registrován: čtv 09 črc, 2009 21:23
rok narození: 0- 0-1984

Re: Výpadky a plánované odstávky

#4 Příspěvek od xVlado »

Nemáte někdo info, co se na tomto projektu děje? Už 2 dny mi nestahuje práci. :smt022
ObrázekObrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek
Obrázek

Uživatelský avatar
krahulik
52.6315789474 %
52.6315789474 %
Příspěvky: 1219
Registrován: úte 09 led, 2007 10:33

Re: Výpadky a plánované odstávky

#5 Příspěvek od krahulik »

xVlado píše:Nemáte někdo info, co se na tomto projektu děje? Už 2 dny mi nestahuje práci. :smt022
Problemove nove WU (konci chybou kratce po zacatku zpracovani). Jednotky budou distribuovany az po vyreseni problemu.
There is a problem with the new work units for FAAH which will cause the following error immediately after processing is started:
autogrid: Unknown receptor type: "A"
-- Add parameters for it to the parameter library first!
Until the problem has been resolved, work units for FAAH are no longer being sent out.
Obrázek

Uživatelský avatar
Ondra@SF.cz
36.8421052632 %
36.8421052632 %
Příspěvky: 597
Registrován: pon 22 úno, 2010 16:36
rok narození: 09 úno 1993
ID CNT statistics: 8123
Bydliště: Space Family
Kontaktovat uživatele:

Re: Výpadky a plánované odstávky

#6 Příspěvek od Ondra@SF.cz »

Nevím jak je to aktuální, ale já práci pro FAAH normálně dostávám - zrovna mám v cache 3 jednotky, které se mi natáhly hned po včerejším výpadku WCG serveru...
Pocitadlo : Deska - ASRock Fatal1ty Z77 Killer, CPU - Intel Pentium G3220(Haswell), 8GB RAM DDR3, GPU - ASUS DCIIOC AMD Radeon HD7790, Case - Chieftec LBX-02B-B-B, zdroj Seasonic X-1050 Gold, systém - dualboot ArchLinux (AntergOS) + Windows 8.1 64bit
Moje statistiky : BoincStats, B.Mundayweb, PrimeGrid a statistiky CNT od vklibera ;)
PG medaile : Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek Obrázek
WCG medaile : ObrázekObrázekObrázekObrázekObrázekObrázekObrázekObrázek
Poslouchám asi tak tohle (my Last.fm music profile)...
Obrázek

Odpovědět

Zpět na „FightAIDS@Home - World Community Grid“