Chyba při výpočtu jednotek (Linux)

Fórum o projektu
Zpráva
Autor
Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Chyba při výpočtu jednotek (Linux)

#1 Příspěvek od Michal Kinďura »

Zdravím,
dneska jsem se zapojil do projektu, ale už od první jednotky mám obrovský problém. Po více než půl minutě mi zamrzne celý počítač a dioda na skříni indikuje, že se zapisuje na disk. Trvá to přibližně 10 minut, většina aplikací na počítači je vyšedlých (neodpovídají), jen některé normálně fungují. Po deseti minutách jednotka skočí na 100% a chybu při výpočtu.

Mám 64bitvé Ubuntu 10.10 a nejnovější Virtualbox.

V event logu BOINC bylo pouze uvedeno:
Čt 12. duben 2012, 16:00:39 CEST | Test4Theory@Home | Task uc_1331543589_135399_0 exited with zero status but no 'finished' file
Čt 12. duben 2012, 16:00:39 CEST | Test4Theory@Home | If this happens repeatedly you may need to reset the project.
Čt 12. duben 2012, 16:00:39 CEST | Test4Theory@Home | Restarting task uc_1331543589_135399_0 using cernvm version 707
Čt 12. duben 2012, 16:01:00 CEST | Test4Theory@Home | Computation for task uc_1331543589_135399_0 finished
Čt 12. duben 2012, 16:01:00 CEST | Test4Theory@Home | Output file uc_1331543589_135399_0_0 for task uc_1331543589_135399_0 absent
:smt102

Věděl by někdo?

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Chyba při výpočtu jednotek (Linux)

#2 Příspěvek od nenym »

Napřed restartuj počítač.
u tebe
- zkus, zda ti jede VirtualBox sám o sobě
- pokud máš již boinc computer založen, zkus jej spustit ručně z menu VirtualBoxu
nastavení na webu
- zatím nedávej volbu Headless, ať vidíš, co se děje
- zakaž mt provoz
Osobně odhaduji, že máš problém s vytížením procesoru, prohlédni si stderr file, vidím samé No heartbeat from core client for 30 sec - exiting
také závěr je zajímavý
INFO: Number of cores: 1
NOTICE: Maximum usage of CPU: 100
NOTICE: Setting how much CPU time the virtual CPU can use: 100
NOTICE: Success!
DEBUG level: 3
WARNING: VM is powered off and it shouldn't (1 times!)
WARNING: Retrying in 2 seconds
WARNING: VM is powered off and it shouldn't (2 times!)
WARNING: Retrying in 2 seconds
WARNING: VM is powered off and it shouldn't (3 times!)
WARNING: Retrying in 2 seconds
WARNING: VM is powered off and it shouldn't (4 times!)
WARNING: Retrying in 2 seconds
WARNING: VM is powered off and it shouldn't (5 times!)
WARNING: Retrying in 2 seconds
ERROR: VM has been powered off for the last 5 poll calls!
ERROR: Cancelling Work Unit!
16:00:57 (27273): called boinc_finish
Sniž si povolené využití procesoru na 20% v nastaveních.
Asi bych laboroval s nastaveními na webu projektu a sledoval poté, co dělají jednotlivé procesy. Sice máš 12 GB RAM, ale kolik ji máš volné? T4T sežere typicky přes 1 GB.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#3 Příspěvek od Michal Kinďura »

V synaptiku jsem odstranil staré kernely a kraviny, trochu si to pročistil, uvolnil 1GB navíc a restartoval
VirtualBox jede, měl jsem v něm XPčko na kterém jsem chvikově testoval yoyo subprojekty pro Windows. Dneska jsem jej aktualizoval na nejnovější verzi, pro případ bugů. Jede.
Co je boinc computer? Na stránkách jsem našel pouze manuál na instalaci VirtualBoxu a Boinc manažera + přidání projektu. Víc tam nebylo.

Run Virtual Machine in headless mode - no
Co je mt provoz? Přijímání jednotek i z jiných aplikací, pokud nejsou dostupné mé?

Procesor mám vytížený pouze BOINCem, běží mi posledních pár jednotek yoyo a na GPU Primegrid- Snížil jsem v nastavení projektu CPU i GPU max na 20%.
Ramky mám volné asi 11GB, rozhodně nejde o žádnou krizi. Kupoval jsem si to kvůli ECM, které to na 6 jádrech často potřebuje, ten ale teď nepočítám. Používám teď počítač jen na prohlížeč.

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#4 Příspěvek od Michal Kinďura »

Po změnách počítal 4 minuty a pak začal to samé počítat znova :smt017
V průběhu počítání jsem vypnul ostatní výpočty atd... Ale i tak, počítač se šíleně sekal.
Tak jsem to teď pauznul, předpokládám že po dalších 4 minutách by byl nový pokus a pak opět fail...

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Chyba při výpočtu jednotek (Linux)

#5 Příspěvek od nenym »

Přestávám tomu rozumět, nic smysluplného mě nenapadá.
Opravdu počítá opticky to samé pořád dokola. Task pouze spustí Vbox, v něm se nastartuje Linux s CERN nastavením a práci dostává online od serveru projektu, kterou také online odevzdává. Po 24 hodinách Boinc aplikace zavře VBox a odešle pouze CPU time, Run time a stderr. Tedy součásti komunikace Boinc části projektu nejsou žádné výsledky ani žádné zadání.
Nejdůležitější informace o tom, co a jak se počítá, jsou zde. Jinak fórum je aktivní, všichni se snaží s problémy pomoci, admin a scientista Daniel je velmi komunikativní, též těžký experimentátor a znalec triků jujube. Zkus projet toto vlákno, třeba tam najdeš odpověď.
Teoreticky by mohl býti problém i zde
Under Linux, BOINC has to be installed in a special way. In order to run Virtual Machines with VirtualBox in your computer, the user needs special privileges. However, the standard Linux distribution package manager installation for BOINC runs under an unprivileged user, so it will not work with this project. If you have such an existing BOINC client installed, you will have to reinstall it.

First go to the BOINC download link on the official BOINC site and download the installer, which has a name of the form "boinc_VERSION_.sh". This is an auto self-extracting file, that has to be installed as follows:

The boinc_VERSION_.sh file needs to be run, so you first need to give it execution permissions (by default it is a non-executable file).
Then you will be able to double-click it, or run it from a command line as (./boinc_VERSION_.sh)
After running this application you will see a new BOINC folder, where you can run the client by double-clicking in the boincmgr command.
Attach your computer to the project!
Zákaz MultiThread provozu: Use only one single core?
(Disable it if you have VT extensions in your computer BIOS) yes
Boinc computer - přesný název je BOINC_VM je založený virtuální počítač ve VirtualBoxu, najdeš jej v seznamu počítačů Virtual Boxu, tak jak tam vidíš svůj Widelní stroj. I zde by možná mohl být problém, když jsem experimentoval s opakem (ve Widlích spouštět Linux přes Oracle VM), tak i nespuštěný Linux se nějak nepohodl s BOINC_VM a výpočty neběžely. Pokud tam není, tak to znamená, že běh zatuhl v okamžiku zakládání tohoto stroje.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

Uživatelský avatar
vkliber
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 10306
Registrován: čtv 29 bře, 2007 10:41
ID CNT statistics: 1
Bydliště: Brušperk, 48 let
Kontaktovat uživatele:

Re: Chyba při výpočtu jednotek (Linux)

#6 Příspěvek od vkliber »

Krátká vsuvka a popis 2 experimentů z doby kdy se projekt rozjížděl a trpěl ještě mnohými neduhy.
Možná to nemá souvislost, možná jo.
Oba případy na WinXP.

1. experiment (a první pokus o rozběhání T4T na prvním PC)
- než jsem začal tak na PC nebyl VirtualBox (VB)
- postupoval jsem striktně podle návodu na webu projektu a pak jsem ho volně přepsal zde (rok staré)
- vše fungovalo na první pokus

2. experiment (a druhý pokus o rozběhání T4T na druhém PC o pár měsícu později)
- než jsem začal tak na PC byl VB starší verze
- upgrade VB na požadovanou verzi
- stejný postup jako předtím
- po stáhnutí WU se spustil VB, v něm se spustil CERN Linux ... a nic, nic se nepočítalo,
...
- odinstalace VB
- odstranění balastu z registrů
- pak postup jako u 1. experimentu
- vše fungovalo

Nedělám z toho závěry 45cc , bylo to jiné PC, verze CERN aplikace byla zřejmě taky jiná.
Ale kdo ví 45cc .
Statistiky CNT | Projekty CNT | Distribuované výpočty CNT | SETI CNT | Einstein CNT
.....::::: Proč se mít nejlépe, když se můžu mít čím dál tím stejně :::::.....
Moje skromná statistika tady , tady , tady nebo grafy.
˙ıɔıqɐɹʞ ʌ ǝןɐ 'ıןʇʎd ʌ ǝɔıɾɐz ǝʇɾndnʞǝu ʎpʞıu ˙˙˙

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#7 Příspěvek od Michal Kinďura »

Takže tak nějak postupně. Hodil jsem si příkazem TOP výpis procesů, které nejvíce žerou. Před tím, než jsem spustil... mezi TOP byl virtualbox s XP, které jsem si před chvílí spustil kvůli počítání Windowsáckých yoyo. Jinak pochopitelně moje linuxácké projekty. Jakmile jsem přijmul jednotku, tak Virtualbox spadl na nějakých 7% CPU a takt procesoru začal skákat na jednotlivých jádrech 3.2GHz, 2.4, 1.6, 800MHz jak na horské dráze. :smt017 Pak až ta práce zdechla s chybou, tak se vše vrátilo do starých pevných kolejí.

Zakázal jsem ten singlecore režim
Virtuální počítač v seznamu virtualboxu počítačů nemám - to bude asi ten klíčový problém. Mám tady jenom své XPčko.

Uživatelský avatar
vkliber
Admin webu a fóra CNT
Admin webu a fóra CNT
Příspěvky: 10306
Registrován: čtv 29 bře, 2007 10:41
ID CNT statistics: 1
Bydliště: Brušperk, 48 let
Kontaktovat uživatele:

Re: Chyba při výpočtu jednotek (Linux)

#8 Příspěvek od vkliber »

Michal Kinďura píše:...
Virtuální počítač v seznamu virtualboxu počítačů nemám - to bude asi ten klíčový problém. Mám tady jenom své XPčko.
No to teda bude 45cc .
Při stahování první WU se stáhne i obraz virtuálního stroje (přes 100MB).
Při spuštění jednotky nesmí ve VirtualBoxu nic běžet, nebo musí být vypnutý (BOINC si ho sám spustí).
Statistiky CNT | Projekty CNT | Distribuované výpočty CNT | SETI CNT | Einstein CNT
.....::::: Proč se mít nejlépe, když se můžu mít čím dál tím stejně :::::.....
Moje skromná statistika tady , tady , tady nebo grafy.
˙ıɔıqɐɹʞ ʌ ǝןɐ 'ıןʇʎd ʌ ǝɔıɾɐz ǝʇɾndnʞǝu ʎpʞıu ˙˙˙

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#9 Příspěvek od Michal Kinďura »

vkliber píše:No to teda bude 45cc .
Při stahování první WU se stáhne i obraz virtuálního stroje (přes 100MB).
Při spuštění jednotky nesmí ve VirtualBoxu nic běžet, nebo musí být vypnutý (BOINC si ho sám spustí).
No, tak jsem vypnul virtualbox a všechny virtuální stroje a restartoval projekt. Nic se nezměnilo. Stále se jednotka chvíli počítá a pak jede nanovo :smt017

Uživatelský avatar
Neoka
10.5263157895 %
10.5263157895 %
Příspěvky: 59
Registrován: úte 07 úno, 2012 16:37
rok narození: 0- 1-1966
ID CNT statistics: 17391

Re: Chyba při výpočtu jednotek (Linux)

#10 Příspěvek od Neoka »

Tak hlásím podobný problém na Win7-64bit

Úplně nový ntb Lenovo IdeaPad Z570 s NV GT 630M 2GB,
první instalace Boinc 7.0.25 + VM 4.1.12

začne počítat a po 60-90s končí s chybou výpočtu 100% hotovo, VM naběhne, ale úloha tváří se jako vypnutá, sama se ani neukončí, po aktualizaci projektu se ale načte nové WU a stejný průběh.

Initializing the VM...
Decompressing the VM
Virtual Disk uncompressed. Ready to create the VM
NOTICE: Virtual machine name: BOINC_VM
Registering a new VM from unzipped image...
VM successfully registered and created!
NOTICE: I'm running in a Windows system...
ERROR: Impossible to read the VBox.log file!
NOTICE: VM has been started!
INFO: Number of cores: 2
NOTICE: Maximum usage of CPU: 100
NOTICE: Setting how much CPU time the virtual CPU can use: 100
NOTICE: Success!
DEBUG level: 3
WARNING: VM is powered off and it shouldn't (1 times!)
WARNING: Retrying in 2 seconds
WARNING: VM is powered off and it shouldn't (2 times!)
WARNING: Retrying in 2 seconds
WARNING: VM is powered off and it shouldn't (3 times!)
WARNING: Retrying in 2 seconds
WARNING: VM is powered off and it shouldn't (4 times!)
WARNING: Retrying in 2 seconds
WARNING: VM is powered off and it shouldn't (5 times!)
WARNING: Retrying in 2 seconds
ERROR: VM has been powered off for the last 5 poll calls!
ERROR: Cancelling Work Unit!

Projetk Albert nastartoval a běží ohne problem

Na jiném ntb win7-32bit, Intel Core2Duo mi, ale s Boinc 6.12.34 + VM 4.1.12, počítá T4T už dlouho a od počátku bez problémů.

Napadá mě není problém zoofilního nekrofila v novém Boinc ? Proč nedokáže načíst vbox.log ?
Obrázek

Uživatelský avatar
Neoka
10.5263157895 %
10.5263157895 %
Příspěvky: 59
Registrován: úte 07 úno, 2012 16:37
rok narození: 0- 1-1966
ID CNT statistics: 17391

Re: Chyba při výpočtu jednotek (Linux)

#11 Příspěvek od Neoka »

problém se mi podařilo vyřešit, v BIOSu byla zakázána Intel virtual technologie

odhaduji že kolega má stejný problém vidím v reportu stejnou hlášku :
VM is powered off and it shouldn't (1 times!)
Obrázek

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#12 Příspěvek od Michal Kinďura »

Neoka píše:problém se mi podařilo vyřešit, v BIOSu byla zakázána Intel virtual technologie

odhaduji že kolega má stejný problém vidím v reportu stejnou hlášku :
VM is powered off and it shouldn't (1 times!)
Před pár dny jsem projel BIOS a pozapínal/povypínal všechno co by s tím mohlo mít co dočinění a nic se nezměnilo. Nejspíše bude problém v mé distribuci, nebo někde v počítači. Projekt jsem rozjel na notebooku Celeronku, spíše jen tak symbolicky, aby mi tady chladič ohříval vzduch, když se teď venku ochladilo :smt023
Na mém hlavním stroji asi T4T uzavřu do doby, než přejdu na nejnovější Ubuntu třeba se to tím vyřeší 45cc

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Chyba při výpočtu jednotek (Linux)

#13 Příspěvek od nenym »

V terminálu se ti Oracle VirtualBox rozjede? Na dvou strojích se mi nerozběhl ani v terminálu a musel jsem místo debian balíčkovače použít manuální instalaci a pro T4T app_info s verzí 7.03. Mohu případně předat bližší informace a soubory.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#14 Příspěvek od Michal Kinďura »

nenym píše:V terminálu se ti Oracle VirtualBox rozjede? Na dvou strojích se mi nerozběhl ani v terminálu a musel jsem místo debian balíčkovače použít manuální instalaci a pro T4T app_info s verzí 7.03. Mohu případně předat bližší informace a soubory.
Nemyslím si, že by byl problém ve VirtualBoxu. Aktualizoval jsem ho na nejnovější verzi, když jej spustím manuálně z menu, tak naběhne a zobrazí se moje dva virtuální stroje, co jsem si tam v minulosti udělal sám...
Spíš bych chtěl konkrétní věci, moc se v tom neorientuju, existuje něco jako terminálová verze VB? Nebo to spustit z terminálu jakože v terminálu napsat virtualbox a nastartovat to takhle? Spuštění z terminálu mi taky jde bez problému...

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Chyba při výpočtu jednotek (Linux)

#15 Příspěvek od nenym »

Tak to nevím, jediné co mě napadá - máš Boinc naistalován z repozitářů nebo manuálně pod superuserem? Pokud z repozitářů, tak je to problém, jehož řešení jsem kdysi na jejich fóru zachytil. Vzhledem k tomu, že Boinc instaluji zásadně manuálně, tak ti v tomto ohledu poradit nedokáži. Pokud manuálně pod standardním uživatelem, tak ho jednoduše přeinstaluj jako superuser sudo sh Boinc_bla_blablabla.sh
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#16 Příspěvek od Michal Kinďura »

nenym píše:Tak to nevím, jediné co mě napadá - máš Boinc naistalován z repozitářů nebo manuálně pod superuserem? Pokud z repozitářů, tak je to problém, jehož řešení jsem kdysi na jejich fóru zachytil. Vzhledem k tomu, že Boinc instaluji zásadně manuálně, tak ti v tomto ohledu poradit nedokáži. Pokud manuálně pod standardním uživatelem, tak ho jednoduše přeinstaluj jako superuser sudo sh Boinc_bla_blablabla.sh
S ohledem na to, že nové verze BOINC se do repo mé distribuce nedávaly, tak jsem si jistý, že poslední aktualizaci jsem dělal terminálem přes skript. A dokonce si pamatuju, jak jsem se s tím mordoval, neboť mi po hlásilo nějaké chyby, než jsem to tam konečně dostal :smt045

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#17 Příspěvek od Michal Kinďura »

Vyřešil jsem to, sice prasácky, ale vyřešil. Nainstaloval jsem si do svého VirtualBoxu XP a do těch XP Boinc a další VirtualBox 45hh
Musel jsem akorát změnit klávesu na vyskakování z okna, protože mi to skrz 2 VM blblo 45hh

Řešení na dočasnou dobu dobré :smt045

nenym
78.9473684211 %
78.9473684211 %
Příspěvky: 7610
Registrován: úte 13 led, 2009 15:33
rok narození: 0- 0-1956
ID CNT statistics: 10124

Re: Chyba při výpočtu jednotek (Linux)

#18 Příspěvek od nenym »

21 let je docela dlouhá doba.
Blíží se konsolidační balíček pětikolky; šetřím trojbojem - piji staré víno, jím plesnivé sýry a jezdím v autě bez střechy.
UotD 767x Obrázek
1xObrázek 3xObrázek 9xObrázek 12xObrázek Obrázek
Obrázek

Michal Kinďura
42.1052631579 %
42.1052631579 %
Příspěvky: 732
Registrován: úte 21 čer, 2011 13:26
ID CNT statistics: 16075

Re: Chyba při výpočtu jednotek (Linux)

#19 Příspěvek od Michal Kinďura »

Moc jsem nepochopil na co je reagováno? 45ff

Uživatelský avatar
Neoka
10.5263157895 %
10.5263157895 %
Příspěvky: 59
Registrován: úte 07 úno, 2012 16:37
rok narození: 0- 1-1966
ID CNT statistics: 17391

Re: Chyba při výpočtu jednotek (Linux)

#20 Příspěvek od Neoka »

reagováno bylo na "dočasnost" 45hh
tvoje řešení myslím na houby...přeci ztratíš veliký kus výkonu...
Obrázek

Odpovědět

Zpět na „VirtualLHC@home“