SysFera / vishnu

Modular and high-level middleware for tasks, files and information management in heterogeneous and distributed HPC environments
http://sysfera.github.com/vishnu.html
Other
4 stars 12 forks source link

vishnu_submit_job -P n submit always one 1 proc only (Bugzilla #219) #174

Closed bdepardo closed 11 years ago

bdepardo commented 11 years ago

critical bug in component TMS Reported in version 1.2.2 on platform Other

bdepardo commented 11 years ago

On 2011-07-01 01:01:20 +0200, 'Samuel Kortas (samuel.kortas@edf.fr) wrote: Created attachment 110 le script

L'argument -P est inopérant pour la commande vishnu_submit_job. Le programme est soumis uniquement sur un noeud dans l'ensemble des cas

vishnu_submit_job server -P 3 ~/INSTALL/TEST/Torque_script_nu

vishnu_submit_job server ~/INSTALL/TEST/Torque_script_nu

vishnu_submit_job server -n toto -P 2 ~/INSTALL/TEST/Torque_script_nu

donne le meme resultat dans vishnu_list_jobs

jeudi 30 juin 2011, 22:58:36 (UTC+0200) JOBNAME USERNAME STATE NB_CORES CLASS ELAPSE J_258/job_scriptwgLYrZ samy QUEUED 1 batch server J_259/toto samy QUEUED 1 batch server J_260/job_scriptohh6Fl samy QUEUED 1 batch server

bdepardo commented 11 years ago

On 2011-08-17 15:34:26 +0200, 'Benjamin Depardon (benjamin.depardon@sysfera.com) wrote: Changement de version du produit -> 1.2.2

bdepardo commented 11 years ago

On 2011-10-05 10:51:13 +0200, 'Daouda (daouda.traore@sysfera.com) wrote: Created attachment 119 script de test Loadleveler sur le nombre de processeur

bdepardo commented 11 years ago

On 2011-10-05 10:52:36 +0200, 'Daouda (daouda.traore@sysfera.com) wrote: Created attachment 120 script de test sur la mémoire

bdepardo commented 11 years ago

On 2011-10-05 10:54:31 +0200, 'Daouda (daouda.traore@sysfera.com) wrote: Bonjour Samuel,

Ci-joint deux deux scripts loadleveler, est-ce tu peux me les lancer sur la machine bgp avec la commande llsubmit et vérifie que le script script_nb_proc te donne 3 comme nombre de processeurs et le script script_mem te donne 1024mb comme mémoire. Ces tests m'aideront à corriger le bug que tu as posté sur la commande vishnu_submit_job, je n'arrive pas à me connecter sur la machine que j'avais à ma disposition ici.

A bientôt Daouda

bonjour Daouda

desole pour avoir zappe ton mail

pour l'instant j'ai une erreur renvoye par LoadLeveler

vishnu@ums-server:~/INSTALL$ vishnu_submit_job fenp TEST/bgp_script_mem MA NAME PARSING = MA1 DIET WARNING: useLogService disabled.

Launch Dagda data manager DAGDA-client-ums-server-32415

The Master Agent found the following server(s): fenp:0 Calling the ref Corba of the SeD vishnu_submit_job: The batch scheduler indicates an error [LOADLEVELER ERROR: llsubmit: Processed command file through Submit Filter: "/gpfs/home/loadl/submit_filter". llsubmit: 2512-585 The "bg_size" keyword is only valid for "job_type = BLUEGENE" job steps.] vishnu@ums-server:~/INSTALL$

et c'est le meme topo pour bgp_nb_procs

je vais d'abord reinstaller la nouvelle version de vishnu et je reviens a ce probleme ensuite

si tu as une idee, n'hesite pas

A+

Samuel

bdepardo commented 11 years ago

On 2011-10-05 10:55:48 +0200, 'Daouda (daouda.traore@sysfera.com) wrote: Daouda

je fouille, mais c'est peut-etre un faux probleme

j'ai l'impression que sur BG tout est determiné par la classe que tu demandes qui n'alloue qu'un type de partition ayant un nombre constant de procs a chaque fois. En clair, si tu demandes la classe BG128_1H, on te reserve 128 procs que tu declares en utiliser 128 ou 3...!

et pour la memoire, c'est exactement le meme topo

A+

SK

bdepardo commented 11 years ago

On 2011-10-06 11:38:34 +0200, 'Daouda (daouda.traore@sysfera.com) wrote: Bonjour Samuel,

Je voudrais savoir si tu as pu avoir la confirmation que sur BG tout est determiné par la classe que tu demandes qui n'alloue qu'un type de partition ayant un nombre constant de procs à chaque fois.

A+ Daouda

bdepardo commented 11 years ago

On 2011-10-18 14:38:08 +0200, 'Daouda (daouda.traore@sysfera.com) wrote: L'options pour fixer le nombre de cpus n'existe pas dans les syntaxes LoadLeveler (http://minervadoc.uvic.ca/loadl31/html/am2ugmst02.html#ToC_159 ). L'utilisateur doit choisir la bonne classe qui doit contenir au moins le nombre de cpus qu'il souhaite avoir.