FAQ head

FAQ plate-forme

1) PILCAD est-il un nouveau laboratoire ?
1) Non, PILCAD est une plate-forme
2) C'est quoi une plate-forme ? 2) Une plate-forme n’est pas une nouvelle unité. Il s’agit d’un projet scientifique de durée minimum de trois à quatre années pour lequel deux unités ou plus mettent en commun des moyens humains et financiers. Les personnels restent membres de leur unité d’origine.
3) A qui appartiennent les résultats scientifiques de la plate-forme ?
3) Les résultats scientifiques appartiennent conjointement aux deux unités.
4) Comment est évaluée l’activité scientifique de la plate-forme 4) L’activité scientifique de la plate-forme est évaluée à travers les unités qui ont accepté de participer au projet : ce n’est donc pas une nouvelle entité et la plate-forme pourra être arrêtée très facilement dès que le conseil scientifique aura jugé que les objectifs ont été atteints ou que ceux-ci se révèlent irréalistes.

FAQ techniques

1) comment les comptes utilisateurs sont "propagés" sur les noeuds de la grappe ?
1) Réponse de Michel Vayssade:

telle que la grappe est installée, la propagation des comptes users créés sur le master0 n'est pas automatique vers les nodes 0-9

plutôt que d'installer l'usine à gaz "NIS" (yp), j'ai pris l'option de dupliquer vers les noeuds les fichiers /etc/passwd, /etc/group et /etc/shadow

ça évitera d'avoir des démons NIS qui tournent en permanence

pour faciliter cette duplication j'ai créé un script "propage" dans le compte root il suffit de faire ./propage sous root après avoir créé un nouveau user

2) Je lance un example mpi et j'obtiens cette erreur que je ne comprends pas (mpirun -np 1 cpi) p0_6792: p4_error: semget failed for setnum: 0
2) il faut nettoyer les ipc avec la commande /usr/local/mpich-gcc/sbin/cleanipcs
3) Apres a voir rebooté manuellement pilcad, certains noeuds de calcul
n'ont pas correctement remonté le serveur NFS
par exemple pour le noeud 8 on a :

$ rsh node8
Password:
Last login: Tue Apr 22 20:53:37 from master0
No directory /home/cdenis!
Logging in with home = "/".
3) La solution (tiree de la doc alineos) est de faire :
bash-2.05a$ su
Password:
[root@node8 /]# mount -a
[root@node8 /]#
4) comment utiliser les compilateurs PGI ? 1/ il faut ajouter dans votre .bashrc les lignes suivantes :

export PGI=/usr/pgi
LM_LICENSE_FILE=$PGI/license.dat
export LM_LICENSE_FILE

2/ lancement du demon de licence

$ lmgrd.rc start

3/ l'arret du demon de licence est invoqué par la commande :

$ lmgrd.rc stop
lmutil - Copyright (C) 1989-2000 Globetrotter Software, Inc.

Port@Host Vendors
1) 7496@pilcad.utc.fr pgroupd
Shut down FLEXlm server on node pilcad.utc.fr
1 FLEXlm License Server shut down

la FAQ et la doc se trouvent aux adresses suivantes :
http://www.pgroup.com/faq/index.htm
http://www.pgroup.com/doc/index.htm

5) mpi marche
mais on ne peut pas lancer le programme mpi sur le master mais sur un noeud de calcul
5) Ce doit être à cause de :

[root@pilcad mpich-gcc]# more
/usr/local/mpich-1.2.4/util/machines/machines.LINUX
# Change this file to contain the machines that you want to use
# to run MPI jobs on. The format is one host name per line, with either
# hostname
# or
# hostname:n
# where n is the number of processors in an SMP. The hostname should
# be the same as the result from the command "hostname"
node0.clustal.com:2
node1.clustal.com:2
node2.clustal.com:2
node3.clustal.com:2
node4.clustal.com:2
node5.clustal.com:2
node6.clustal.com:2
node7.clustal.com:2
node8.clustal.com:2
node9.clustal.com:2

qui ne contient pas master0

cette approche est conforme à la logique de la grappe Beowulf: le noeud master0 est un noeud frontal utilisé pour l'administration, les autres noeuds étant dédiés au calcul

inclure master0 induirait une hétérogénéité de performances (c'est un monoprocesseur)

6) Comment faire tourner MUMPS sur pilcad ?

Symptome :

$ cd /usr/local/MUMPS/MUMPS_4.2_beta/test

$ mpirun -np 2 ./dsimpletest < input_simpletest_real

/usr/local/MUMPS/MUMPS_4.2_beta/test/./dsimpletest:
error while loading shared libraries: libpgc.so:
cannot open shared object file: No such file or directory
6) Liste des bibliothèques linkées avec le fichier binaire :

[vayssade@node0 test]$ ldd dsimpletest
libm.so.6 => /lib/i686/libm.so.6 (0x4001a000)
libc.so.6 => /lib/i686/libc.so.6 (0x42000000)
/lib/ld-linux.so.2 => /lib/ld-linux.so.2 (0x40000000)
libpgc.so => not found

BON : il faut mettre libpgc.so dans le chemin de recherche des
bibliothèques partagées : LD_LIBRARY_PATH

(libpgc.so est la bibliothèque partagée du compilateur pgi)

(1) UNE fois pour toute : mettre une copie de libpgc.so dans
/usr/local/lib/
Pourquoi une copie ? Parce que le compilo pgi est installé
sur pilcad dans une dir qui n'est pas visible des noeuds de calcul
(/usr/pgi/linux86/)

(2) mettre dans un .bashrc ou équivalent la commande :
export LD_LIBRARY_PATH=/usr/local/lib

ça suffit :
[vayssade@node0 test]$ export LD_LIBRARY_PATH=/usr/local/lib
[vayssade@node0 test]$ ldd dsimpletest
libm.so.6 => /lib/i686/libm.so.6 (0x4001a000)
libc.so.6 => /lib/i686/libc.so.6 (0x42000000)
libpgc.so => /usr/local/lib/libpgc.so (0x4003d000)
/lib/ld-linux.so.2 => /lib/ld-linux.so.2 (0x40000000)

et l'exemple s'exécute :
[vayssade@node0 test]$ mpirun -np 4 ./dsimpletest < input_simpletest_real

DMUMPS Version 4.2 beta -- Dec 2002
L U Solver for unsymmetric matrices
Type of parallelism: Working host
Resetting candidate strategy to 0 because NSLAVES=1

.. Candidate : keep(24) = 0

****** ANALYSIS STEP ********

..............;;
Solution is 1.000000000000002 2.000000000000000
2.999999999999999 4.000000000000001 4.999999999999998
FORTRAN STOP

Ceci dit, je ne suis pas certain qu'il fasse effectivement du parallélisme. L'exemple est tellement ridiculement petit !!!

Il faudrait une matrice de quelque centaines de lignes.
Side nav buttonsContactsDocumentationProjetsFoire Aux QuestionsA propos