<div dir="ltr">It is in state qw.<div><br></div><div><div>home directory is mounted.</div></div><div><br></div><div>I used qalter command it produces this output:</div><div>instance "node" dropped because it is temporarily not available</div><div>I checked the firewalls and all of them are dropped and daemons are listing on the ports on the master and executions nodes.</div><div><br></div><div>I noticed that there is no directory in /opt/sge/default/spool/ shouldn't a directory with the name of the execution node be created in this path??</div><div><br></div><div>-- Shazly</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Oct 15, 2015 at 11:45 AM, Reuti <span dir="ltr"><<a href="mailto:reuti@staff.uni-marburg.de" target="_blank">reuti@staff.uni-marburg.de</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi,<br>
<span class=""><br>
> Am 15.10.2015 um 01:16 schrieb Hatem Elshazly <<a href="mailto:hmelshazly@gmail.com">hmelshazly@gmail.com</a>>:<br>
><br>
> Hi there,<br>
><br>
> I'm having a problem getting an execution host to work. The master node seems it can't sense the execution node, when I submit a job it stalls in the queue.<br>
<br>
</span>Is it in state "qw" or "t"?<br>
<br>
$ qalter -w v <job_id><br>
<br>
will check whether the job could be started in an empty cluster in the current configuration.<br>
<br>
The home directory is shared in the cluster, so that the user's home directory can be accessed?<br>
<span class=""><br>
<br>
> Both daemons are running on master and executing node, I added the execution node to the queue and made sure the ports are open and can ssh without password from/to both nodes<br>
<br>
</span>It's not necessary to have passphraseless SSH in the cluster. Even parallel jobs can run without this setting. In fact, I allow SSH access to nodes only for admin staff.<br>
<span class=""><br>
<br>
> , sge_root and sge_cell are open to read and write. The strange thing is when I change the ncpu of the execution node it gets reflected when I use qhost command on master node.<br>
<br>
</span>You mean "num_proc"? This should be seen as a read only value and it's normally not necessary to adjust it. The slot count in the queues is independent from this setting.<br>
<br>
-- Reuti<br>
<span class=""><br>
<br>
> This is the output of qhost command: (Arch and mem is NA although I set them in the node's values)<br>
><br>
> HOSTNAME                ARCH         NCPU  LOAD  MEMTOT  MEMUSE  SWAPTO  SWAPUS<br>
> -------------------------------------------------------------------------------<br>
> global                  -               -     -       -       -       -       -<br>
> node001               -               1     -       -       -       -       -<br>
> master                 linux-x64       1  0.01    3.7G  157.8M     0.0     0.0<br>
><br>
><br>
> Any suggestions on what might be wrong is really appreciated.<br>
><br>
> Thanks.<br>
</span>> _______________________________________________<br>
> users mailing list<br>
> <a href="mailto:users@gridengine.org">users@gridengine.org</a><br>
> <a href="https://gridengine.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://gridengine.org/mailman/listinfo/users</a><br>
<br>
</blockquote></div><br></div>