Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2015q2/001547.html
Дата изменения: Mon Apr 27 11:55:39 2015
Дата индексирования: Sun Apr 10 18:17:36 2016
Кодировка:
[RU-NGI] torque-server-4.2.10

[RU-NGI] torque-server-4.2.10

Valery Mitsyn vvm at mammoth.jinr.ru
Sun Apr 26 17:51:31 MSK 2015


On Sun, 26 Apr 2015, Valery Mitsyn wrote:

> On Sun, 26 Apr 2015, Alexander Kryukov wrote:
>
>> Коллеги,
>> 
>> Так может быть поделитесь пакетами?

Я положил стартовый файл для trqauthd:
http://linux4u.jinr.ru/pub/SL.local/tmp/torque4/trqauthd
Его надо скопировать в /etc/rc.d/init.d/trqauthd,
на машины:
- где работает pbs_server;
- на CE;
- на UI.
Разрешить его выполнение при старте/останове системы:
chkconfig trqauthd on
Если trqauthd был запущен "руками", убить его "kill -TERM ...".
Попробовать запустить его:
/etc/init.d/trqauthd resdtart
и проверить:
/etc/init.d/trqauthd status

>
> У меня пока 4.2.9 на Tier1.
> Он полностью рабочий, лежит на:
> http://linux4u.jinr.ru/pub/SL.local/6x.t1/x86_64/RPMS.t1/
> Боюсь, что просто так он не встанет вместо 4.10 из epel:
> 1) в epel'евских весрсиях странный состав rpm'ов, они раскидали
> torque по разным rpm совсем не так, как в оригинале;
> 2) если стоит версия 4.10, то на 4.9 надо делать yum downgrade.
>
>>
>>             -- А.К.
>> 
>> On 26/04/15 16:09, Andrey Kiryanov wrote:
>>> Добрый день,
>>> 
>>> 4-й Torque не совместим с предыдущими версиями. Об этом явно написано у
>>> них на сайте. Если решили переходить на 4-ю версию, то её нужно ставить
>>> везде.
>>> И я могу подтвердить слова Валерия: пакеты из EPEL кривые, я тоже
>>> использую самостоятельно пропатченную, пересобранную и перезапакованную
>>> версию.
>>> 
>>> Y.Lyublev wrote:
>>>> Добрый день.
>>>> У меня ситуация почти как у Владимира.
>>>> Обновление было только на одном ноде.
>>>> На нем, учитывая все рекомендации, поднял pbs_mom,
>>>> но на СЕ узел остается в
>>>> rrc087.itep.ru down
>>>> Похоже, что разные версии torque на СЕ и WN не понимают
>>>> друг друга. Верно?
>>>> Володя, вы не решили свою проблему?
>>>> Удачи. Евгений.
>>>>
>>>>     ----- Original Message -----
>>>>     *From:* Vladimir Tikhomirov <mailto:tikhomir at sci.lebedev.ru>
>>>>     *To:* Valery Mitsyn <mailto:vvm at mammoth.jinr.ru>
>>>>     *Cc:* ru-ngi <mailto:ru-ngi at theory.sinp.msu.ru>
>>>>     *Sent:* Saturday, April 25, 2015 11:39 PM
>>>>     *Subject:* Re: [RU-NGI] torque-server-4.2.10
>>>>
>>>>         Добрый день.
>>>>       У меня сегодня возникла та же  проблема. Но еще сложнее: поскольку
>>>>     на сервере
>>>>     я давно запретил автоапдейты (а ручные, естественно, по лености не
>>>>     делаю), то на
>>>>     нем стоит очень старая torque - 2.5.7-9 и там никакого trqauthd
>>>>     вообще нет. А вот
>>>>     на WNs и UI автоапдейты не запретил и они сегодня ночью прошли. В
>>>>     результате сервер
>>>>     работает, но все задания стоят в состоянии Q. qstat и pbsnodes на СЕ
>>>>     работают, а на UI
>>>>     и WN дают ту же диагностику, что приводил Александр. Что посоветуете
>>>>     - обновлять сервер
>>>>     и далее - по списку?
>>>>         Всего наилучшего,
>>>>     Владимир.
>>>>
>>>>     25 апреля 2015 г., 21:31 пользователь Valery Mitsyn
>>>>     <vvm at mammoth.jinr.ru <mailto:vvm at mammoth.jinr.ru>> написал:
>>>>
>>>>         On Sat, 25 Apr 2015, A.V. Berezhnoy wrote:
>>>> 
>>>>
>>>>             25.04.2015 18:12, Valery Mitsyn пишет:
>>>>
>>>>                 On Sat, 25 Apr 2015, A.V. Berezhnoy wrote:
>>>>
>>>>                     Добрый день.
>>>>
>>>>                     Там не заводится какой-то демон /usr/sbin/trqauthd
>>>>
>>>>                     Я на CE нажал  trqauthd, и он запустился.
>>>>
>>>>                     И yaim тогда тоже отработал без ошибок.
>>>>
>>>>                     Потом  мне пришлось сделать заново доступ к очередям
>>>>                     (  qmgr -c "set queue ops acl_groups += opssgm" и
>>>> т.д.)
>>>>
>>>>                     Задачи начали ставиться в очередь.
>>>>                     Но все они имеют статус "Q", так как не попадають
>>>> на WN.
>>>>
>>>>                     Там, похоже, тоже нужен  trqauthd, но на wn я его не
>>>>                     нашёл.
>>>> 
>>>>
>>>>                 Да, нужен.
>>>>                 Попробуйте на torque сервере:
>>>>                 rpm -qf /etc/init.d/trqauthd
>>>>                 и поставте этот rpm на WN'ы.
>>>>
>>>>             trqauthd  находится в
>>>>             torque-server-4.2.10-1.el6.x86_64
>>>> 
>>>>
>>>>         Это явно ошибка в rpm'ам torque.
>>>>         Из epel? Последнее время я на несколько ошибок в epel нарывался.
>>>>         Я использую свой собранный torque, пока 4.2.9.
>>>> 
>>>>
>>>>             Это ничего, если его на wn поставить?
>>>> 
>>>>
>>>>         Наверное ничего страшного, только надо сделать:
>>>>         chkconfig pbs_server off
>>>>         /etc/init.d/pbs_server stop
>>>>         после установки rpm на всех WN'ах.
>>>>
>>>>         БольшАя "засада" в том, что trqauthd должен запускаться на:
>>>>         WN'ах
>>>>         сервере torque
>>>>         CE
>>>>         UI, ели он есть.
>>>>         И должен запускаться во время старта системы,
>>>>         но старового файла для такого сервиса нет в rpm'ах
>>>>         torque* в epel.
>>>>         Похоже это очередной не проверенный и не работающий
>>>>         пакет в epel.
>>>> 
>>>> 
>>>>
>>>>             Спасибо,
>>>>             А. Бережной
>>>>
>>>>                     Если на wn нажать qstat, то получаю
>>>>
>>>>                     socket_connect_unix failed: 15137
>>>>                     socket_connect_unix failed: 15137
>>>>                     socket_connect_unix failed: 15137
>>>>                     qstat: cannot connect to server (null) (errno=15137)
>>>>                     could not connect to trqauthd
>>>> 
>>>>
>>>>                     Александр
>>>>
>>>>                     25.04.2015 15:40, Liudmila Stepanova пишет:
>>>>
>>>>                         Добрый день,
>>>>                         после upgrade на creamce pbs_server не стартует
>>>>                         rpm -aq |grep torque
>>>>                         torque-server-4.2.10-1.el6.x86_64
>>>>                         torque-client-4.2.10-1.el6.x86_64
>>>>                         emi-torque-utils-2.0.2-2.el6.noarch
>>>>                         glite-yaim-torque-utils-5.1.3-1.el6.noarch
>>>>                         glite-yaim-torque-server-5.1.0-1.sl6.noarch
>>>>                         torque-4.2.10-1.el6.x86_64
>>>>                         emi-torque-server-1.0.0-2.sl6.x86_64
>>>>                         torque-libs-4.2.10-1.el6.x86_64
>>>>                         Не могу определить причину.
>>>>                         С уважением,
>>>>                         Людмила.
>>>> 
>>> 
>>> 
>>> 
>>> _______________________________________________
>>> RU-NGI mailing list
>>> RU-NGI at theory.sinp.msu.ru
>>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>>> 
>> 
>> 
>
>

-- 
Best regards,
  Valery Mitsyn


More information about the RU-NGI mailing list