Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://theory.sinp.msu.ru/pipermail/ru-ngi/2015q2/001547.html
Дата изменения: Mon Apr 27 11:55:39 2015 Дата индексирования: Sun Apr 10 18:17:36 2016 Кодировка: |
On Sun, 26 Apr 2015, Valery Mitsyn wrote: > On Sun, 26 Apr 2015, Alexander Kryukov wrote: > >> Коллеги, >> >> Так может быть поделитесь пакетами? Я положил стартовый файл для trqauthd: http://linux4u.jinr.ru/pub/SL.local/tmp/torque4/trqauthd Его надо скопировать в /etc/rc.d/init.d/trqauthd, на машины: - где работает pbs_server; - на CE; - на UI. Разрешить его выполнение при старте/останове системы: chkconfig trqauthd on Если trqauthd был запущен "руками", убить его "kill -TERM ...". Попробовать запустить его: /etc/init.d/trqauthd resdtart и проверить: /etc/init.d/trqauthd status > > У меня пока 4.2.9 на Tier1. > Он полностью рабочий, лежит на: > http://linux4u.jinr.ru/pub/SL.local/6x.t1/x86_64/RPMS.t1/ > Боюсь, что просто так он не встанет вместо 4.10 из epel: > 1) в epel'евских весрсиях странный состав rpm'ов, они раскидали > torque по разным rpm совсем не так, как в оригинале; > 2) если стоит версия 4.10, то на 4.9 надо делать yum downgrade. > >> >> -- А.К. >> >> On 26/04/15 16:09, Andrey Kiryanov wrote: >>> Добрый день, >>> >>> 4-й Torque не совместим с предыдущими версиями. Об этом явно написано у >>> них на сайте. Если решили переходить на 4-ю версию, то её нужно ставить >>> везде. >>> И я могу подтвердить слова Валерия: пакеты из EPEL кривые, я тоже >>> использую самостоятельно пропатченную, пересобранную и перезапакованную >>> версию. >>> >>> Y.Lyublev wrote: >>>> Добрый день. >>>> У меня ситуация почти как у Владимира. >>>> Обновление было только на одном ноде. >>>> На нем, учитывая все рекомендации, поднял pbs_mom, >>>> но на СЕ узел остается в >>>> rrc087.itep.ru down >>>> Похоже, что разные версии torque на СЕ и WN не понимают >>>> друг друга. Верно? >>>> Володя, вы не решили свою проблему? >>>> Удачи. Евгений. >>>> >>>> ----- Original Message ----- >>>> *From:* Vladimir Tikhomirov <mailto:tikhomir at sci.lebedev.ru> >>>> *To:* Valery Mitsyn <mailto:vvm at mammoth.jinr.ru> >>>> *Cc:* ru-ngi <mailto:ru-ngi at theory.sinp.msu.ru> >>>> *Sent:* Saturday, April 25, 2015 11:39 PM >>>> *Subject:* Re: [RU-NGI] torque-server-4.2.10 >>>> >>>> Добрый день. >>>> У меня сегодня возникла та же проблема. Но еще сложнее: поскольку >>>> на сервере >>>> я давно запретил автоапдейты (а ручные, естественно, по лености не >>>> делаю), то на >>>> нем стоит очень старая torque - 2.5.7-9 и там никакого trqauthd >>>> вообще нет. А вот >>>> на WNs и UI автоапдейты не запретил и они сегодня ночью прошли. В >>>> результате сервер >>>> работает, но все задания стоят в состоянии Q. qstat и pbsnodes на СЕ >>>> работают, а на UI >>>> и WN дают ту же диагностику, что приводил Александр. Что посоветуете >>>> - обновлять сервер >>>> и далее - по списку? >>>> Всего наилучшего, >>>> Владимир. >>>> >>>> 25 апреля 2015 г., 21:31 пользователь Valery Mitsyn >>>> <vvm at mammoth.jinr.ru <mailto:vvm at mammoth.jinr.ru>> написал: >>>> >>>> On Sat, 25 Apr 2015, A.V. Berezhnoy wrote: >>>> >>>> >>>> 25.04.2015 18:12, Valery Mitsyn пишет: >>>> >>>> On Sat, 25 Apr 2015, A.V. Berezhnoy wrote: >>>> >>>> Добрый день. >>>> >>>> Там не заводится какой-то демон /usr/sbin/trqauthd >>>> >>>> Я на CE нажал trqauthd, и он запустился. >>>> >>>> И yaim тогда тоже отработал без ошибок. >>>> >>>> Потом мне пришлось сделать заново доступ к очередям >>>> ( qmgr -c "set queue ops acl_groups += opssgm" и >>>> т.д.) >>>> >>>> Задачи начали ставиться в очередь. >>>> Но все они имеют статус "Q", так как не попадають >>>> на WN. >>>> >>>> Там, похоже, тоже нужен trqauthd, но на wn я его не >>>> нашёл. >>>> >>>> >>>> Да, нужен. >>>> Попробуйте на torque сервере: >>>> rpm -qf /etc/init.d/trqauthd >>>> и поставте этот rpm на WN'ы. >>>> >>>> trqauthd находится в >>>> torque-server-4.2.10-1.el6.x86_64 >>>> >>>> >>>> Это явно ошибка в rpm'ам torque. >>>> Из epel? Последнее время я на несколько ошибок в epel нарывался. >>>> Я использую свой собранный torque, пока 4.2.9. >>>> >>>> >>>> Это ничего, если его на wn поставить? >>>> >>>> >>>> Наверное ничего страшного, только надо сделать: >>>> chkconfig pbs_server off >>>> /etc/init.d/pbs_server stop >>>> после установки rpm на всех WN'ах. >>>> >>>> БольшАя "засада" в том, что trqauthd должен запускаться на: >>>> WN'ах >>>> сервере torque >>>> CE >>>> UI, ели он есть. >>>> И должен запускаться во время старта системы, >>>> но старового файла для такого сервиса нет в rpm'ах >>>> torque* в epel. >>>> Похоже это очередной не проверенный и не работающий >>>> пакет в epel. >>>> >>>> >>>> >>>> Спасибо, >>>> А. Бережной >>>> >>>> Если на wn нажать qstat, то получаю >>>> >>>> socket_connect_unix failed: 15137 >>>> socket_connect_unix failed: 15137 >>>> socket_connect_unix failed: 15137 >>>> qstat: cannot connect to server (null) (errno=15137) >>>> could not connect to trqauthd >>>> >>>> >>>> Александр >>>> >>>> 25.04.2015 15:40, Liudmila Stepanova пишет: >>>> >>>> Добрый день, >>>> после upgrade на creamce pbs_server не стартует >>>> rpm -aq |grep torque >>>> torque-server-4.2.10-1.el6.x86_64 >>>> torque-client-4.2.10-1.el6.x86_64 >>>> emi-torque-utils-2.0.2-2.el6.noarch >>>> glite-yaim-torque-utils-5.1.3-1.el6.noarch >>>> glite-yaim-torque-server-5.1.0-1.sl6.noarch >>>> torque-4.2.10-1.el6.x86_64 >>>> emi-torque-server-1.0.0-2.sl6.x86_64 >>>> torque-libs-4.2.10-1.el6.x86_64 >>>> Не могу определить причину. >>>> С уважением, >>>> Людмила. >>>> >>> >>> >>> >>> _______________________________________________ >>> RU-NGI mailing list >>> RU-NGI at theory.sinp.msu.ru >>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi >>> >> >> > > -- Best regards, Valery Mitsyn