Provozní změny infrastruktur MetaCentra a CERIT-SC

Provozní změny infrastruktur MetaCentra a CERIT-SC

1) Zrušení nadbytečných vlastností
2) Zavedení cgroups
3) Defaultní fronta a zrušení obecně přístupných časových front
4) Reinstalace strojů na OS Debian 8


1) Zrušení nadbytečných vlastností

Z důvodu zpřehlednění a zjednodušení zadávání a plánování úloh došlo k redukci počtu vlastností. Zrušili jsme ty, které se z historických důvodů vyskytují na všech strojích nebo se již téměř nepoužívají:
linux, x86_64, nfs4, em64t, x86, *core, nodecpus*, nehalem/opteron/, noautoresv, xen, ...

Aktuální seznam dostupných vlastností: http://metavo.metacentrum.cz/pbsmon2/props


2) Zavedení cgroups

Cgroups umožňuje omezit spotřebu prostředků (paměti, procesoru) pro danou úlohu.
Pokud víte, že Vaše úloha překračuje RAM nebo počet přidělených CPU jader a nedokážete tyto omezit přímo v aplikaci, použijte přepínač -W cgroup=true při zadání úlohy, např.:

 qsub -W cgroup=true -l nodes=1:ppn=4 -l mem=1gb ...

Cgroups nahrazuje dříve doporučený způsob nodecpus*#excl -- vlastnost nodecpus* byla zrušena.

Ve výchozím nastavení plánovače nejsou cgroups použity (může zpomalit swapující úlohu a nelze poznat, kolik prostředků úloha skutečně potřebuje pro efektivní běh).  
Podpora cgroups není nastavena na všech strojích, aktuální seznam strojů k testování lze získat v pbsmonu jako přehled strojů s nastavenou vlastností cgroup:
http://metavo.metacentrum.cz/pbsmon2/props#cgroup
Více informací: https://wiki.metacentrum.cz/wiki/Cgroups


3) Zrušení obecně přístupných časových front

Před více než rokem jsme sjednotili zadávání úloh -- v obou prostředích plánovacích serverů @wagap a @arien -- zavedením parametru -l walltime=<OCEKAVANA_MAX_DOBA_BEHU>.

Na @wagap byly zrušeny dočasně ponechané časové fronty q_2h, q_4h, q_1d, q_2d, q_4d, q_1w, q_2w, q_2w_plus. Své úlohy proto zadávejte výhradně s parametrem walltime, např.

  -l walltime=2h, -l walltime=3d30m,...

Více informací na wiki: https://wiki.metacentrum.cz/wiki/Spouštění_úloh_v_plánovači

4) Reinstalace strojů na OS Debian 8

Využíváme všech plánovaných i neplánovaných odstávek clusterů a postupně povyšujeme operační systém na frontendech i uzlech na OS Debian 8.

Aktuální seznam uzlů s vlastností debian8 najdete v přehledu vlastností v aplikaci PBSmon: http://metavo.metacentrum.cz/pbsmon2/props#debian8
nebo v osobním přehledu (sestavovači qsub) http://metavo.metacentrum.cz/cs/state/personal
Případné problémy s během aplikací (chybějícími knihovnami apod.) na těchto strojích nám, prosíme, neprodleně hlaste.
Pokud narazíte na problém, do vyřešení se můžete vyhnout spouštění úloh na strojích s vlastností debian8 takto:

 -l nodes=1:ppn=4:^debian8 – negace vlastnosti, úloha nebude naplánovaná na uzly s vlastností debian8, nebo
 -l nodes=1:ppn=4:debian7 - přidělí stroje se starší verzí OS Debian7
 
 Některé speciální stroje dostupné ve speciálních frontách mohou mít odlišný OS, např. urga, ungu (dostupné ve frontě uv@wagap-pro) a phi (phi@wagap-pro) běží na OS CentOS 7.

 


Ivana Křenková, Thu Jun 30 15:35:00 CEST 2016