2017

2017-zelena-tabulka-2

MetaCentrum mělo na konci roku 2017 1908 uživatelů s aktivním účtem. Pro srovnání, koncem roku 2016 mělo v MetaCentru účet 1611 uživatelů. Ke cloudovému prostředí MetaCloud mělo přístup 245 uživatelů z českých akademických a výzkumných institucí (170 v roce 2016). Prostředí Hadoop vyzkoušelo 157 (73) uživatelů.

Meziročně vzrostl počet CPU jader zapojených v národním výpočetním prostředí MetaVO na 14686 CPU jader (vloni 13540), z toho 6208 CPU jader patřilo CESNETu a 5000 CPU jader Centru CERIT-SC. Zbývajících 3686 CPU jader vlastnily univerzity a Akademie věd ČR.

V roce 2017 uživatelé MetaVO propočítali celkem 10572 CPU let (9811 v roce 2016).

Do mezinárodní výpočetní infrastruktury EGI byly v dávkovém režimu (HPC) zapojené zdroje CESNETU (496 CPU jader) a FZÚ AV ČR (3276 CPU jader) a dalších 208 CPU jader bylo dedikováno do FedCloudu (zdroje CESNETu).

Vlastníci zdrojů

V MetaCentrum NGI jsou zapojeny tři skupiny zdrojů.

 

MetaVO včetně PBS, MetaCloudu, Hadoop a ELIXIR (bez strojů zapojených do EGI)

z toho dedikovaných Elixir VO

Další zdroje zapojeny do EGI

 

Statistiky využití zdrojů MetaVO

Využití strojů v dávkovém systému PBS

Následující graf ukazuje průměrné vytížení výpočetních clusterů a strojů v MetaVO v roce 2017. Základem pro výpočet průměrného vytížení (100%) je celkový počet dostupných CPU-core-seconds mínus počet CPU-core-seconds strojů, které nebyly v provozu. Rezervované stroje jsou započítané tak, jako by byly plně využity, bez ohledu na jejich skutečné využití. Údaj v závorce udává počet CPU v clusteru na konci roku. Nula značí, že cluster byl v průběhu roku vyřazen.

Průměrné vytížení volně dostupných strojů v MetaCentru se pohybovalo mezi 65 a 95 %. Vytížení okolo 70% je optimální, vyšší vytížení již znamená faktickou saturaci a způsobuje delší doby čekání úloh ve frontě. Nižší hodnoty vytížení vykazují stroje, které byly do MetaCentra zapojeny až v průběhu sledovaného období nebo jsou unikátní, vyhrazené pro specifický typ výpočtů nebo vyhrazené pro některou skupinu.

Počet CPU jader, počet úloh a propočítaný čas v jednotlivých letech.

Denní počet úloh v dávkových systémech arien (MetaCentrum) a wagap (CERIT-SC).

CPU čas (walltime) propočítaný v dávkových systémech arien a wagap za 24 hodin.

  

Uživatelé

Propočítaný čas organizacemi na všech strojích zapojených v MetaCentru v dávkovém režimu (plánovací servery arien + wagap) a počet publikací s poděkováním MetaCentru nebo CERIT-SC (zdroj WoS) za rok 2017.

 

 Žebříček výzkumných skupin s největším propočítaným CPU časem.

Využití SW

Následující graf ukazuje využití nejpoužívanějších SW a procesů v MetaCentru podle propočítaného času. Celkově jsou v MetaCentru instalovány stovky SW balíků formou modulů.

Využití strojů v cloudu

Denní využití MetaCloudu podle CPU času.

Denní počty nově spuštěných virtuálních serverů v MetaCloudu.

 

Dílčí statistiky clusterů dukan a cloud (vlastník CESNET) zapojených v MetaCloudu

Počet dostupných  CPU a jejich využití na clusteru dukan a warg v průběhu roku 2017. Využití překračující 100% umožnilo zapnutí parametru overcommit v průběhu roku.

 

1a

 

1b

 Počet nově vytvořených virtuálních strojů v průběhu roku ukazuje na zhruba rovnoměrné využívání. Větší počet vznikajících virtuálních strojů od poloviny roku byl umožněn rozšířením clusteru dukan a zapnutím parametru overcommit.

3 

Tento graf ukazuje, že naprostá většina virtuálních strojů v MetaCloudu (clustery dukan i warg) žije pouze krátkodobě (méně než 1 hodinu). Druhý obrázek ukazuje krátkodobé VM po odečtení 21 tis. servisních monitorovacích VM, které patří EGI.

4

I když je krátkodobých VM poměrně hodně, CPU čas těch nekratších VM nezabere ani procento celkového CPU času. Dlouhodobé VM běžící déle než měsíc využily celkem 91% CPU času.

 

Využití cloudových zdrojů skupinami a virtuálními organizacemi. Skupina metacloud a virtuální organizace fedcloud.egi.eu jsou catch-all seskupení uživatelů, kteří nepatří do rozsáhlejších uživatelských skupin.

5

 

Dílčí statistiky clusterů CERIT-SC zapojených v MetaCloudu

Denní počty běžících virtuálních strojů (VM) a počet alokovaných CPU pro tyto stroje. CERIT-SC nemá zapnutý overbooking.

Denní počty CPU jader běžících v OpenNebule alokovaných pro grid a cloud. Dalších cca 1600 jader není virtualizováno a běží v gridu mimo OpenNebulu.

Graf počtu alokovaných CPU jader alokovaných pro běžící VM jednotlivých uživatelů.

 Dalibor-cloud-cerit-uzivatele

Počet CPU jader se v CERIT-SC zvýšil v únoru pořízením stroje s architekturou Xeon Phi.

 

Využití prostředí Hadoop

V open-source frameworku Hadoop pro distribuovaná datová úložiště a distribuované zpracování velkých objemů dat za použití algoritmu MapReduce bylo v roce 2017 propočítáno 1,5 CPU let (čistý procesorový čas, nikoliv walltime) v 11 tis. úlohách.  Na diskových polích o kapacitě 1047 TB je uloženo 836 TB dat. Část diskového prostoru je vyhrazená pro Ceph. 

 

Úložné prostory

Meziročně opět vzrostlo zaplnění diskových polích v MetaCentru i v CERIT-SC. Mimo to, se podařilo integrovat diskové pole jiných vlastníků do infrastruktury MetaCentra (CEITEC, ELIXIR). Přístup na taková pole je dedikován vlastníkům, po dohodě s nimi může býrt přístupný i pro další uživatele.

Na prvním grafu je vidět míra zaplnění diskových polí, na dalším pak využití přidělených prostor na archivních úložištích typu HSM.

 Seznam publikací s poděkováním MetaCentru

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Poslední změna:Fri Apr 13 15:33:42 CEST 2018