2017

MetaCentrum mělo na konci roku 2017 1908 uživatelů s aktivním účtem. Pro srovnání, koncem roku 2016 mělo v MetaCentru účet 1611 uživatelů. Ke cloudovému prostředí MetaCloud mělo přístup 245 uživatelů z českých akademických a výzkumných institucí (170 v roce 2016). Prostředí Hadoop vyzkoušelo 157 (73) uživatelů.
Meziročně vzrostl počet CPU jader zapojených v národním výpočetním prostředí MetaVO na 14686 CPU jader (vloni 13540), z toho 6208 CPU jader patřilo CESNETu a 5000 CPU jader Centru CERIT-SC. Zbývajících 3686 CPU jader vlastnily univerzity a Akademie věd ČR.
V roce 2017 uživatelé MetaVO propočítali celkem 10572 CPU let (9811 v roce 2016).
- Z toho v dávkovém systému (PBS Torque a PBS Pro) bylo propočítáno více než 8,4 tis. CPU let (oproti 8,2 tis. CPU let v roce 2016), z toho 3,1 tis. CPU let bylo propočítáno na experimentálních strojích CERIT-SC a 5,4 tis. CPU let na strojích CESNETu a ostatních poskytovatelů. V dávkovém režimu bylo v roce 2017 spuštěno 4,8 mil. úloh (3,6 mil. ve 2016).
- V prostředí MetaCloudu bylo propočítáno 2095 CPU let (1292 CPU let v roce 2016) na 10688 virtuálních strojích. Z toho 912 (628) CPU let bylo zkonzumováno v cloudu CESNETu, 1183 (664) CPU let v cloudu CERIT-SC.
- V open-source frameworku Hadoop pro distribuovaná datová úložiště a distribuované zpracování velkých objemů dat za použití algoritmu MapReduce byly v roce 2017 propočítáno 2 CPU roky čistého procesorového času (nikoliv walltime) v 11 tis. úlohách.
Do mezinárodní výpočetní infrastruktury EGI byly v dávkovém režimu (HPC) zapojené zdroje CESNETU (496 CPU jader) a FZÚ AV ČR (3276 CPU jader) a dalších 208 CPU jader bylo dedikováno do FedCloudu (zdroje CESNETu).
Vlastníci zdrojů
V MetaCentrum NGI jsou zapojeny tři skupiny zdrojů.
- Národní výpočetní a úložné kapacity zapojené v MetaVO jsou k dipsozici pro zaměstnance a studenty akademických a výzkumných organizací v ČR a jejich výzkumné partnery. Sem patří zdroje využívající dávkový systém PBS Pro (Torque v první polovině roku), cloudové stroje z MetaCloudu a specializovaná výpočetní platforma Hadoop.
- Kromě toho MetaCentrum NGI spravuje stroje zapojené do mezinárodní výpočetní infrastruktury EGI.
- Stroje dedikované ELIXIRu.
MetaVO včetně PBS, MetaCloudu, Hadoop a ELIXIR (bez strojů zapojených do EGI)
- CERIT-SC (5500 CPU): ungu, urga, zapat, zorg, zefron, zigur, zegox, zebra, zewura -- zapojené dle potřeby v PBS Pro/Torque nebo v MetaCloudu.
- CESNET (6208 CPU)
- PBS Pro/Torque (4852 CPU): doom, gram, hildor, hagrid, mandos, manegrot, minos, tarkil, ramdal, ida, nově meduseld a aman
- MetaCloud (940 CPU): dukan, nově duilin, gorbag
- Hadoop (416 CPU): hador
- FZÚ AV ČR (800 CPU): kalpa, luna
- MU CEITEC-NCBR (1104 CPU): perian, lex, zubat, krux
- ZČU (356 CPU): alfrid, ajax, konos
- MU Loschmidt Laboratories (264 CPU) losgar, loslab
- PřF JČU (64 CPU): haldir
- FEL ČVUT (22 CPU): mudrc
- ÚEB AV ČR (48 CPU): bofur
- UP Olomouc (128 CPU): upol128
- TUL (400 CPU): charon
z toho dedikovaných Elixir VO
- CESNET (96 CPU)
- CERIT-SC (176 CPU)
Další zdroje zapojeny do EGI
- CESNET (496 + 208 CPU)
- FZU (3276 CPU)
Statistiky využití zdrojů MetaVO
Využití strojů v dávkovém systému PBS
Následující graf ukazuje průměrné vytížení výpočetních clusterů a strojů v MetaVO v roce 2017. Základem pro výpočet průměrného vytížení (100%) je celkový počet dostupných CPU-core-seconds mínus počet CPU-core-seconds strojů, které nebyly v provozu. Rezervované stroje jsou započítané tak, jako by byly plně využity, bez ohledu na jejich skutečné využití. Údaj v závorce udává počet CPU v clusteru na konci roku. Nula značí, že cluster byl v průběhu roku vyřazen.
Průměrné vytížení volně dostupných strojů v MetaCentru se pohybovalo mezi 65 a 95 %. Vytížení okolo 70% je optimální, vyšší vytížení již znamená faktickou saturaci a způsobuje delší doby čekání úloh ve frontě. Nižší hodnoty vytížení vykazují stroje, které byly do MetaCentra zapojeny až v průběhu sledovaného období nebo jsou unikátní, vyhrazené pro specifický typ výpočtů nebo vyhrazené pro některou skupinu.
Počet CPU jader, počet úloh a propočítaný čas v jednotlivých letech.
Denní počet úloh v dávkových systémech arien (MetaCentrum) a wagap (CERIT-SC).
CPU čas (walltime) propočítaný v dávkových systémech arien a wagap za 24 hodin.
Uživatelé
Propočítaný čas organizacemi na všech strojích zapojených v MetaCentru v dávkovém režimu (plánovací servery arien + wagap) a počet publikací s poděkováním MetaCentru nebo CERIT-SC (zdroj WoS) za rok 2017.
Žebříček výzkumných skupin s největším propočítaným CPU časem.
Využití SW
Následující graf ukazuje využití nejpoužívanějších SW a procesů v MetaCentru podle propočítaného času. Celkově jsou v MetaCentru instalovány stovky SW balíků formou modulů.
Využití strojů v cloudu
Denní využití MetaCloudu podle CPU času.
Denní počty nově spuštěných virtuálních serverů v MetaCloudu.
Dílčí statistiky clusterů dukan a cloud (vlastník CESNET) zapojených v MetaCloudu
Počet dostupných CPU a jejich využití na clusteru dukan a warg v průběhu roku 2017. Využití překračující 100% umožnilo zapnutí parametru overcommit v průběhu roku.


Počet nově vytvořených virtuálních strojů v průběhu roku ukazuje na zhruba rovnoměrné využívání. Větší počet vznikajících virtuálních strojů od poloviny roku byl umožněn rozšířením clusteru dukan a zapnutím parametru overcommit.
Tento graf ukazuje, že naprostá většina virtuálních strojů v MetaCloudu (clustery dukan i warg) žije pouze krátkodobě (méně než 1 hodinu). Druhý obrázek ukazuje krátkodobé VM po odečtení 21 tis. servisních monitorovacích VM, které patří EGI.

I když je krátkodobých VM poměrně hodně, CPU čas těch nekratších VM nezabere ani procento celkového CPU času. Dlouhodobé VM běžící déle než měsíc využily celkem 91% CPU času.
Využití cloudových zdrojů skupinami a virtuálními organizacemi. Skupina metacloud a virtuální organizace fedcloud.egi.eu jsou catch-all seskupení uživatelů, kteří nepatří do rozsáhlejších uživatelských skupin.

Dílčí statistiky clusterů CERIT-SC zapojených v MetaCloudu
Denní počty běžících virtuálních strojů (VM) a počet alokovaných CPU pro tyto stroje. CERIT-SC nemá zapnutý overbooking.
Denní počty CPU jader běžících v OpenNebule alokovaných pro grid a cloud. Dalších cca 1600 jader není virtualizováno a běží v gridu mimo OpenNebulu.
Graf počtu alokovaných CPU jader alokovaných pro běžící VM jednotlivých uživatelů.

Počet CPU jader se v CERIT-SC zvýšil v únoru pořízením stroje s architekturou Xeon Phi.
Využití prostředí Hadoop
V open-source frameworku Hadoop pro distribuovaná datová úložiště a distribuované zpracování velkých objemů dat za použití algoritmu MapReduce bylo v roce 2017 propočítáno 1,5 CPU let (čistý procesorový čas, nikoliv walltime) v 11 tis. úlohách. Na diskových polích o kapacitě 1047 TB je uloženo 836 TB dat. Část diskového prostoru je vyhrazená pro Ceph.
Úložné prostory
Meziročně opět vzrostlo zaplnění diskových polích v MetaCentru i v CERIT-SC. Mimo to, se podařilo integrovat diskové pole jiných vlastníků do infrastruktury MetaCentra (CEITEC, ELIXIR). Přístup na taková pole je dedikován vlastníkům, po dohodě s nimi může býrt přístupný i pro další uživatele.
Na prvním grafu je vidět míra zaplnění diskových polí, na dalším pak využití přidělených prostor na archivních úložištích typu HSM.
Seznam publikací s poděkováním MetaCentru
