2023

TODO zelená tabulka

MetaCentrum VO mělo na konci roku 2023 3055 uživatelů s aktivním účtem. Pro srovnání, koncem roku 2022 mělo v MetaCentru účet 2710 uživatelů.
 

Meziročně narostl počet CPU jader pořízených v národním výpočetním prostředí MetaVO (grid + cloud) na 41288CPU jader (vloni 37628), z toho 20064 CPU jader patřilo CESNETu (bez EGI, 18624 PBS, 1440 cloud), CERIT-SC měl 8120 (5152 PBS + 536 cloud, 2432 K8s). Zbývajících 13528 CPU jader (bez EGI) vlastnily univerzity, Akademie věd ČR a velké projekty.


TODO Dalších 6460 CPU jader bylo k dispozici v mezinárodním prostředí EGI. V dávkovém režimu (HTC) byly zapojené zdroje CESNETU (1040 CPU jader) a FZÚ AV ČR (5420 CPU jader) a část kapacity MetaCentrum Cloudu bylo k dispozici v EGI FedCloudu.

TODO V roce 2023 uživatelé MetaVO, MetaCentrum cloudu a Kubernetes propočítali celkem xx31858xx CPU let (27547 v roce 2022).

PBS

celkem 32968 CPU jader, 22525 CPU let, xx254xx GPU let, 10,1 mil. úloh

TODO MetaCentrumCloud

TODO MetaCentrum Cloud provozoval v roce 2022 v čistě cloudovém režimu 6112 CPU jader a 54 GPU karet. Dalších 3392 CPU jader a 49 GPU karet bylo exportováno z OpenStacku do PBS.

V čistě cloudovém režimu bylo propočítáno celkem 7416 CPU let (9948 CPU let včetně, 2532 export do PBS) v 15941 instancích, z toho ve FedCloud 1125 CPU let ve 2414 instancích.

  

Kubernetes

na konci roku 2023 bylo v provozu 2432 CPU jader (včetně 256 CPU jader vyhrazených pro Sensitive Cloud), na kterých bylo propočítáno celkem 1917 CPU let. Rancher použilo 372 uživatelů, z 25 institucí a dále z projektů podpořených v EGI.

 

TODO Mezinárodní výpočetní infrastruktura EGI 

TODO celkem 9218 CPU let,  14,2 mil. úloh/virtuálních strojů (zdroj EGI accounting portál)

 

Vlastníci zdrojů

V MetaCentrum NGI jsou zapojeny následující typy výpočetních kapacit

pocty-cpujader-roky

 

 instituce-cpu-2023-mensi

 

 

Celkem 49386 CPU jader (prosinec 2023)

 

resource-providers-2020-2023

 

 

Statistiky využití zdrojů MetaVO

Využití strojů v dávkovém systému PBS

Následující graf ukazuje průměrné vytížení výpočetních clusterů a strojů v MetaVO v roce 2022. Základem pro výpočet průměrného vytížení (100%) je celkový počet dostupných CPU-core-seconds mínus počet CPU-core-seconds strojů, které nebyly v provozu. Rezervované stroje jsou započítané tak, jako by byly plně využity, bez ohledu na jejich skutečné využití. Údaj v závorce udává počet CPU v clusteru na konci roku. Nula značí, že cluster byl v průběhu roku vyřazen.

Průměrné vytížení (CPU) volně dostupných strojů v MetaCentru se pohybovalo v roce 2022 okolo 65 %. Vytížení okolo 70% je optimální, vyšší vytížení již znamená faktickou saturaci a způsobuje delší doby čekání úloh ve frontě. Nižší hodnoty vytížení vykazují stroje, které byly do MetaCentra zapojeny až v průběhu sledovaného období nebo jsou unikátní, vyhrazené pro specifický typ výpočtů nebo vyhrazené pro některou skupinu. Clustery s GPU mají také nižší využití CPU, protože jsou využívány primárně pro výpočty na GPU.

prumer_vytizeni-stroju2023 

Průměrné vytížení clusterů se liší podle toho, zda jsou vlastněné CESNETem a jsouvyužitelné všem bez rozdílu, anebo zda patří některé uživatelské skupině, která má prioritní přístup a ostatní uživatelé jsou zde limitovaní, využití je proto nižší.

[Summary]-CPU usage in time (CPU days) [Summary]_(2023-01-01-2024-01-01)_-332149279

 

[Summary]-GPU usage in time (GPU days) [Summary]_(2023-01-01-2024-01-01)_-332149279

 

[Summary]-Jobs in time [Summary]_(2023-01-01-2024-01-01)_-332149279

 

Průměrné vytížení všech strojů zapojených v meta-pbs v průběhu celého roku 2023

Průměrné vytížení CPU se pohybovalo okolo 74 %, GPU pak více než 80 %. Do průměru jsou započítany všechny výpočetní clustery, i ty, které jsou vyhrazeny s přednostním právem vlastníkům a jejichž vytížení obvykle bývá nižší.

utilization-cpu-meta-pbs-2023 

 utilization-gpu-meta-pbs-2023

Průměrné vytížení všech strojů zapojených v cerit-pbs v průběhu celého roku 2023

Průměrné vytížení CPU se pohybovalo podobně jako v předchozím případě okolo 62 %, GPU 70 %. Do průměru jsou započítany všechny výpočetní clustery, i ty, které jsou specializované a dokáží obsloužit jen určitý typ výpočtů (např. cluster phí speciální architektury pro velmi specifické úlohy, které umí využít speciální akcelerátory Xeon phí, ale kterých není mnoho).

utilization-cpu-cerit-pbs-2023

utilization-gpu-cerit-pbs-2023

 

Průměrné vytížení strojů zapojených v elixir-pbs v průběhu celého roku 2023

Průměrné vytížení CPU je o trochu nižší, stroje mají prioritu pro skupinu ELIXIR, pohybovalo se okolo 48 %, GPU karty tyto clustery neobsahují. 

utilization-cpu-elixir-pbs-2023
 

 Využití výkonného stroje DGX H100

Stroj centra CERIT SC DGX H100 se 4 kartami NVIDIA H100 (GPU RAM 40 GB každá) byl pořízen v polovině roku (červen 2023).  Je přístupný přes speciální frontu a jen pro uživatele, kteří doložili, že jej opravdu potřebují a umí využít. Standardní úlohy, které mohou být spočítány na méně výkonných kartách, na tento stroj vůbec nezařazujeme.  I tak si získal velikou oblibu. Po prázdninách se využití GPU karet zvýšilo až ke 100 % a je prakticky stále obsazený.

capy-vyuziti

 

 [Summary]-Number of jobs and avg. Wait time wrt. job parallelism [Summary]_(2023-01-01-2024-01-01)_-332149279

[Summary]-Number of jobs and avg. Wait time wrt. job types [Summary]_(2023-01-01-2024-01-01)_-332149279

[Summary]-Number of jobs and avg. Wait time wrt. job types [Summary]_(2023-01-01-2024-01-01)_-332149279

[Summary]-Number of jobs and avg. Wait time wrt. job types [Summary]_(2023-01-01-2024-01-01)_-332149279

 

[Summary]-Stacked Queue CPU usage in time (CPU days) [Summary]_(2023-01-01-2024-01-01)_-332149279 

 

 

 

Uživatelé

Využití MetaCentra organizacemi (Meta VO, PBS) dle propočítaného času

[Summary]-Used CPU years by Institutions [Summary]_(2023-01-01-2024-01-01)_-332149279

 

 

 

MetaCentrum Cloud

V cloudu rozlišujeme stroje podle určení nebo vlastníků: meta, cerit-sc, egi, mu, recetox, csirt.

Zdroje jsou nabízené 2 způsoby: osobní využití s omezením počtu a velikosti běžících instancí a projektové využití

Část kapacity je exportovaná do cerit-pbs (dávkové využití).

 

Podíl propočítaného CPU času spotřebovaného v MetaCentrum Cloud

 

Podíl propočítaného GPU času spotřebovaného v MetaCentrum Cloud

 

 

Rozdělení HW mezi vlastníky podle počtu CPU

 

Kubernetes

V kubernets uživatelé propočítali celkem 1917 CPU let. Kubernetes cluster použilo 372 uživatelů z 25 institucí.

Graf využití podle propočítaného času následuje:

k8s-instituce

 

 

ELIXIR-CZ VO v PBS a v cloudu

Ke clusterům pořízeným z projektu ELIXIR-CZ mělo prostřednictvím plánovacího systemu elixir-pbs dedikovaný přístup 85 (vloni 72) uživatelů projektu ELIXIR-CZ z českých univerzit a Akademie věd. Uživatelé MetaCentra sem mohli posílat krátké výplňové úlohy prostřednictvím fronty global pouze tehdy, pokud byl cluster nevyužitý. V cloudovém prostředí uživatelé z ELIXRu založili celkem XX(15) projektových skupin a XX (13 ) individuálních účtů.

 

 

 

 

 

Úložné prostory

Meziročně opět vzrostlo zaplnění diskových polích v MetaCentru i v CERIT-SC. Mimo to, se podařilo integrovat diskové pole jiných vlastníků do infrastruktury MetaCentra (CEITEC, ELIXIR). Přístup na taková pole je dedikován vlastníkům, po dohodě s nimi může být přístupný i pro další uživatele.

 

storage2023 

 

Publikace s poděkováním za využití

Následující graf ukazuje počty uživatelských publikací s poděkováním e-infrastruktuře vykázaných v systému Perun (modrý sloupec) a převzatých z veřejné databáze Web of Science (WoS, oranžový sloupec). V Perunovi evidujeme všechny typy publikací, včetně publikací neimportovaných do RIVu, proto jich je více než publikací evidovaných v databázi WoS, ve které jsou zahrnuté pouze kvalitní bodované publikace. Za rok 2022 byla data k publikacím posbírána koncem ledna, předpokládáme nárůst v počtu publikací vykázaných v roce 2022, uživatelé je do systému Perun v kládají až s výroční zprávou. Také ve WoS se některé publikace z konce roku objevují se zpožděním.

 

 Následující graf byl pořízen v březnu 2022 a ukazuje počty uživatelských publikací s poděkováním za využití zdrojů a příslušné citace. Zdroj WoS.

 

Organizace u publikací s poděkováním e-INFRA CZ (WoS):

 

Obory Wos

 

Režim přístupu k publikacím z WoS:

 

Seznam publikací s poděkováním e-INFRA CZ

 

EGI

Mezinárodní výpočetní infrastruktura EGI 

celkem  CPU let,  mil. úloh/virtuálních strojů (zdroj EGI accounting portál)

 

FedCloud 

Následující graf ukazuje využití MetaCentrum Cloudu projekty z EGI

 

  

 Následující tabulka a graf ukazují počty spuštěných virtuálních strojů jednotlivými projekty (VO).

 

Rozdělení dle projektů (podpořených virtuáních organizací).

 

 

EGI HTC

Počet CPU jader zapojených do EGI HTC: duben 8098 CPU jader (nakoupeny nové stroje),  prosinec 6460 CPU jader (vyřazovaly se staré stroje)

z toho na konci roku

Přehled z HTC Compute EGI accounting portálu zobrazuje accountingová data ze všech výpočetních středisek výpočetní kapacity s vysokou propustností v infrastruktuře EGI v NGI_CZ. Účetní informace jsou shromažďovány pouze od středisek zdrojů, která jsou součástí federace EGI a jsou certifikována v GOCDB. Zobrazená metrika je Elapsed time.

 

 

 

 

 

 

 

Poslední změna:2024-01-31 16:00:57