La plateforme de calcul informatique de pointe (CIP) était mise au service de la recherche au Canada par la fédération Calcul Canada, un partenariat entre Calcul Canada, ses organisations régionales (WestGrid, Calcul Ontario, Calcul Québec et ACENET) et des établissements de partout au pays. Offrant l’infrastructure et l’expertise pour effectuer des recherches transformatrices de niveau international, cette plateforme de CIP desservait au 1er janvier 2022 près de 19 000 utilisatrices et utilisateurs, dont plus de 5 100 chercheuses et chercheurs d’universités canadiennes.
Calcul Canada en est à sa dernière année d’opération. En date du 1er avril 2022, l’Alliance de recherche numérique du Canada (l’Alliance) remplacera Calcul Canada à la coordination et la gestion du financement de la plateforme nationale de CIP. Calcul Canada, ses établissements membres, ses partenaires régionaux et l’Alliance se sont engagés à minimiser la perturbation du service pendant la période de transition.
La façon d’accéder aux ressources restera la même. Malgré le fait que Calcul Canada n’existera plus, les membres de la fédération Calcul Canada resteront en place; vous pourrez donc vous attendre à la même qualité de service que vous avez toujours reçu de leur part. Certaines ressources clés, par exemple le wiki de documentation technique, porteront encore le nom de Calcul Canada jusqu’à ce qu’un nouveau nom leur soit donné; ces ressources restent cependant valides.
Dans le cadre des concours pour l’allocation des ressources pour 2022, la plateforme nationale de CIP disposait d’environ 293 312 cœurs CPU, 62 000 CPU virtuels, 3 062 GPU et 181 Po d’espace de stockage sur les grappes et Arbutus (Université Victoria), Cedar (Université Simon-Fraser), Graham (Université de Waterloo), Niagara (Université de Toronto), et Béluga et Narval (Calcul Québec).
L’augmentation croissante des besoins fait que la demande reste toujours plus forte que l’offre. Les concours pour 2022 ont reçu le plus grand nombre de candidatures à ce jour avec 716 projets, une hausse de 10 % par rapport à 2021. Cependant, les concours de cette année n’ont satisfait que 54 % des demandes de ressources de calcul, 94 % des demandes d’espace de stockage et 24 % des demandes de GPU. Pour leur part, les demandes de vCPU (CPU virtuels) sur les nuages Arbutus, Béluga, Cedar et Graham ont été satisfaites à 79 %.
Bien que près de 80 % (en moyenne) des ressources sont allouées par voie de concours, nous réservons environ 20 % au service d’accès rapide qui met de petites capacités de calcul, de stockage et de ressources infonuagiques à la disposition de ceux et celles qui détiennent un compte.
Pour la définition de plusieurs termes utilisés ici, consultez le glossaire technique. Toute question relative au présent rapport peut être adressée à [email protected].
Tableau 1 : Candidatures aux concours d’allocation de ressources
Année | Demandes reçues | Augmentation par rapport à l’année précédente |
---|---|---|
2022 | 716 | 10 % |
2021 | 651 | 10 % |
2020 | 590 | 16 % |
2019 | 507 | 8 % |
2018 | 469 | 15 % |
2017 | 409 | 12 % |
2016 | 366 | 5 % |
2015 | 350 | 20 % |
2014 | 291 | 38 % |
2013 | 211 | 33 % |
*En date du 9 février 2022
Allocations de CPU
Les concours de 2022 ont satisfait à 54 % la demande en ressources de calcul (cœurs-année), soit autant qu’en 2021. Béluga, Cedar, Graham, Narval et Niagara fournissent 100 % de la capacité disponible, soit environ 293 312 cœurs, dont près de 80 % sont alloués par voie de concours.
Tableau 2 : Allocations de CPU pour 2022
Cœurs-année disponibles (100 % de la capacité) | Cœurs-année demandés | Cœurs-année alloués | Pourcentage de la capacité totale allouée | |
---|---|---|---|---|
Béluga | 28 960 | 36 844 | 20 006 | 69 % |
Cedar | 91 968 | 137 207 | 74 467 | 81 % |
Graham | 34 784 | 49 387 | 25 556 | 73 % |
Narval | 61 760 | 76 842 | 44 133 | 71 % |
Niagara | 75 840 | 136 500 | 70 113 | 92 % |
Total | 293 312 | 436 780 | 234 275 | 80 % |
Tableau 3 : Évolution de la demande de CPU
Cœurs-année disponibles | Cœurs-année demandés | Cœurs-année alloués | Écart | Demande satisfaite à | |
---|---|---|---|---|---|
2022 | 293 312 | 436 780 | 234 275 | 202 505 | 54 % |
2021 | 232 704 | 468 498 | 188 925 | 279 573 | 40 % |
2020 | 232 704 | 455 892 | 181 502 | 274 390 | 40 % |
2019 | 201 320 | 390 352 | 157 262 | 233 089 | 40 % |
2018 | 211 020 | 284 347 | 158 612 | 129 325 | 56 % |
2017 | 182 760 | 255 638 | 148 100 | 107 538 | 58 % |
2016 | 155 952 | 237 862 | 128 463 | 109 399 | 54 % |
2015 | 161 888 | 191 690 | 123 699 | 67 991 | 65 % |
2014 | 190 466 | 172 989 | 133 508 | 39 481 | 77 % |
2013 | 187 227 | 142 106 | 126 677 | 15 429 | 89 % |
Mise à l’échelle des demandes de calcul
Comme mentionné ci-dessus, les ressources en CIP ne suffisaient pas à satisfaire les demandes reçues pour les concours de 2022.
Les demandes ont donc été mises à l’échelle pour les adapter aux ressources insuffisantes. La procédure, cautionnée par les présidentes et présidents des comités d’examen, a été mise en place afin que seules les candidatures ayant une note égale ou supérieure à 3,0 (sur 5) reçoivent une allocation de ressources. Les chercheuses et chercheurs qui n’ont pas reçu d’allocation peuvent toutefois se prévaloir de la possibilité d’une utilisation opportuniste par le biais du service d’accès rapide. La note moyenne attribuée à l’ensemble des demandes pour 2022 se situe à 3,7.
Les demandes en termes de cœurs-année sont mises à l’échelle d’après la note générale obtenue par la demande et la capacité demandée. Les détails de la fonction de mise à l’échelle et quelques exemples sont présentés ici. Pour plus d’information, écrivez à [email protected].
Quantité minimale de ressources allouées par concours et accès opportuniste aux ressources de calcul
Tous les chercheurs et chercheuses et leurs utilisateurs parrainés qui disposent d’un compte actif peuvent se prévaloir d’un accès opportuniste aux CPU et aux GPU par le service d’accès rapide. Puisque l’utilisation est purement opportuniste, il est impossible de garantir combien de ressources peuvent être consommées par les projets qui n’ont pas fait l’objet d’une demande aux concours.
Les demandes minimales admissibles aux concours d’allocation de ressources sont présentement 50 cœurs-années et 10 GPU-années. Ces valeurs servent en partie à contrôler la quantité de demandes qui doivent être soumises à l’examen. Comme le nombre de demandes augmente chaque année, la charge de travail des comités d’examen augmente aussi proportionnellement. Le fait de disposer d’une allocation égale au minimum admissible garantit une plus haute priorité aux tâches soumises.
Même en se prévalant d’une utilisation opportuniste, nos données montrent que plusieurs groupes qui n’ont pas reçu d’allocation par suite des concours peuvent atteindre et même dépasser les minimums mentionnés ci-dessus. Pour maximiser l’utilisation en calcul, les stratégies suivantes sont employées :
-
conserver des tâches dans la queue de façon régulière;
-
tolérer un temps d’attente plus long avant le lancement des tâches;
-
soumettre des tâches ayant des caractéristiques optimales.
Par exemple, des tâches opportunistes de courte durée qui nécessitent quelques cœurs d’une grappe d’usage général seront habituellement exécutées plus rapidement que celles qui requièrent quelques dizaines de cœurs.
Pour savoir comment maximiser l’utilisation de ressources si vous ne disposez pas de ressources allouées par voie de concours, veuillez lire attentivement les pages Allocation et ordonnancement et Politique d’ordonnancement des tâches ou écrivez à [email protected].
Allocations de GPU
La concurrence pour les ressources GPU est toujours plus forte que celle pour les CPU; les tableaux 4 et 5 indiquent que la demande en GPU est environ trois fois plus grande qu’il y a cinq ans. La demande pour 2022 a été comblée à 24 %.
Les allocations de GPU sont déterminées d’après la note générale obtenue par la demande; la justification technique des besoins en ressources; la preuve d’une utilisation précédente de GPU; le domaine de recherche (par exemple intelligence artificielle, apprentissage machine, etc.); et la taille du groupe de recherche.
Il ne faut pas oublier que :
-
les chercheuses et chercheurs qui présentent une demande aux concours trouvent difficile d’estimer leurs besoins en GPU et, dans la plupart des cas, ils en demandent beaucoup plus qu’ils n’en utilisent. Avant de présenter une demande, nous les encourageons fortement à faire deux choses : commencer à utiliser les GPUpour mieux cerner leurs besoins, et consulter notre équipe technique qui peut les aider à évaluer la performance de leurs programmes et à estimer plus exactement leurs besoins en GPU;
-
les allocations de GPU sont contraintes entre autres par le type de GPU demandé (Pascal, Volta, T4) et le nombre disponible sur chaque grappe;
-
les demandes de GPU pour des applications d’intelligence artificielle ont considérablement augmenté.
Tableau 4 : Allocation de GPU par grappe pour 2022
GPU-année disponibles (capacité 100 %) | GPU-année demandés |
GPU- année alloués | Capacité allouée | |
---|---|---|---|---|
Béluga | 688 | 2 108 | 426 | 62 % |
Cedar | 1 352 | 3 964 | 1 072 | 79 % |
Graham | 498 | 1 634 | 268 | 54 % |
Narval | 524 | 1 364 | 395 | 75 % |
Total | 3 062 | 9 070 | 2 161 | 71 % |
Tableau 5 : Évolution de la demande de GPU
GPU-année disponibles | GPU-année demandés |
GPU- année alloués | Écart | Demande satisfaite à | |
---|---|---|---|---|---|
2022 |
3 062 |
9 070 | 2 161 | 6 909 | 24 % |
2021 | 2 610 | 9 980 | 2 187 | 7 370 | 22 % |
2020 | 2 552 | 12 885 | 1 936 | 11 165 | 15 % |
2019 | 1 664 | 6 555 | 1 331 | 5 224 | 20 % |
2018 | 976 | 4 092 | 840 | 3 252 | 20 % |
2017 | 1 420 | 2 790 | 1 047 | 1 743 | 38.5 % |
2016 | 373 | 1 357 | 269 | 1 088 | 20 % |
2015 | 482 | 608 | 300 | 308 | 49 % |
2014 | NA | 420 | 308 | 112 | 73 % |
2013 | NA | 390 | 259 | 131 | 66 % |
Allocations de ressources infonuagiques
La grappe Arbutus de l’Université de Victoria peut allouer 41 920 vCPU (CPU virtuels). Ils sont disponibles via les concours d’allocation de ressources et le service d’accès rapide et sont aussi utilisés par les services internes pour le développement de logiciels et l’hébergement. Des petites capacités infonuagiques sont aussi disponibles sur Cedar, Graham et Béluga. La demande globale de vCPU a augmenté de 14 % en 2022 : la demande pour les vCPU de calcul a connu une hausse de 14 % et celle pour les vCPU persistants de 21 %.
Le surprovisionnement des vCPU persistants à un ratio de 10:1 a permis une expansion significative des allocations persistantes au cours des dernières années. L’utilisation des cœurs réels a suivi le rythme des ajouts de matériel et dépasse largement 80 %, un seuil au-delà duquel l’ajout d’instances de calcul devient difficile.
Avec Arbutus et les nœuds ajoutés à Cedar, Graham et Béluga, nous avons pu allouer par concours 79 % des vCPU demandés.
Tableau 6 : Évolution de la demande de vCPU
vCPU-année disponibles | vCPU-année demandés |
vCPU- année alloués | Écart | Demande satisfaite à | |
---|---|---|---|---|---|
2022 |
62 549 |
34 536 | 27 444 | 7 092 | 79 % |
2021 | 62 549 | 30 323 | 24 443 | 5 880 | 81 % |
2020 | 50 501 | 18 330 | 18 229 | 101 | 99 % |
2019 | 29 147 | 19 479 | 18 511 | 968 | 95 % |
2018 | 24 854 | 12 480 | 11 829 | 651 | 95 % |
Allocations de stockage
Ensemble, les ressources intégrées à Arbutus, Béluga, Cedar, Graham, Narval et Niagara permettent le stockage en ligne d’environ 181 Po pour 2022. Ainsi, 94 % de la capacité de stockage a été allouée.
Tableau 7 : Allocations de stockage (en To)
Catégorie | Type | Espace disponible | Espace demandé | Espace alloué | Demande satisfaite à |
CHP | project | 66 230 | 61 715 | 51 571 | 84 % |
HPC | nearline | 87 800 | 72 077 | 73 620 | 102 % |
HPC | dCache | 13 680 | 13 091 | 13 090 | 100 % |
nuage | volumes et instantanés | 4 980 | 3 562 | 2 948 | 83 % |
nuage | objet | 7 000 | 7 325 | 7, 15 | 100 % |
nuage | partagé | 2, 00 | 1 628 | 1 618 | 99 % |
Total | 181 690 | 159 398 | 150 162 | 94 % |
Calcul Canada basait les concours d’allocation de ressources annuels sur les exigences de la Fondation canadienne pour l’innovation (FCI) en vue d’attribuer les ressources de CIP selon le mérite scientifique des projets. En plus de devoir satisfaire à ces exigences, la justification technique de la demande est aussi examinée.
Deux processus étaient en place :
-
un examen scientifique effectué bénévolement par plus de 100 pairs experts en provenance de divers établissements d’enseignement canadiens qui jugent du mérite des projets soumis aux concours. Chaque demande reçoit une note qui sert à guider objectivement les décisions relatives à l’allocation des ressources;
-
une évaluation technique effectuée par le personnel, qui vérifie le bien-fondé des ressources nécessaires au projet décrites dans la demande et recommande la grappe appropriée au projet, selon ses besoins.
Les processus d’évaluation sont supervisés par le comité administratif du programme d’accès aux ressources composé de représentants de chacune des régions et des sites hôtes de l’infrastructure nationale de calcul.
Les nouvelles demandes sont soumises aux examens techniques et scientifiques, alors que seul un examen technique est fait pour les demandes accélérées et les demandes pluriannuelles pour les projets de plateformes et portails de recherche.
Principes directeurs
Les principes directeurs des concours pour l’allocation des ressources sont :
-
toutes les demandes sont traitées équitablement;
-
les ressources sont allouées sur la base du mérite du projet plutôt que sur le mérite du programme de recherche;
-
la quantité de ressources de calcul allouée n’est pas directement proportionnelle à la qualité ou à l’excellence des résultats escomptés; certaines recherches importantes peuvent être accomplies avec relativement peu de ressources de calcul;
-
les difficultés posées par le manque de ressources et les autres contraintes liées aux systèmes sont partagées entre toutes les candidatures.
Examen technique
Cet examen est effectué par l’équipe technique pour
-
veiller à ce que le chercheur principal ou la chercheuse principale soumette une demande pour une ressource appropriée et assurer la disponibilité des logiciels nécessaires;
-
évaluer l’efficacité et la scalabilité de la demande;
-
identifier les groupes qui pourraient avoir besoin d’aide avec l’optimisation du code et des processus;
-
relever les disparités entre la demande soumise en ligne et la description complète du projet;
-
repérer les exigences logicielles particulières;
-
fournir une opinion technique sur le caractère raisonnable de la demande.
Avant d’avoir accès aux demandes, le personnel technique doit signer une entente de confidentialité et de non-divulgation.
Examen scientifique
Un comité de pairs experts examine chaque demande et lui attribue une note au mérite scientifique. Avant d’avoir accès aux demandes, les membres des comités de pairs experts doivent signer une entente de confidentialité et de non-divulgation et accepter de se conformer à la politique en matière de conflits d’intérêts.
La note accordée à une demande se base sur :
-
l’excellence scientifique du projet pour lequel les ressources de calcul sont demandées;
-
la faisabilité scientifique et technique du projet;
-
la pertinence des ressources demandées par rapport aux objectifs du projet;
-
la probabilité que les ressources demandées seront utilisées de façon efficiente.
Les demandes sont évaluées par les comités suivants :
-
Astronomie, astrophysique et cosmologie
-
Bio-informatique
-
Chimie, biochimie et biophysique
-
Sciences informatiques et mathématiques
-
Génie
-
Sciences de la Terre et de l’environnement
-
Sciences humaines et sociales
-
Nanotechnologie, matériaux et matière condensée
-
Neurosciences, imagerie médicale et physique médicale
-
Physique des particules subatomiques, physique nucléaire et physique cosmique
Le tableau suivant montre les moyennes pour l’ensemble de la plateforme de CHP; les montants incluent le coût en capital et le coût d’exploitation des ressources et services. Il ne s’agit pas de la valeur sur le marché. La valeur est calculée sur une base annuelle.
Tableau 8 : Valeur des allocations
Ressources | 2022 |
---|---|
1 cœur-année | 124 $ |
1 GPU-année | 2 460 $ |
1 To de stockage /project par année | 56 $ |
1 To de stockage /nearline par année | 26 $ |
1 vCPU-année | 43 $ |
1 vGPU-année | 615 $ |
1 To de stockage pour les volumes et instantanés (Ceph) par année | 49 $ |
1 To de stockage objet | 49 $ |
1 To de stockage dans un système de fichiers partagé | 49 $ |