Main Content

Résultats du concours d’allocation de ressources pour 2023

Sommaire

La Fédération de l’Alliance de recherche numérique du Canada est responsable de la plateforme canadienne de calcul informatique de pointe en partenariat avec les organisations régionales Calcul Ontario, Calcul Québec, ACENET, Groupe de l’IRN de la C.-B., IRN des Prairies, ainsi que des établissements de partout au pays. Offrant l’infrastructure et l’expertise pour des recherches transformatrices de niveau international, cette plateforme desservait au 1er janvier 2023 près de 20 000 utilisatrices et utilisateurs, dont plus de 5 376 chercheuses et chercheurs canadiens.

Dans le cadre du concours pour l’allocation des ressources pour 2023, la plateforme nationale de calcul informatique de pointe disposait d’environ 263 326 CPU, 56 405 vCPU (CPU virtuels), 2 569 GPU et 190,5 Po d’espace de stockage sur les grappes Arbutus (Université Victoria), Cedar (Université Simon-Fraser), Graham (Université de Waterloo), Niagara (Université de Toronto), et Béluga et Narval (Calcul Québec). Bien qu’en moyenne près de 80 % des ressources sont allouées par voie de concours, nous réservons toutefois environ 20 % au service d'accès rapide qui met de petites capacités de calcul, de stockage et de ressources infonuagiques à la disposition de ceux et celles qui détiennent un compte.

L’augmentation sans cesse croissante des besoins fait que la demande reste toujours plus forte que l’offre. Un total de 707 candidatures ont été présentées au concours pour 2023 et l’infrastructure a pu combler 47 % des besoins en ressources de calcul, 80 % des besoins en espace de stockage et 20 % des besoins en GPU. D’autre part, les besoins en vCPU sur les nuages Arbutus, Béluga, Cedar et Graham ont été satisfaits à 77 %.

Pour la définition de plusieurs termes utilisés ici, consultez le glossaire technique. Toute question relative aux présents résultats peut être adressée à [email protected].

 

Tableau 1 : Candidatures au concours d’allocation de ressources

Année

Demandes reçues

Augmentation par rapport à l’année précédente

2023

707

-1 %

2022

716

10 %

2021

651

10 %

2020

590

16 %

2019

507

8 %

2018

469

15 %

2017

409

12 %

2016

366

5 %

2015

350

20 %

2014

291

38 %

2013

211

33 %

 

Candidatures par année

*En date du 13 février 2023

Ressources de calcul informatique de pointe

Capacité minimale pour un projet et accès opportuniste aux ressources de calcul

Pour être admissible à présenter une demande au concours, un projet doit nécessiter un minimum de 50 cœurs-années CPU et 10 GPU-années. Ces valeurs servent en partie à contrôler la quantité de demandes qui doivent être soumises à l’examen scientifique. Le fait de disposer d’une allocation qui respecte la capacité minimale garantit une plus haute priorité aux tâches soumises. 

Outre les ressources allouées via le concours, tous les chercheurs et chercheuses ainsi que leurs utilisateurs parrainés peuvent se prévaloir d’un accès opportuniste aux CPU et aux GPU pourvu qu'ils disposent d’un compte actif. Puisque l’utilisation est purement opportuniste, il est impossible de garantir combien de ressources peuvent être consommées par les projets qui n’ont pas fait l’objet d’une demande au concours.

L’historique de l’utilisation montre que plusieurs groupes qui n’ont pas obtenu d’allocation par suite du concours peuvent atteindre et même dépasser les minimums mentionnés ci-dessus. Pour maximiser l’utilisation des ressources en calcul, les stratégies suivantes sont employées :

  • conserver des tâches dans la queue de façon régulière;
  • tolérer un temps d’attente plus long avant le lancement des tâches;
  • soumettre des tâches ayant des caractéristiques optimales

Par exemple, des tâches opportunistes de courte durée qui nécessitent quelques cœurs d’une grappe d’usage général seront habituellement exécutées plus rapidement que celles qui requièrent quelques dizaines de cœurs.

Pour savoir comment maximiser l’utilisation de ressources si vous ne disposez pas de ressources allouées par voie de concours, veuillez lire attentivement les pages Allocation et ordonnancement et Politique d’ordonnancement des tâches ou écrivez à [email protected].

 

Allocations de CPU

Le concours de 2023 a satisfait à 47 % la demande en CPU, ce qui représente une baisse de 7 % par rapport à l’année dernière. Béluga, Cedar, Graham, Narval et Niagara fournissent 100 % de la capacité offerte, soit environ 263 326 cœurs, dont près de 80 % sont alloués par voie de concours.

 

Tableau 2 : Allocations de CPU par grappe

Grappe

Cœurs-année disponibles

Cœurs-année demandés

Cœurs-année alloués

Pourcentage de la capacité totale allouée

Béluga

28 960

44 784

22 970

79 %

Cedar

68 976

127 430

56 191

82 %

Graham

27 790

45 852

21 249

77 %

Narval

61 760

96 133

49 866

81 %

Niagara

75 840

153 800

65 888

87 %

Total

263326

467999

216164

82%

 

Tableau 3 : Évolution de la demande de CPU

Année

Cœurs-année disponibles

Cœurs-année demandés

Cœurs-année alloués

 

Demande satisfaite à

2023

263 326

460 346

216 164

47 %

2022

293 312

436 780

234 275

  54  %

2021

232 704

468 498

188 925

40  %

2020

232 704

455 892

181 502

40  %

2019

201 320

390 352

157 262

40  %

2018

211 020

287 957

158 632

56  %

2017

182 760

255 638

148 100

58  %

2016

155 952

237 862

128 463

54 %

2015

161 888

191 690

123 699

65 %

2014

190 466

172 989

133 508

77 %

2013

187 227

142 106

126 677

89 %

 

Évolution des allocations de coeurs année

 

Mise à l’échelle des demandes de CPU

Comme mentionné au préalable, les ressources en calcul informatique de pointe ne suffisaient pas à satisfaire les demandes reçues pour le concours de 2023.

Les demandes ont donc été mises à l’échelle pour les adapter aux ressources insuffisantes. La procédure, cautionnée par les présidentes et présidents des comités d’examen, a été mise en place afin que seules les candidatures ayant reçu une note égale ou supérieure à 3,0 (sur 5) obtiennent une allocation de ressources. Les chercheuses et chercheurs qui n’ont pas obtenu l’allocation de CPU peuvent toutefois se prévaloir de la possibilité d’une utilisation opportuniste par le biais du service d'accès rapide. La note moyenne attribuée à l’ensemble des demandes pour 2023 se situe à 3,7.

Les demandes en termes de CPU sont mises à l’échelle d’après la note générale obtenue par la demande et la capacité demandée. Les détails de la fonction de mise à l’échelle et quelques exemples sont présentés ici. Pour plus d’information, écrivez à [email protected].
 

Allocations de GPU

La concurrence pour les ressources GPU est toujours plus forte que celle pour les CPU; les tableaux 4 et 5 indiquent que la demande de GPU est environ trois fois plus grande qu’il y a cinq ans. La demande pour 2023 a été satisfaite à 20 %.  

Les allocations de GPU sont déterminées d’après 

  • la note générale obtenue par la demande; 
  • la justification technique des besoins en ressources; 
  • la preuve d’une utilisation précédente de GPU; 
  • le domaine de recherche (par exemple intelligence artificielle, apprentissage machine, etc.); et 
  • la taille du groupe de recherche.

Il ne faut pas oublier que :

  • les chercheuses et chercheurs qui présentent une demande au concours trouvent difficile d’estimer leurs besoins en GPU et, dans la plupart des cas, ils en demandent beaucoup plus qu’ils n’en utilisent. Avant de présenter une demande, nous les encourageons fortement à faire deux choses : 1. commencer à utiliser les GPU pour mieux cerner leurs besoins, et 2. consulter notre équipe technique qui peut les aider à évaluer la performance de leurs programmes et à estimer plus exactement leurs besoins en GPU;
  • les allocations de GPU sont contraintes entre autres par le type de GPU demandé (Pascal, Volta, T4) et le nombre disponible sur chaque grappe;
  • les demandes de GPU pour des applications d’intelligence artificielle ont considérablement augmenté.


 

Tableau 4 : Allocation de GPU par grappe

Grappe

GPU-année disponibles 

GPU-année

demandés

GPU- année alloués

Pourcentage de la capacité totale allouée

Béluga

688

2 708

546

79 %

Cedar

1 014

3 208

781

77 %

Graham

343

1 463

243

71 %

Narval

524

2 447

442

84 %

Total

2 569

9 826

2 012

78 %


 

Tableau 5 : Évolution de la demande de GPU

Année

GPU-année disponibles

GPU-année

demandés

GPU- année alloués

Écart

Demande satisfaite à

2023

2 569

9 826

2 012

7 814

20 %

2022

3 062

9 070

2 161

6 909

24 %

2021

2 610

9 980

2 187

7 370

22 %

2020

2 552

12 885

1 936

11 165

15 %

2019

1 664

6 555

1 331

5 224

20 %

2018

976

4 092

840

3 252

20 %

2017

1 420

2 790

1 047

1 743

39 %

2016

373

1 357

269

1 088

20 %

2015

482

608

300

308

49 %

2014

s.o.

420

308

112

73 %

2013

s.o.

390

259

131

66 %

 

Évolution des allocations de GPU

 

Allocations de stockage 

Ensemble, les ressources intégrées à Arbutus, Béluga, Cedar, Graham, Narval et Niagara permettent le stockage en ligne d'environ 190.5 Po pour 2023. Ainsi, 80 % de la capacité de stockage a été allouée.

 

Évolutions des allocations de stockage

 

Tableau 6 : Évolution de la demande de stockage

Année

Stockage disponible (To)

Stockage demandé (To)

Stockage alloué (To)

Demande satisfaite à

2018

63 340

60 126

43 508

80 %

2019

101 344

89 898

77 923

94 %

2020

143 914

109 718

100 222

90 %

2021

150 915

135 427

122 272

91 %

2022

190 479

161 186

151 775

87 %

2023

190 479

192 363

153 639

72 %

 

 Tableau 7 : Allocations de stockage par type pour 2023

Catégorie

Type 

Espace disponible 

Espace demandé 

Espace alloué      

Demande satisfaite à

CHP

project

63 052

74 025

53 884

73 %

CHP

nearline

97 800

84 348

71 827

85 %

CHP

dCache

13 680

14 140

13 740

97 %

nuage

volumes et instantanés

4 947

2 895

2 833

98 %

nuage

objet 

8 000

13 732

8 477

62 %

nuage

partagé

3 000

3 223

2 878

89 %

 

Total

190 479

192 363

153 639

80 %

 

Allocations de ressources infonuagiques

La grappe Arbutus de l’Université de Victoria peut allouer 41 920 vCPU (CPU virtuels). Ils sont disponibles via le concours d’allocation de ressources et le service d’accès rapide et sont aussi utilisés par les services internes pour le développement de logiciels et l’hébergement. De petites capacités infonuagiques sont aussi disponibles sur Cedar, Graham et Béluga. Pour 2023, la demande totale de vCPU a augmenté de 3 %  : la demande pour les vCPU de calcul sont en hausse de 3% et celle pour les vCPU persistants de 44%.

Le surprovisionnement des vCPU persistants à un ratio de 10:1 a permis une expansion significative des allocations persistantes au cours des dernières années. La demande pour des cœurs réels continue d’augmenter alors que la capacité disponible diminue en raison du matériel qui exige de plus en plus de maintenance. Ceci résulte en une utilisation qui dépasse largement les 80 %, un seuil au-delà duquel l’ordonnancement d’instances de calcul plus exigeantes devient difficile.

Avec Arbutus et les nœuds ajoutés à Cedar, Graham et Béluga, nous avons pu allouer par concours 77 % des vCPU demandés. 

 

Tableau 8 : Évolution de la demande de vCPU

Année

vCPU-année disponibles

vCPU-année

demandés

vCPU- année alloués

Demande satisfaite à

2023

56 405

35 618

27 313

77 %

2022

62 549

34 536

27 444

79 %

2021

62 549

30 323

24 443

81 %

2020

50 501

18 330

18 229

99 %

2019

29 147

19 479

18 511

95 %

2018

24 854

12 480

11 829

95 %

 

Évolutions des allocations de vCPU

 

Processus d'évaluation

Deux processus sont en place :

  • un examen scientifique effectué bénévolement par plus de 100 pairs experts en provenance de divers établissements d’enseignement canadiens qui jugent du mérite des projets soumis au concours. Chaque demande reçoit une note qui sert à guider objectivement les décisions relatives à l’allocation des ressources;
  • une évaluation technique effectuée par le personnel, qui vérifie le bien-fondé des ressources décrites dans la demande et recommande la grappe appropriée au projet, selon ses besoins.

Les processus d’évaluation sont supervisés par le comité administratif du programme d’accès aux ressources composé de représentants de chacune des régions et des sites hôtes de l’infrastructure nationale de calcul.

Les nouvelles demandes sont soumises aux examens techniques et scientifiques, alors que seul un examen technique est fait pour les demandes accélérées et les demandes pluriannuelles pour les projets de plateformes et portails de recherche.

 

Principes directeurs

Les principes directeurs du concours pour l’allocation des ressources sont :

  • toutes les demandes sont traitées équitablement;
  • les ressources sont allouées sur la base du mérite du projet plutôt que sur le mérite du programme de recherche; 
  • la quantité de ressources allouée n’est pas directement proportionnelle à la qualité ou à l’excellence des résultats escomptés; certaines recherches importantes peuvent être accomplies avec relativement peu de ressources;  
  • les difficultés posées par le manque de ressources et les autres contraintes liées aux systèmes sont partagées entre toutes les candidatures.

 

Examen technique

Cet examen est effectué par l'équipe technique pour

  • veiller à ce que le chercheur principal ou la chercheuse principale soumette une demande pour une ressource appropriée et assurer la disponibilité des logiciels nécessaires;
  • évaluer l'efficacité et la scalabilité de la demande;
  • identifier les groupes qui pourraient avoir besoin d’aide avec l’optimisation du code et des processus;
  • relever les disparités entre la demande soumise en ligne et la description complète du projet;
  • repérer les exigences logicielles particulières;
  • fournir une opinion technique sur le caractère raisonnable de la demande.

Avant d’avoir accès aux demandes, le personnel technique doit signer une entente de confidentialité et de non-divulgation.

 

Examen scientifique

Un comité de pairs experts examine chaque demande et lui attribue une note au mérite scientifique. Avant d’avoir accès aux demandes, les membres des comités de pairs experts doivent signer une entente de confidentialité et de non-divulgation et accepter de se conformer à la politique en matière de conflits d’intérêts.

La note accordée à une demande se base sur :

  • l'excellence scientifique du projet pour lequel les ressources de calcul sont demandées;
  • la faisabilité scientifique et technique du projet;
  • la pertinence des ressources demandées par rapport aux objectifs du projet;
  • la probabilité que les ressources demandées seront utilisées de façon efficiente.

Les demandes sont évaluées par les comités suivants : 

  • Astronomie, astrophysique et cosmologie
  • Bio-informatique
  • Chimie, biochimie et biophysique
  • Sciences informatiques et mathématiques
  • Génie
  • Sciences de la Terre et de l’environnement
  • Sciences humaines et sociales
  • Nanotechnologie, matériaux et matière condensée
  • Neurosciences, imagerie médicale et physique médicale
  • Physique des particules subatomiques, physique nucléaire et physique cosmique

Valeur monétaire des allocations pour 2023

Le tableau suivant montre les moyennes pour l’ensemble de la plateforme de calcul de haute performance; les montants incluent le coût en capital et le coût d’exploitation des ressources et services. Il ne s’agit pas de la valeur sur le marché. La valeur est calculée sur une base annuelle.

 

Tableau 9 : Valeur des allocations

Ressources

2023

1 cœur-année

104,09 $

1 GPU-année

2 564,16 $

1 To de stockage /project par année

57,29 $

1 To de stockage /nearline par année

25,66 $

1 vCPU-année

37,86 $

1 vGPU-année

615,00 $

1 To de stockage pour les volumes et instantanés (Ceph) par année

49,18 $

1 To de stockage objet

49,18 $

1 To de stockage dans un système de fichiers partagé

49,18 $