Simon Pierre Dembele

   Vers le traitement et optimisation écologique des requêtes

DEMBELE Simon Pierre, Bellatreche Ladjel, Ordonez Carlos+
Université: * LIAS/ISAE-ENSMA, + University of Houston
Ville: * Poitiers, + Houston
Pays: * France, + US
simon-pierre.dembele@ensma.fr, bellatreche@ensma.fr, carlos@Central.UH.EDU

RÉSUMÉ. De nos jours, la réduction d’énergie est devenue un problème critique et urgent pour la communauté des bases de données. De nombreuses initiatives ont été lancées sur l’efficacité énergétique pour le traitement des données massives couvrant les composants électroniques, les logiciels et les applications. Ce traitement est principalement assuré par les optimiseurs de requêtes intégrés dans ces systèmes. Dans cet article, nous affirmons que la construction d’un optimiseur de requête vert ou la révision des optimiseurs existants passent par la procédure en 4 étapes: (1) établissement d’un audit approfondi qui permet de comprendre le fonctionnement de l’optimiseur de requête, (2) identification des paramètres pertinents sensibles à l’énergie appartenant aux composants matériels et logiciels, (3) élaboration des modèles de coût mathématiques estimant l’énergie consommée lors de l’exécution d’une requête sur un SGBD et (4) estimation des valeurs des paramètres sensibles à l’énergie à l’aide d’une des techniques de l’apprentissage automatique. Pour montrer l’efficacité de cette procédure, nous l’appliquons sur deux SGBD libres avec des modes de fonctionnement différents: PostgreSQL et MonetDB et nous les comparons à l’aide du jeu de données et des requêtes du benchmark TPC-H.

ABSTRACT. Nowadays, energy reduction has now become a critical and urgent issue for the database community. A lot of initiatives have been launched on energy-efficiency for intensive-workload computation covering individual hardware components, system software, to applications. This computation is mainly ensured by query optimizers. In this paper, we claim that building from scratch a green query processors and revisiting existing ones passes through 4-steps procedure:(1) establishment of a deep audit that allows understanding the query processor functioning, (2) identification of relevant energysensitive parameters belonging to hardware and software components, (3) elaboration of mathematical cost models estimating consumed energy when executing a single query on a target DBMS and (4) setting of values of the energy-sensitive parameters using a nonlinear regression technique. To show the effectiveness of this procedure, we apply it on two open-source DBMSs with different functioning policies: PostgreSQL and MonetDB and compared them using the dataset and the workload of the TPC-H benchmark.

MOTS-CLÉS : Optimiseurs verts – audit des SGBD – technique de régression non linéaire.

KEYWORDS : Green query processing – DBMS audit – nonlinear regression technique

Video short presentation