Qu’est-ce qu’Azure ? Dans cet article vous en apprendrez plus sur Microsoft Azure, une plateforme dédiée au Cloud qui fournit des services orientés développeurs, applications et d’infrastructures, afin de provisionner des machines virtuelles ou/et migrer toute ou...
Dans cet article, nous allons explorer différentes techniques d’optimisation de jobs PySpark en nous concentrant principalement sur l’optimisation du code. Nous pourrons voir dans un prochain article les autres techniques d’optimisation des jobs PySpark...
La Big Data, concept apparu dans les années 1990 avec l’explosion d’internet est devenue un sujet tendance ces dernières années. La Big Data désigne l’ensemble des données numériques produites chaque jour par les individus, les entreprises et les organisations....
HBase, c’est quoi ? C’est un système de gestion de base de données distribuées, développé en utilisant le framework Hadoop. Il est conçu pour gérer des quantités massives de données non structurées ou semi-structurées, en utilisant une architecture de table...
Aperçu dictionary : la vision TABLES Le dictionnaire de données permet de récupérer facilement toutes les métadonnées qui vous sont accessibles : tables dans une librairie, colonnes dans une table, les indexes, les variables macros existantes, les options SAS, les...
Lire et écrire dans des fichiers Excel avec Libname XLSX est une alternative élégante à l’utilisation des procédures SAS PROC IMPORT et PROC EXPORT : Très simple à utiliser : un onglet de votre fichier Excel se manipule comme une table SAS dans votre code. On verra...