Outil Entrée de données
Exemple d'outil unique
L'outil Entrée de données a un exemple d'outil unique Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.
Utilisez l'outil Entrée de données pour ajouter des données à votre workflow en le connectant à un fichier ou à une base de données.
Note
L'utilisation de caractères génériques pour lire plusieurs fichiers .csv avec le Système de fichiers distribués Hadoop génère une erreur.
Configuration de l'outil
La fenêtre Configuration de l'outil Entrée de données comporte deux sections : Connecter un fichier ou une base de données et Options .
Connecter un fichier ou une base de données
Les étapes ci-dessous décrivent le processus avec le Gestionnaire de connexions aux données (DCM) désactivé. Lorsque cette option est activée, la liste déroulante Connecter un fichier ou une base de données est remplacée par un bouton Configurer une connexion qui ouvre la fenêtre Connexions aux données affichant uniquement les sources de données prises en charge par le DCM, et ouvre le DCM en sélectionnant une technologie.
Avec l'outil Entrée de données sur le canevas, suivez ces étapes :
Dans la fenêtre Configuration , cliquez sur le menu déroulant Connecter un fichier ou une base de données .
Designer affiche la fenêtre Connexion aux données . Configurez votre connexion aux données à l'aide de l'un des éléments suivants : Récent , Enregistré , Fichiers , Sources de données ou Server .
La section Connexions récentes contient les fichiers et connexions aux données récemment configurés. Vous pouvez sélectionner une connexion récente ou sélectionner Effacer la liste pour supprimer les connexions récentes.
Sélectionnez une connexion enregistrée . Pour renommer et modifier vos connexions, utilisez Gérer les connexions enregistrées .
Pour vous connecter à un fichier dans un répertoire local ou réseau, utilisez une des 4 options suivantes :
Dans Connexions de fichier , cliquez sur Sélectionner un fichier pour accéder à un fichier.
Faites glisser un fichier vers Connexions de fichier .
Dans Tous les types de fichiers pris en charge , sélectionnez une extension de type de fichier pour accéder à un fichier de ce type.
Fermez la fenêtre Connexions de données et faites glisser un fichier directement sur le canevas.
Sources de données
L'onglet Sources de données affichent les sources de données prises en charge et fréquemment utilisées.
Outils : si vous sélectionnez Connexion rapide pour un outil que vous n'avez pas installé, un navigateur s'ouvre sur la Communauté Alteryx pour vous permettre de télécharger et d'installer cet outil. Lisez attentivement les instructions de la page. Une fois l'outil installé, l'outil Entrée de données change sur le canevas et est remplacé par l'outil que vous avez sélectionné dans l'onglet « Sources de données ».
Sources de données :
« ODBC » lance la fenêtre de connexion ODBC qui affiche une liste filtrée de DSN sur le système utilisant ce pilote spécifique.
« OleDB » lance le gestionnaire OleDB natif Windows.
« OCI » lance le gestionnaire de connexions native Oracle OCI. À partir de là, sélectionnez le nom du service réseau tel que défini dans le fichier tnsnames. ora que vous souhaitez utiliser pour cette connexion, ainsi que les informations d'identification, à savoir le nom d'utilisateur et le mot de passe.
« En masse » ouvre une boîte de dialogue spéciale qui vous permet de configurer une connexion en masse pour le type de connexion sélectionné.
« Connexion rapide » : pour la connexion rapide SQL ou Oracle, vous pouvez soit utiliser une connexion enregistrée préexistante, soit créer une nouvelle connexion enregistrée. Pour plus de détails, consultez ces pages :
Toutes les autres connexions rapides utilisent un autre outil.
Server
Server affiche chaque interface utilisateur Server et son URL qui a été ajoutée sur l'ordinateur local. Une liste sous chaque nom de Server contient les connexions enregistrées stockées sur le Server auquel vous avez accès.
Sélectionnez + Server pour ajouter un autre Alteryx Server.
Dans la fenêtre d'explorateur de fichiers, entrez un caractère générique dans le chemin d'accès au fichier.
Imaginez un cas où vous avez plusieurs fichiers de données avec...
Le même nombre de champs où les types de données de chaque champ sont identiques.
Noms similaires dans le même répertoire.
Note
Plusieurs fichiers sont lus à l'aide d'un format à caractère générique, tel que *.csv ou 2019*.csv, dans un seul outil Entrée de données, à condition que tous les fichiers contiennent le même nombre de champs, où les types de données de chaque champ sont identiques. Designer définit le nombre de champs et les types de fichiers en fonction du 1er fichier lu. Tous les fichiers suivants qui ne correspondent pas sont ignorés et un avertissement s'affiche. Il n'est pas possible de contrôler le fichier qui est lu en premier en utilisant une syntaxe à caractère générique telle que *.csv. Le système est chargé de désigner le premier fichier.
Saisissez le nom de fichier que les multiples fichiers ont en commun et ajoutez un signe * (astérisque) pour remplacer tous les caractères suivants ou un signe ? pour remplacer 1 caractère. Lorsque vous spécifiez les noms de fichiers, incluez l'extension commune à tous les fichiers.
Exemple 1
Ce chemin permet de recenser tous les fichiers .csv figurant dans le répertoire
data\datafiles
et dont le nom commence par
ABCD
.
data\datafiles\ABCD*.csv
Cela fait apparaître
ABCD_4.csv
et
ABCD_012.csv
.
Exemple 2
Ce chemin permet de recenser tous les fichiers .csv figurant dans le répertoire
data\datafiles
dont le nom commence par
ABCD_
et comporte un caractère supplémentaire.
data\datafiles\ABCD_?.csv
Dans Sélectionner une entrée Excel , sélectionnez l'une des entrées Excel :
Sélectionner une feuille pour choisir parmi les feuilles disponibles dans le fichier Excel.
Sélectionner une plage (cellules, lignes ou colonnes) : facultativement, sélectionnez une plage de cellules, de lignes ou de colonnes dans la feuille.
Sélectionner une plage nommée pour choisir parmi les plages nommées disponibles dans le fichier Excel.
Importer seulement la liste des noms de feuille pour créer une sortie à une seule colonne contenant des noms de feuille comme valeurs. Aucune des données connexes n'est obtenue lorsque cette option est sélectionnée.
Si la feuille Excel sélectionnée est ouverte, un message d'erreur apparaît et vous ne pouvez pas continuer. Fermez la feuille, sélectionnez le bouton Actualiser dans la boîte de dialogue Sélectionner une entrée Excel et terminez le processus d'entrée.
L'outil Entrée de données ignore les colonnes qui ne sont pas définies. Une colonne définie est une colonne qui contient des données ou qui contenait auparavant des données qui ont été effacées par l'utilisateur. Pour inclure les colonnes qui ne sont pas définies, spécifiez une plage via l'option Sélectionner une plage (cellules, lignes ou colonnes) dans la boîte de dialogue Sélectionner une entrée Excel .
Consultez Prise en charge des fichiers Gzip et Prise en charge des fichiers Zip pour plus d'informations.
Lorsque vous sélectionnez un fichier.gz, .tgz ou .zip, la fenêtre Sélectionner le type de fichier à extraire s’affiche. Utilisez la liste déroulante pour sélectionner le type de fichier à utiliser.
Sélectionner des fichiers : cliquez sur la case à cocher en regard du fichier que vous souhaitez extraire.
Pour voir tous les fichiers figurant dans le fichier Gzip ou Zip, y compris les fichiers qui ne sont pas pris en charge par Alteryx, sélectionnez Autres fichiers sous Sélectionner le type de fichier à extraire . Sélectionnez un type de fichier pour Analyser d'autres fichiers en tant que .
Important
Alteryx ne prend pas en charge les fichiers Gzip et Zip dans la galerie.
.cydb | |
.yxdb | |
Alteryx Spatial Zip | .sz |
.avro | |
Valeurs séparées par des virgules | .csv |
dBase | .dbf |
ESRI Personal GeoDatabase | .mdb |
ESRI Shapefile | .shp |
Langage de balisage extensible | .xml |
.flat | |
GIS | .grc, .grd |
Google Earth/Google Maps | .kml |
.gz, .tgz | |
IBM SPSS | .sav |
.json | |
Format MapInfo Professional Interchange | .mif |
Table MapInfo Professional | .tab |
Microsoft Access 2000-2003 | .mdb |
Microsoft Access 2007, 2010, 2013, 2016 | .accdb |
Microsoft Excel Binary | .xlsb |
Microsoft Excel 1997-2003 | .xls |
.xlsx | |
Macro Microsoft Excel activée | .xlsm |
QlikView | .qvx |
SAS | .sas7bdat |
SQLite | .sqlite |
SRC Geography | .geo |
Texte | .txt, .asc |
.zip |
Les types de fichiers inconnus comprennent tout autre type de fichier qu'Alteryx ne peut pas lire nativement. Si vous utilisez un outil Entrée de données pour lire un type de fichier inconnu, la fenêtre Résoudre le type de fichier s'affiche et contient ces options :
Lire en tant que type intégré : sélectionnez le type de fichier similaire à la structure de votre fichier.
Lire en tant que fichier texte à largeur fixe : lorsque vous sélectionnez cette option, vous pouvez attribuer des colonnes à l'aide d'une règle défilante. Pour plus d'informations sur cette option, accédez à Mise en page des fichiers plats .
Lire en tant que fichier texte délimité : sélectionnez cette option si les sauts de colonne dans vos données ne sont symbolisés que par un seul délimiteur. Sélectionnez un type de délimiteur approprié et, éventuellement, indiquez si la première ligne contient les noms de champ dans vos données.
Options
Sélectionnez les options de format de fichier. Les options varient en fonction du fichier ou de la base de données auquel vous vous connectez. Accédez à Options de format de fichier pour plus d'informations.
Prévisualiser la disposition des données
Prévisualisez la disposition des données dans la fenêtre Aperçu . L'aperçu de la disposition des données est limité à 100 enregistrements ou moins si les fichiers sont volumineux. Si les données contiennent 1500 colonnes, au moins 1 enregistrement et jusqu'à 2 lignes s'affichent. Pour afficher toutes les données, utilisez un outil Explorateur .
Noms des colonnes en double
Si votre fichier d'entrée contient plusieurs colonnes du même nom, Designer renomme automatiquement les colonnes en double selon les règles suivantes :
Le nom en double se termine par 1 ou 9
Si le dernier caractère du nom de la colonne en double est 1 ou 9, Designer ajoute un trait de soulignement (_) et un chiffre, commençant par 2, au nom de colonne en double.
Nom d'origine de la colonne | Colonne en double (renommée par Designer) |
---|---|
A1 | A1_2 |
A9 | A9_2 |
Le nom en double se termine par un chiffre compris entre 2 et 8 (inclus)
Si le dernier caractère du nom de la colonne en double est un chiffre compris entre 2 et 8 (inclus), Designer incrémente ce chiffre pour renommer le nom de la colonne en double.
Cependant, si l'avant dernier caractère est également un chiffre, Designer ajoute un trait de soulignement (_) et un chiffre, commençant par 2, au nom de colonne en double.
Nom d'origine de la colonne | Colonne en double (renommée par Designer) |
---|---|
A2 | A3 |
A5 | A6 |
A22 | A22_2 |
Le nom en double se termine par une lettre ou un caractère spécial
Si le dernier caractère du nom de la colonne en double est une lettre ou un caractère spécial, Designer ajoute un chiffre (commençant par 2) pour renommer le nom de la colonne en double.
Nom d'origine de la colonne | Colonne en double (renommée par Designer) |
---|---|
âge | âge2 |
inscrit ? | inscrit ?2 |
Note
Le Générateur visuel de requêtes ne peut pas afficher correctement les caractères multi-octets. Utilisez plutôt l'onglet Tables.
Utiliser le mode classique
Avertissement
Le mode classique n'est pas compatible lorsque le Gestionnaire de connexions aux données (DCM) est activé.
Pour utiliser le mode classique ...
Cliquez sur Options > Paramètres utilisateur > Modifier les paramètres utilisateur .
Dans l'onglet Valeurs par défaut , cochez la case Utiliser le mode classique pour les options de menu des outils d'entrée/sortie .
Sélectionnez Enregistrer .
Cliquez sur le canevas ou appuyez sur le raccourci clavier F5 pour actualiser.
Vous pouvez maintenant utiliser le mode classique de l'outil Entrée de données pour sélectionner vos fichiers et vos sources de données.
Convertir un outil Sortie de données en outil Entrée de données
Vous pouvez convertir un outil Sortie de données en un outil Entrée de données
Cliquez avec le bouton droit de la souris sur l' outil Sortie de données que vous souhaitez convertir en outil Entrée de données .
Sélectionnez Convertir à Entrée de données .
Les données de sortie deviennent les données d'entrée.