Input Data Tool Icon

Outil De Données D'entrée (mode Classique)

Version:
2023.1
Last modified: April 12, 2022

L’outil Entrée de données intègre des données dans votre workflow en se connectant à un fichier ou à une base de données.

Utilisez l’outil Entrée de données pour vous connecter aux sources de données prises en charge suivantes :

Types de fichiers

-ERR:REF-NOT-FOUND-Alteryx Calgary     .cybd (cybd)
Base de données Alteryx .yxdb
Alteryx Spatial Zip .sv
Avro .avro
Valeurs séparées par des virgules .csv
dBase .dbf
Géodatabase personnelle ESRI     .mdb
Fichier de formes ESRI .shp
Extensible Markup Language .xml
Flat ASCII .flat
GIS     .grc, .grd
Google Earth/Google Maps .kml
Gzip .gz, .tgz
IBM SPSS .sav
Json .json
Format d'échange MapInfo Professional .mif
Table MapInfo Professional .tab
Microsoft Access 2000-2003 .bdb
Microsoft Access 2007, 2010, 2013, 2016 .accdb
Format binaire Microsoft Excel .xlsb
Microsoft Excel 1997-2003 .xls
Microsoft Excel .xlsx
Macro Microsoft Excel activée     .xlsm
QlikView .qvx
SAS .sas7dbat
SQLite     .sqlite
SRC Geography     .geo
Texte     .txt, .asc, .dat, .log
-ERR:REF-NOT-FOUND-Zip .zip

Sources de données

Adobe Adobe Analytics
Amazon Amazone Athéna
  Amazon Aurora
  Amazon Redshift
  Amazon S3
Apache Cassandra
  -ERR:REF-NOT-FOUND-Hadoop Hadoop -ERR:REF-NOT-FOUND-Distribué Système de -ERR:REF-NOT-FOUND-fichiers (HDFS)
  Hive
  Spark
Cloudera Impala
  Système de fichiers distribués Hadoop (HDFS)
  Hive
Databricks Databricks
ESRI     Géodatabase ESRI
Exasolution     EXASOL
Google Google Analytics
  Google BigQuery
  Google Sheets
Hortonworks Hadoop Hadoop Distribué Système de fichiers (HDFS)
  Hive
IBM IBM DB2
  IBM Netezza
Marketo Marketo
MapR     -ERR:REF-NOT-FOUND-Hadoop Hadoop -ERR:REF-NOT-FOUND-Distribué Système de -ERR:REF-NOT-FOUND-fichiers (HDFS)
  Hive
Kit de démarrage Microsoft Analytics Platform System
  Microsoft Azure Data Lake Store
  Entrepôt de données Microsoft Azure SQL
  Base de données Microsoft Azure SQL
  Services cognitifs Microsoft
  Microsoft Dynamics CRM
  Microsoft OneDrive
  Microsoft SharePoint
  Microsoft SQL Server
Mongo DB Mongo DB
MySQL MySQL
NetSuite Netsuite
Oracle Oracle
Pivotal Pivotal Greenplum
PostgreSQL PostgreSQL
Salesforce Salesforce
SAP SAP Hana
Snowflake Snowflake
Teradata Teradata
  Teradata Aster
Vertica Vertica

Utilisez d’autres outils pour vous connecter à d’autres sources de données prises en charge. Pour une liste complète des sources de données prises en charge dans Alteryx, consultez les sources de données et les formats de fichiers pris en charge.

Configuration des outils

Avant de configurer l'outil, dans la fenêtre Configuration, tapez un chemin de fichier dans Connect a File ou Database ou sélectionnez l'une des options suivantes :

Fichier
  1. Cliquez sur Fichier pour accéder au fichier pour vous connecter à un fichier dans un répertoire ou sur un réseau local.
  2. Double-cliquez sur un fichier pour le sélectionner.

Vous pouvez également vous connecter à un fichier en cliquant sur celui-ci sur votre ordinateur et en le faisant glisser vers le canevas Alteryx, puis en ajoutant un outil Entrée de données connecté au fichier sélectionné.

(Continuer à faire défiler pour savoir comment sélectionner plusieurs fichiers et exceller les fichiers)

Fichiers Gzip et Zip

Voir Gzip File Support et Zip File Support pour plus d'informations.

Sélectionnez le type de fichier à extraire : utilisez la liste déroulante pour sélectionner le type de fichier à afficher.

Sélectionnez des fichiers : cliquez sur la case à cocher en regard du fichier que vous souhaitez extraire.

Pour voir tous les fichiers dans le fichier Gzip ou Zip, y compris les fichiers qui ne sont pas pris en charge par Alteryx, sélectionnez autres fichiers sous sélectionnez type de fichier pour extraire. Sélectionnez un type de fichier pour Analyser d'autres fichiers en tant que .

Les fichiers Gzip et Zip ne sont pas pris en charge dans la Alteryx Gallery.

Microsoft SQL Server

Cliquez sur Microsoft SQL Server pour créer une nouvelle connexion de base de données Microsoft SQL Server.

Voir Connectez-vous à une base de données serveur SQL.

Oracle

Cliquez sur Oracle pour créer une nouvelle connexion de base de données Oracle.

Voir Connectez-vous à une base de données Oracle.

Hadoop

Cliquez sur Hadoop pour créer une nouvelle connexion de base de données Hadoop.

Alteryx se connecte à un système de fichiers distribué Hadoop et lit les fichiers .csv et .avro. Toutes les distributions Hadoop utilisant la norme HDFS sont prises en charge.

(Continuer le défilement pour configurer les connexions HDFC)

Autres bases de données

Pointez vers d'autres bases de données pour créer une nouvelle connexion de base de données à une base de données autre que Microsoft, Oracle ou Hadoop.

Sélectionnez la base de données à laquelle vous voulez connecter :

  • -ERR:REF-NOT-FOUND-Odbc
  • -ERR:REF-NOT-FOUND-Oledb
  • -ERR:REF-NOT-FOUND-Oracle OCI
  • -ERR:REF-NOT-FOUND-Teradata en vrac
  • ESRI
  • Connexions à des bases de données 32 bits
  • Connexions précédentes

Avant de vous connecter à une base de données, tenez compte des facteurs suivants :

  • Les types de connexion ODBC et OleDB prennent tous deux en charge les connexions géographiques. Alteryx détecte automatiquement si une base de données prend en charge la fonctionnalité géographique et affiche les configurations requises.
  • Lorsque vous vous connectez à une base de données OleDB ou ODBC, n’oubliez pas d’utiliser le pilote natif proposé par le fournisseur de la base de données.
  • La fenêtre Choisir la table ou la fenêtre de requête s'ouvre si la base de données comporte plusieurs tables. Vous pouvez alors sélectionner des tables et construire des requêtes.
  • Pour vous connecter à une base de données pour le traitement dans la base de données, voir Aperçu dans la base de données.
Connexions de données enregistrées

Pointez le curseur sur une option et sélectionnez une connexion de données enregistrée ou partagée pour la connecter, ou cliquez sur Gérer pour afficher et modifier des connexions.

  • Toutes les connexions : affiche la liste des connexions enregistrées sur votre ordinateur, plus les connexions partagées avec vous à partir d'une galerie.
  • Mon ordinateur : affiche une liste des connexions enregistrées sur votre ordinateur.
  • Gallery : affiche une liste des connexions partagées avec vous à partir d'une galerie.
  • Ajouter a Gallery: Ouvre l'écran de connexion de la galerie. Servez-vous de votre nom d’utilisateur et de votre mot de passe pour vous connecter. Une fois connecté, retournez à Connexions de données enregistrées et pointez sur la Galerie dans la liste pour afficher les connexions partagées à partir de la Gallery.

Voir Gérer les connexions de données pour en savoir plus sur la gestion des connexions de données enregistrées et partagées et le dépannage.

Configurer l’outil

Après avoir sélectionné une option ci-dessus : 

 2. Sélectionnez les options de format de fichier. Les options varient en fonction du fichier ou de la base de données auquel vous vous connectez. Voir Options de format de fichier.
 3. Affichez un aperçu de la mise en page des données.

Sélectionner plusieurs fichiers

Dans la fenêtre de l’explorateur de fichiers, tapez un caractère générique dans le chemin du fichier.

Pensez à un cas où vous avez plusieurs tables de données contenant les deux :

  • structures de table identiques, ce qui signifie que la table contient les mêmes colonnes, types de données et noms de feuilles
  • noms similaires dans le même répertoire

Tapez le nom de fichier qu'ils ont en commun et ajoutez un * pour remplacer tous les caractères suivants ou un ? pour remplacer un caractère. Lorsque vous spécifiez les noms de fichiers, n’oubliez pas d’inclure l’extension commune à tous les fichiers.

Ce chemin permet d'accéder à tous les fichiers .csv figurant dans le répertoire données\fichiers de données et dont le nom commence par ABCD.

data\datafiles\ABCD*.csv

Il apporterait dans ABCD 4.csv et ABCD-012.csv.

Ce chemin apporte dans chaque fichier .csv contenu dans l'annuaire data-datafiles avec un nom de fichier qui commence par ABCD MD 1 caractère.

data\datafiles\ABCD_?.csv

Excel

Dans Sélectionner des entrées Excel, sélectionnez l’une des entrées Excel :

  • Sélectionnez une feuille à choisir parmi les feuilles disponibles dans le fichier Excel.
  • Sélectionnez une plage nommée à choisir parmi les plages nommées disponibles dans le fichier Excel.
  • Importez uniquement la liste de noms de feuilles pour créer une sortie avec une seule colonne contenant les noms des feuilles en tant que valeurs.

Aucune des données connexes n’est obtenue lorsque cette option est sélectionnée.

Problèmes connus

Le pilote Access se lit comme !!! comme étant des,,, et ... comme . Cela peut avoir un impact sur les noms de feuilles et les plages nommées dans un fichier Excel tiré dans Designer.

 

Configurer les connexions HDFS

Le contenu HDFS peut être lu à l’aide de httpfs (port 14000), webhdfs (port 50070) ou Passerelle Knox (8443). Pour savoir quel service utiliser, consultez votre administrateur Hadoop. Si vous possédez un cluster Hadoop haute disponibilité (HA), votre administrateur Hadoop doit explicitement activer le service httpfs.

Il se peut que MapR ne soit pas compatible avec webhdfs.

Dans la fenêtre Connexion à un HDFS :

  1. Sélectionnez une configuration de serveur : HTTPFS, WebHDFS, ou Knox Gateway.
  2. Animateur: Spécifiez l'instance installée du serveur Hadoop. L’entrée doit être une URL ou une adresse IP.
  3. Port: Affiche le numéro de port par défaut pour httpfs (14000), webhdfs (50070), ou Knox Gateway (8443), ou entrez un numéro de port spécifique.
  4. URL: L'URL par défaut en fonction de l'Hôte. L’adresse URL peut être modifiée.
  5. Utilisateur Nom: En fonction de la configuration du cluster, spécifiez le nom d'utilisateur et le mot de passe pour l'accès.
    • httpfs: Un nom d'utilisateur est nécessaire, mais il peut être n'importe quoi.
    • webhdfs: Le nom d'utilisateur n'est pas nécessaire.
    • Knox Knox (en) Passerelle: Un nom d'utilisateur et un mot de passe sont nécessaires.
      Les certificats auto-signés ne sont pas pris en charge dans Alteryx. Utilisez un certificat de confiance lors de la configuration de l’authentification Knox.
  6. Kerberos: Sélectionnez une option d'authentification Kerberos pour la lecture et l'écriture à HDFS. L’option que vous choisissez dépend de la manière dont votre administrateur informatique a configuré le serveur HDFS :
    • Aucune : aucune authentification n'est utilisée.
    • Kerberos Kerberos MIT: Alteryx utilise le ticket MIT par défaut pour s'authentifier avec le serveur. Vous devez d’abord acquérir un ticket valide en utilisant le gestionnaire de tickets de Kerberos MIT.
    • Kerberos Kerberos SSPI: Alteryx utilise les clés Windows Kerberos pour l'authentification, qui sont obtenues lors de la connexion à Windows avec vos informations d'identification Windows. En conséquence, les champs Nom d’utilisateur et Mot de passe ne sont pas disponibles.
  7. (Recommandé) Cliquez sur Test pour tester la connexion.
  8. Cliquez sur OK.
  9. Spécifiez le chemin d'accès du fichier (par exemple, chemin/du/fichier.csv ), ou accédez au fichier et sélectionnez-le.
  10. Sélectionnez le format de fichier Avro ou CSV et cliquez sur OK.

Pour établir la connexion à un HDFS en vue d’un traitement en base de données, utilisez l’outil Connecter en BDD.

Aperçu Détails

L’aperçu de la mise en page des données est limité à 100 enregistrements, ou moins si les fichiers sont volumineux. Si les données contiennent 1500 colonnes, au moins un enregistrement et jusqu’à deux lignes sont affichés. Utilisez un outil de navigation pour afficher toutes les données.

Pour garantir l’intégrité des données et des performances optimales, fermez les entrées avant de construire et d’exécuter un workflow.

Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.