Outil Entrée de données
Utilisez l’outil données d’entrée pour introduire des données dans votre workflow en vous connectant à un fichier ou à une base de données.
- Cliquez sur l’outil Entrée de données dans la palette d’outils et faites-le glisser vers l'espace de travail du workflow.
- Dans la fenêtre Configuration, cliquez sur la flèche déroulante Connecter un fichier ou une base de données .
Alteryx affiche la fenêtre Connexions de données. Configurez votre connexion de données à l'aide de l'un des éléments suivants : récents, enregistrés, fichiers, sources de données ou galerie.
Sélectionnez une connexion récente. Les connexions récentes contiennent des fichiers et des connexions de données récemment configurés.
Cliquez sur Effacer la liste pour supprimer les connexions récentes.
Sélectionnez une connexion enregistrée. Pour renommer et modifier vos connexions, utilisez Gérer les connexions de données.
Pour vous connecter à un fichier dans un répertoire local ou réseau, procédez de l’une des manières suivantes :
- Dans Connexions au fichier, cliquez sur Sélectionner un fichier pour accéder à un fichier,
- Glissez et déposez un fichier sur les Connexions de fichiers,
- Dans tous les types de fichiers pris en charge, cliquez sur une extension de type de fichier pour accéder à un fichier de ce type, ou
- Fermez les connexions de données et faites glisser un fichier directement dans l'espace de travail.
Dans la fenêtre de l’explorateur de fichiers, tapez un caractère générique dans le chemin du fichier.
Imaginez un cas où vous avez plusieurs fichiers de données avec les deux :
- Plusieurs fichiers sont lus à l’aide du format générique tel que *.csv ou 2019*.csv dans un seul outil d’entrée, à condition que les fichiers contiennent tous le même nombre de champs et que les types de données pour chaque champ soient identiques. Designer définit le nombre de champs et les types de fichiers en fonction du premier fichier lu. Tous les fichiers ultérieurs qui ne correspondent pas seront ignorés et un avertissement s’affichera. Il n’est pas possible de contrôler quel fichier sera lu en premier lors de l’utilisation d’une syntaxe générique comme *.csv ; c’est le système qui détermine quel fichier sera désigné comme le premier.
- noms similaires dans le même répertoire
Tapez le nom de fichier qu'ils ont en commun et ajoutez un * pour remplacer tous les caractères suivants ou un ? pour remplacer un caractère. Lorsque vous spécifiez les noms de fichiers, n’oubliez pas d’inclure l’extension commune à tous les fichiers.
Ce chemin permet d'accéder à tous les fichiers .csv figurant dans le répertoire données\fichiers de données et dont le nom commence par ABCD.
data\datafiles\ABCD*.csv
Cela fait apparaître ABCD_4.csv et ABCD_012.csv.
Ce chemin permet d'accéder à tous les fichiers .csv figurant dans le répertoire données\fichiers de données dont le nom commence par les caractères ABCD_ + 1.
data\datafiles\ABCD_?.csv
Dans Sélectionner une entrée Excel, sélectionnez l'une des entrées Excel :
- Sélectionner une feuille pour choisir parmi les feuilles disponibles dans le fichier Excel.
- Sélectionner une plage nommée pour choisir parmi les plages nommées disponibles dans le fichier Excel.
- Importer seulement la liste des noms de feuille pour créer une sortie à une seule colonne contenant des noms de feuille comme valeurs.
Aucune des données connexes n’est obtenue lorsque cette option est sélectionnée.
Problèmes connus
Le pilote d'accès lit !!! comme # # # et à la fois ,,, et ... comme _ _. Cela peut influencer les noms de feuille et les plages nommées dans un fichier Excel ouvert dans .Designer
Voir Prise en charge de fichiers Gzip et Prise en charge des fichiers Zip pour plus d’informations.
Lorsque vous sélectionnez un fichier.gz, .tgz ou .zip, la fenêtre Sélectionner le type de fichier à extraire s’affiche. Utilisez la liste déroulante pour sélectionner le type de fichier à utiliser.
Sélectionnez des fichiers : cliquez sur la case à cocher en regard du fichier que vous souhaitez extraire.
Pour voir tous les fichiers figurant dans le fichier Gzip ou Zip, y compris les fichiers qui ne sont pas pris en charge par Alteryx, sélectionnez Autres fichiers sous Sélectionner le type de fichier à extraire. Sélectionnez un type de fichier pour Analyser d'autres fichiers en tant que .
Important
Les fichiers Gzip et Zip ne sont pas pris en charge dans la Alteryx Gallery.
Calgary pour Alteryx | .cydb |
Base de données Alteryx | .yxdb |
Alteryx Spatial Zip | .sz |
Avro | .avro |
Valeurs séparées par des virgules | .csv |
dBase | .dbf |
ESRI Personal GeoDatabase | .mdb |
ESRI Shapefile | .shp |
Extensible Markup Language | .xml |
Flat ASCII | .flat |
GIS | .grc, .grd |
Google Earth/Google Maps | .kml |
Gzip | .gz, .tgz |
IBM SPSS | .sav |
JSON | .json |
MapInfo Professional Interchange Format | .mif |
MapInfo Professional Table | .tab |
Microsoft Access 2000-2003 | .mdb |
Microsoft Access 2007, 2010, 2013, 2016 | .accdb |
Microsoft Excel Binary | .xlsb |
Microsoft Excel 1997-2003 | .xls |
Microsoft Excel | .xlsx |
Macro Microsoft Excel activée | .xlsm |
QlikView | .qvx |
SAS | .sas7bdat |
SQLite | .sqlite |
SRC Geography | .geo |
Texte | .txt, .asc |
Zip | .zip |
Les sources de données affichent les sources de données prises en charge et fréquemment utilisées.
- Outils - Si vous sélectionnez connexion rapide pour un outil que vous n’avez pas installé, un navigateur s’ouvre sur la Galerie Alteryx pour vous permettre de télécharger et d'installer cet outil. Lisez attentivement les instructions de la page. Une fois l’outil installé, l’outil Entrée de données change dans l'espace de travail et est remplacé par l’outil que vous avez sélectionné dans l’onglet Sources de données.
- Sources de données
- ODBC lance la fenêtre de connexion ODBC qui affiche une liste filtrée de DSN sur le système qui utilise ce pilote particulier.
- OleDB lance le gestionnaire Windows OleDB natif.
- OCI lance le gestionnaire de connexions Native Oracle OCI. Vous pouvez alors sélectionner le nom du service net tel que défini dans votre fichier tnsnames. ora que vous souhaitez utiliser pour cette connexion, ainsi que les informations d’identification, à savoir le nom d’utilisateur et le mot de passe.
- Bulk ouvre une boîte de dialogue spéciale qui vous permet de configurer une connexion en bloc pour le type de connexion sélectionné.
- Connexion rapide : pour SQL ou Oracle Quick Connect - vous pouvez soit utiliser une connexion enregistrée préexistante, soit créer une nouvelle connexion enregistrée. Pour plus de détails, reportez-vous aux informations suivantes :
- Toutes les autres connexions rapides sont des connexions utilisant un autre outil.
Cliquez sur Connexion rapide sous HDFS pour créer une nouvelle connexion à la base de données Hadoop.
Alteryx se connecte à un système de fichiers distribué Hadoop et lit les fichiers .csv et .avro. Toutes les distributions Hadoop utilisant la norme HDFS sont prises en charge.
Le contenu HDFS peut être lu à l’aide de httpfs (port 14000), webhdfs (port 50070) ou Passerelle Knox (8443). Pour savoir quel service utiliser, consultez votre administrateur Hadoop. Si vous possédez un cluster Hadoop haute disponibilité (HA), votre administrateur Hadoop doit explicitement activer le service httpfs.
Il se peut que MapR ne soit pas compatible avec webhdfs.
Dans la fenêtre Connexion à un HDFS :
- Sélectionnez une configuration de serveur : HTTPFS, WebHDFS ou Knox Gateway.
- Hôte : spécifiez l'instance installée du serveur Hadoop. L’entrée doit être une URL ou une adresse IP.
- Port : affiche le numéro de port par défaut pour httpfs (14000), webhdfs (50070), ou Knox Gateway (8443). Vous pouvez aussi entrer un numéro de port spécifique.
- URL : l'URL par défaut basée sur l'hôte. L’adresse URL peut être modifiée.
- Nom d'utilisateur : selon le programme d'installation du cluster, indiquez le nom d'utilisateur et le mot de passe pour l'accès.
- httpfs : un nom d'utilisateur est nécessaire, mais vous pouvez choisir celui que vous souhaitez.
- webhdfs : le nom d'utilisateur n'est pas nécessaire.
- Passerelle Knox : un nom d'utilisateur et un mot de passe sont nécessaires.
- Kerberos : sélectionnez une option d'authentification Kerberos pour la lecture et l'écriture sur HDFS. L’option que vous choisissez dépend de la manière dont votre administrateur informatique a configuré le serveur HDFS :
- Aucune : aucune authentification n'est utilisée.
- MIT Kerberos : Alteryx utilise le ticket MIT par défaut pour s'authentifier auprès du serveur. Vous devez d’abord acquérir un ticket valide en utilisant le gestionnaire de tickets de Kerberos MIT.
- SSPI Kerberos : Alteryx utilise les clés Kerberos Windows pour l'authentification. Elles sont obtenues lors de la connexion à Windows avec vos informations d'identification Windows. En conséquence, les champs Nom d’utilisateur et Mot de passe ne sont pas disponibles.
- (Recommandé) Cliquez sur Test pour tester la connexion.
- Cliquez sur OK.
- Spécifiez le chemin d'accès du fichier (par exemple, chemin/du/fichier.csv ), ou accédez au fichier et sélectionnez-le.
- Sélectionnez le format de fichier Avro ou CSV et cliquez sur OK.
Les certificats auto-signés ne sont pas pris en charge dans Alteryx. Utilisez un certificat de confiance lors de la configuration de l’authentification Knox.
Pour vous connecter à HDFS pour le traitement dans la base de données, utilisez l' Outil Connecter en BDD.
Vous pouvez également créer une connexion générique ou une connexion 32 bits aux bases de données.
Avant de vous connecter à une base de données, tenez compte des facteurs suivants :
- Les types de connexion ODBC et OleDB prennent tous deux en charge les connexions géographiques. Alteryx détecte automatiquement si une base de données prend en charge la fonctionnalité géographique et affiche les configurations requises.
- Pour vous connecter à une base de données pour le traitement dans la base de données, consultez Vue d’ensemble des outils En base de données.
Pointez le curseur sur une option, puis cliquez sur une connexion de données enregistrée ou partagée pour la connecter ou cliquez sur Gérer pour afficher et modifier des connexions.
Toutes les connexions : affiche une liste des connexions enregistrées sur votre ordinateur, plus les connexions partagées avec une galerie.
Mon ordinateur : affiche une liste des connexions enregistrées sur votre ordinateur.
Gallery : affiche une liste des connexions partagées avec vous à partir d'une galerie.
Ajouter une galerie : ouvre l'écran de connexion Gallery. Servez-vous de votre nom d’utilisateur et de votre mot de passe pour vous connecter. Une fois connecté, retournez à Connexions de données enregistrées et pointez vers la Galerie dans la liste pour afficher les connexions partagées de la Galerie.
Consultez Gérer les connexions de données pour en savoir plus sur la gestion des connexions de données sauvegardées et partagées et sur le dépannage.
Adobe | Adobe Analytics |
Amazon | Amazon Athena |
Amazon Aurora | |
Amazon Redshift | |
Amazon S3 | |
Apache | Cassandra |
Hadoop Distributed File System (HDFS) | |
Hive | |
Spark | |
Cloudera | Impala |
Hadoop Distributed File System (HDFS) | |
Hive | |
Databricks | Databricks |
ESRI | Géodatabase ESRI |
Exasolution | EXASOL |
Google Analytics | |
Google BigQuery | |
Google Sheets | |
Hortonworks | Hadoop Distributed File System (HDFS) |
Hive | |
IBM | IBM DB2 |
IBM Netezza | |
Marketo | Marketo |
MapR | Hadoop Distributed File System (HDFS) |
Hive | |
Microsoft | Microsoft Analytics Platform System |
Microsoft Azure Data Lake Store | |
Entrepôt de données Microsoft Azure SQL | |
Microsoft Azure SQL Database | |
Microsoft Cognitive Services | |
Microsoft Dynamics CRM | |
Microsoft OneDrive | |
Microsoft SharePoint | |
Microsoft SQL Server | |
MongoDB | MongoDB |
MySQL | MySQL |
NetSuite | NetSuite |
Oracle | Oracle |
Pivotal | Pivotal Greenplum |
PostgreSQL | PostgreSQL |
Salesforce | Salesforce |
SAP | SAP Hana |
Snowflake |
|
Teradata | Teradata |
Teradata Aster | |
Vertica | Vertica |
Gallery affiche chaque Galerie et son URL qui a été ajoutée sur l’ordinateur local. Une liste sous chaque nom de galerie contient les connexions enregistrées stockées sur le serveur auquel vous avez accès.
Cliquez sur + Galerie pour ajouter une autre galerie.
Sélectionnez les options de format de fichier. Les options varient en fonction du fichier ou de la base de données auquel vous vous connectez. Voir Options de format de fichier.
Prévisualisez la disposition des données dans la fenêtre Aperçu. L’aperçu de la mise en page des données est limité à 100 enregistrements, ou moins si les fichiers sont volumineux. Si les données contiennent 1500 colonnes, au moins un enregistrement et jusqu’à deux lignes sont affichés. Pour afficher toutes les données, utilisez un Outil Explorateur.
Pour utiliser le mode classique :
- Cliquez sur Options > Paramètres utilisateur > Modifier les paramètres utilisateur.
- Dans l’onglet Valeurs par défaut, cochez la case utiliser le Utiliser le mode classique pour les options de menu des outils d'entrée/sortie.
- Cliquez sur OK.
- Cliquez sur l'espace de travail ou appuyez sur F5 pour actualiser.
Vous pouvez maintenant utiliser le Mode classique de l’outil Entrée de données pour sélectionner vos fichiers et sources de données.