Google BigQuery
Tipo de soporte: | Leer y escribir |
Validado en: | -- |
Tipo de conexión: | Herramienta Alteryx |
Detalles del conductor: | La acción de administrador en la plataforma de Google Cloud puede ser necesaria antes de configurar una conexión en el Alteryx Google BigQuery Herramientas. |
Herramientas Alteryx utilizadas para conectar
Utiliza Herramienta de Entrada de Google BigQuery para consultar una tabla desde Google BigQuery y leerlo en Designer. Consulta Google BigQuery para obtener información sobre las limitaciones conocidas. Más información sobre Google BigQuery puede encontrarse en el Documentación de Google Big Query sitio web.
Herramienta Galería
Esta herramienta no se instala automáticamente con Designer. Para utilizar esta herramienta, descárgala de Alteryx Analytics Gallery.
Puedes iniciar sesión en Google BigQuery con credenciales de servicio a servicio o de usuario final.
Puedes obtener un archivo de clave JSON de la cuenta de servicio desde la Consola de Google Cloud o puedes crear una nueva clave para una cuenta de servicio existente. Más información sobre Google BigQuery puede encontrarse en el Documentación de Google Big Query sitio web en Creación y administración de claves de cuenta de servicio.
- En el modo de Autenticación, selecciona Servicio a servicio.
- Haz clic en Seleccionar un archivo para seleccionar el archivo de cuenta de servicio de Google.
- En Abrir archivo, busca y selecciona el archivo JSON que contiene tu clave de cuenta de servicio de Google.
- En el modo de Autenticación, selecciona Usuario final.
- Ingresa tu ID de cliente y Secreto de cliente.
- Haz clic en Iniciar sesión.
- En Iniciar sesión con Google, ingresa tu correo electrónico y contraseña de Google y haz clic en Permitir para aprobar el permiso del conector para acceder Google BigQuery en tu nombre.
- Haz clic en Siguiente.
- En la Configuración de entrada de tabla BigQuery, haz clic en Seleccionar tabla.
Designer muestra las tablas a las que tienes acceso.
- Selecciona un proyecto, expande un DataSet y, a continuación, selecciona una tabla BigQuery. Una vez que selecciones una tabla, Designer, mostrará el identificador completamente calificado de la tabla. Para actualizar los metadatos, haz clic en el icono Actualizar.Haz clic en Cambiar tabla para seleccionar una tabla diferente
-
Selecciona opciones.
- Limitar la cantidad de resultados que se devuelven: establece el número de filas del informe que se devolverá.
- Utilizar una consulta personalizada: Seleccionar un tipo SQL y, a continuación, Seleccionar un proyecto para consultarlo. Ingresa tu consulta personalizada incluida cualquier cláusula LIMIT.
- Deducir límite máximo registro repetido: no disponible con consulta personalizada. Selecciona esta opción y, a continuación, indica una longitud de campo máxima para establecer el límite de registro repetido al número máximo de registros repetidos en los resultados devueltos de tu Google BigQuery tabla. Si limitas el número de registros, luego Designer solo inspeccionará ese conjunto de registros para deducir el límite de registro repetido máximo.
- Ejecuta el flujo de trabajo.
Utiliza Herramienta Salida de Google BigQuery para escribir datos de Designer a tablas en Google BigQuery. Consulta Google BigQuery para obtener información sobre las limitaciones conocidas. Más información sobre Google BigQuery puede encontrarse en el Documentación de Google Big Query sitio web.
Herramienta Galería
Esta herramienta no se instala automáticamente con Designer. Para utilizar esta herramienta, descárgala de Alteryx Analytics Gallery.
Puedes iniciar sesión en Google BigQuery con credenciales de servicio a servicio o de usuario final.
Puedes obtener un archivo de clave JSON de la cuenta de servicio desde la Consola de Google Cloud o puedes crear una nueva clave para una cuenta de servicio existente. Más información sobre Google BigQuery puede encontrarse en el Documentación de Google Big Query sitio web en Creación y administración de claves de cuenta de servicio.
- En el modo de Autenticación, selecciona Servicio a servicio.
- Haz clic en Seleccionar un archivo para seleccionar el archivo de cuenta de servicio de Google.
- En Abrir archivo, busca y selecciona el archivo JSON que contiene tu clave de cuenta de servicio de Google.
- En el modo de Autenticación, selecciona Usuario final.
- Ingresa tu ID de cliente y Secreto de cliente.
- Haz clic en Iniciar sesión.
- En Iniciar sesión con Google, ingresa tu correo electrónico y contraseña de Google y haz clic en Permitir para aprobar el permiso del conector para acceder Google BigQuery en tu nombre.
- Haz clic en Siguiente.
- En la Configuración de entrada de tabla BigQuery, haz clic en Seleccionar tabla.
- Selecciona un proyecto, expande un DataSet y, a continuación, selecciona una tabla BigQuery. Designer muestra las tablas a las que tienes acceso. Para actualizar los metadatos, haz clic en el icono Actualizar.Una vez que selecciones una tabla, Designer, mostrará el identificador completamente calificado de la tabla. Haz clic en Cambiar tabla para seleccionar una tabla diferente
-
En Insertar tamaño de lote, selecciona un tamaño de lote. Este número especifica el número de filas que se escribirán en la Google BigQuery Tabla en cada llamada a la API de inserción. Google establece límites en el número de solicitudes de API por segundo, el número de filas que se pueden insertar por segundo y por solicitud, el tamaño de las filas que se insertan y el tamaño de las solicitudes HTTP.
Puedes encontrar más información sobre límites y cuotas en el sitio de Documentación de cuotas y límites de Google BigQuery. También puede revisar los Datos de streaming en la documentación de BigQuery para entender cómo se insertarán los datos en la Google BigQuery tabla.
- Ejecutar el flujo de trabajo
Autenticación y permisos
Comunícate con tu administrador de Google Cloud para obtener ayuda con tus Google BigQuery credenciales.
Configuración de autenticación de servicio a servicio
Puedes obtener un archivo de clave JSON de la cuenta de servicio desde la Consola de Google Cloud o puedes crear una nueva clave para una cuenta de servicio existente. Más información sobre Google BigQuery puede encontrarse en el Documentación de Google Big Query sitio web en Creación y administración de claves de cuenta de servicio.
Configuración de autenticación de usuario final
Obtenga un identificador de cliente OAuth y secreto de la página credenciales de la consola de Google Cloud. Asegúrese de que el tipo de cliente está establecido en otro.
Permisos de acceso
Permisos para leer y escribir datos dentro de un Google BigQuery la cuenta de servicio del proyecto debe concederse mediante la consola de Google Cloud. Puede encontrar más información sobre los permisos en el Documentación de Google Big Query Sitio.
Limitaciones conocidas
Float BigQuery Fields
los campos de tipo float de una tabla BigQuery se promueven automáticamente a tipos dobles en el motor Alteryx. Por lo tanto, usted puede ver decimales adicionales en los valores de entrada y luego la salida de nuevo a Google BigQuery.
Profundidad de registro anidada, repetida máxima
Los registros anidados y repetidos se admiten a una profundidad de un nivel. No se admiten los registros de repates siguientes que se anidan más de un nivel de profundidad. Puede encontrar más información sobre registros anidados y repetidos en el sitio de documentación de Google BigQuery .
Aplanado de registros anidado y repetido
Al tirar de registros anidados o repetidos de un Google BigQuery tabla, el flujo de trabajo Alteryx aplanará los registros siguientes y/o repetidos de acuerdo con el siguiente esquema de nomenclatura:
Un nested_attr de registro anidado de la columna de nivel superior top_attr creará una nueva columna denominada nr_top_attr_nexted_attr.
Al empujar registros desde el flujo de trabajo Alteryx a un Google BigQuery tabla, la necesidad de plegar los campos de registro en registros anidados y/o repetidos se especifica al cambiar el nombre de los campos de registro que fluyen al conector de salida para seguir estas convenciones de nomenclatura.
Un nested_attr de registro que debe anidarse en la columna de nivel superior top_attr debe renombrarse a nr_top_attr_nested_attr.
Un nested_attr de registro que debe anidarse y repetir un número arbitrario de veces bajo la columna de nivel superior top_attr debe renombrarse a nrr_top_attr_ {repetition_index} _nested_attr. Todas las repeticiones que contienen todos los valores nulos en los campos anidados se eliminan antes de la llamada a la API para insertar nuevas filas en el Google BigQuery tabla esto implica que los registros en el flujo de trabajo del diseñador pueden tener un número arbitrario de repeticiones máximas, y no todos los registros deben tener el mismo número de repeticiones.
Esquemas de conectores de salida
Los nombres de campo y los tipos pasados al Herramienta Salida de Google BigQuery debe coincidir con los del destino Google BigQuery tabla. Las columnas que existen en el Google BigQuery la tabla, pero no existe en la lista de campos de flujo de trabajo producirá valores nulos para esas columnas en los registros insertados. Esto causará un error en el caso de que la columna de destino no esté configurada como Nullable.
Indicador de progreso de entrada
En el caso de que haya filas en el búfer de streaming para la tabla seleccionada de una herramienta de entrada sin una consulta personalizada, la herramienta de entrada usará el número estimado de filas en el búfer de streaming reportado por Google mientras actualiza el porcentaje del indicador de progreso en un flujo de trabajo en ejecución. Si la estimación de Google es incorrecta, entonces el valor reportado en el indicador de progreso podría ser incorrecto también.
En el caso de que la tabla consultada esté vacía y el búfer de streaming para esa tabla no esté vacío, entonces es posible que Google estime el número de filas en el búfer de streaming como cero. Sin embargo, Google todavía puede devolver filas desde el búfer de streaming. Cuando esto suceda, no verá la actualización porcentual del indicador de progreso y se mostrará una advertencia.