Register now to learn Fabric in free live sessions led by the best Microsoft experts. From Apr 16 to May 9, in English and Spanish.
Estoy trabajando con más de 30 millones de filas de datos, cargando desde azure data lake gen 2. Está cargando 160 archivos csv en total y he utilizado filas #"filtradas en la consulta de energía para filtrar filas que no son necesarias. Además, he eliminado columnas no necesarias también. Las filas finales que deberían cargarse serían menos de un millón de filas.
Sin embargo, mi carga de datos se cargaba durante más de 2 horas y alrededor de 12 GB. Parece que todavía se está cargando, pero esperé más de media hora y no pasó de 12 GB. Probó muchas maneras diferentes unas cuantas veces y cada vez es lo mismo, no pasó de 10-12 GB.
parece que el filtro de datos escrito en la consulta de energía no se aplica en el origen antes de cargarse en power bi. Se siente como que power bi está cargando los datos completos antes de filtrar.
Tener búsqueda y encontrar la mayoría de las respuestas están en el uso de consulta avanzada para SQL. ¿Algún consejo sobre cómo solucionar esto con Azure Data Lake Gen 2?
Power BI puede aplicar filtros a la lista obtenida por la opción Vista del sistema de archivos, restringiendo así el acceso solo a los archivos que le interesen. Sin embargo, cada vez que actualiza el origen de datos, la lista de todos estos archivos es leída por Power Query. Una mejor manera de administrar el proceso es obtener la ruta exacta del archivo.
Para obtener más información, consulte Optimización del acceso a Azure Data Lake Storage (ADLS) Gen 2 en Power Query
Si puede utilizar Dremio, el modo consulta directa es una buena manera. Data Lake Analytics con Dremio y Power BI en ADLS Gen2
Si el problema aún no se ha resuelto, proporcione información detallada sobre errores o el resultado esperado que espera. Hágamelo saber inmediatamente, esperando su respuesta.
Saludos
Winniz
Si esta publicación ayuda, considere Aceptarla como la solución para ayudar a los demás miembros a encontrarla más rápidamente.
Covering the world! 9:00-10:30 AM Sydney, 4:00-5:30 PM CET (Paris/Berlin), 7:00-8:30 PM Mexico City
Check out the April 2024 Power BI update to learn about new features.
User | Count |
---|---|
2 | |
1 | |
1 | |
1 | |
1 |
User | Count |
---|---|
2 | |
2 | |
2 | |
1 | |
1 |