Earn the coveted Fabric Analytics Engineer certification. 100% off your exam for a limited time only!
Hola a todos,
Ok, así que he estado trabajando con un conjunto de datos de producción de O&G que trae mucha información como nombre o identificación, empresa, área donde está el pozo, y por supuesto la producción de petróleo y gas de cada pozo cada mes.
Así que tengo 2 preguntas principales,
1) Cuando subo todos estos archivos a mi BI el tamaño inicial es de alrededor de 130 mb ¿Debo sentirme bien con este tamaño? O tan pronto como empiezo a trabajar con él la herramienta va a ser demasiado lento?
2) Con el fin de hacer un mejor informe y evitar hacer demasiados gráficos quiero ser capaz de filtrar la evolución de la producción de aceite por cliente o por nombre de área o cualquier otro campo que sea valioso para ver la evolución de la producción. Así que para hacer esto siempre hago un índice en mi base de datos original y luego lo duplico y despvoro con los campos que quiero pero esto hacen que el tamaño vaya a más de 300 mb ¿Hay otra mejor manera de hacer esto?
3) Finalmente quiero crear una columna costum que me agregue la primera vez que aparezca un pozo en la base de datos ¿Cómo podría hacer esto? Sé cómo hacerlo con Calcular en una columna de cálculo, pero quiero que esté en mi base de datos para poder despivo y tener este campo.
If anyone is interested all the production files are public in this site ("Producción de Pozos de Gas y Petroleo - 2020" ,"-2019",etc)
Gracias
@ignaciompa - Miré sus archivos CSV, ¿puede publicar sus archivos PBIX? No veo por qué estás despopilando nada, pero puede que no entienda completamente lo que estás tratando de lograr. Pero a primera vista, no sé por qué despitaste nada en comparación con solo usar segmentaciones de datos o construirte un esquema de estrella con tu tabla de hechos exactamente como lo son los archivos CSV.
Gracias @Greg_Deckler por sus respuestas, en el siguiente ENLACE encontrará mi archivo PBIX.
1. Verás que hay 2 páginas "Produccion General Unpivot" y "Producción General" la idea de hacer el despivo es poder ver la evolución de la producción de petróleo por "cuenca" o por "sub_tipo_recurso" en 1 gráfico y no como verás en la otra página que tienes que crear un gráfico para cada cosa.
2. El principal problema que tengo con el archivo de 380 mb es que donde trabajo los servidores no permiten archivos de más de 250mb jaja Así que necesito mantenerlo por debajo de 250 mb de tamaño.
Gracias
Hola, @ignaciompa
He cargado el informe que compartió en un área de trabajo con una capacidad dedicada. Aunque la carga del informe es lenta, todo se está ejecutando normalmente. No tengo claro lo que quieres decir con limitación del tamaño de más de 250 mb.
Si realmente es causado por el gran conjunto de datos importado, ¿ha considerado almacenar parte de los orígenes de datos en la base de datos y, a continuación, crear informes en modo directquery en lugar del modo de importación?
Saludos
Equipo de soporte de la comunidad _ Eason
Supongamos que desea mantener ambas tablas (unpivoted y pivoted). Estos son los dos mayores contribuyentes al tamaño del archivo, en gran parte debido al índice utilizado para vincularlos. Además de eliminar una de estas dos tablas directamente - no es probable que vaya a caer el archivo por debajo de 250MB.
Algunas prácticas recomendadas a considerar:
1. Filtre los datos antes de guardar el archivo en el servidor. Después de cargar en el servicio (que puede aceptar hasta 1 GB de tamaño de archivo en capacidad Pro) - filtre el PBIX subyacente hacia abajo modificando las consultas. Tendrás que recordar deshacer esto antes de volver a publicarlo, pero es una forma rápida de reducir el tamaño del archivo.
2. Configure la actualización incremental en las tablas de archivado. Esto reducirá la cantidad de datos que realmente se importan en el archivo PBIX (con la mayor parte de la importación sucediendo en el servicio). Una vez habilitado: querrá tener cuidado de no 'sobrescribir' el conjunto de datos en la nube cada vez que intente volver a publicar los cambios de informe.
@ignaciompa: para 1, 130 MB no es tan grande en términos de Power BI. El rendimiento se basa en gran medida en la eficacidad de su modelo de datos y las medidas. Tendré que echar un vistazo más de cerca por el resto.