Skip to main content
cancel
Showing results for 
Search instead for 
Did you mean: 

Register now to learn Fabric in free live sessions led by the best Microsoft experts. From Apr 16 to May 9, in English and Spanish.

Reply
Syndicate_Admin
Administrator
Administrator

PC se bloquea al hacer una unión a la izquierda

¡Gday todo!

Esta semana he estado teniendo un problema con una combinación izquierda powerquery.

Tengo 2 tablas, la tabla 1 contiene un id que se corresponde con un id único en la tabla 2.

Ahora quiero unir sólo 1 columna en la tabla 1 que existe en la tabla 2.

Ambos flujos de datos son de aproximadamente 500 MB cada uno.

Pero cuando me uno a ellos, todos mis 32GB de memoria se comen en como 1 minuto, lo que resulta en básicamente estrellar todo mi sistema.

¿Alguien tiene alguna idea de cómo podría ser esto? (He eliminado los valores nulos de ambas columnas id, por lo que a lo sumo, debería ser una relación de 1 a muchos).

1 ACCEPTED SOLUTION

Ahh bien La fusión no es unirse. ahora entiendo y seguro que es un problema de tamaño que estás enfrentando.

View solution in original post

19 REPLIES 19
Syndicate_Admin
Administrator
Administrator

No @decarsul

Está intentando conectar 2 Dataflows con 500MB cada uno, correcto? bueno, eso es un 1GB de datos para un conjunto de datos que no es posible para un conjunto de datos.

aj1973_0-1622738566252.png

Su sistema debe haber sabido la verdad jajaja.

Y también,

¿Esto se aplica solo al espacio de trabajo en línea o también al cliente de escritorio?

Respondiendo a todas sus 3 preguntas:

  1. Los límites cuentan para las licencias gratuitas y Pro
  2. El tamaño de 10 GB es el límite para un área de trabajo, no para un conjunto de datos. un área de trabajo puede contener muchos conjuntos de datos, un conjunto de datos no puede tener un tamaño superior a 1 GB, el tamaño de todos los conjuntos de datos no puede superar los 10 GB en un área de trabajo
  3. Misma respuesta que la pregunta 2

Que esto es más probable que mi problema, porque los flujos de datos combinados brutos a cabo más de 1 GB.

Pero, ¿por qué entonces esto no da una advertencia o un error? Pero en su lugar se 'atasca' en un bucle de clases y se come todos los recursos del sistema a un punto que ya no puede funcionar?

No tengo una respuesta a esta pregunta, podría estar relacionada con muchas cosas.

Pero sé con certeza que se puede trabajar en su conjunto de datos y / o sus flujos de datos para obtener lo que necesita.

Sé que también puede. Por ahora he agregado un filtro antes de unirme, para que no cargue en 10 años de datos, sino que cargue en los últimos 2 trimestres, lo que efectivamente hace que el conjunto de datos sea más pequeño.

Para eso puede usar paramaters o si tiene licencia premium, puede usar la actualización incremental en sus flujos de datos.

La cuestión está ahí y está clara. reduzca el tamaño de sus flujos de datos o muévase a la capacidad Premium y todo será bueno.

Para continuar con mi pregunta. Estoy preguntando por este post hecho en 2018.

De acuerdo con esto, puedo usar y cargar hasta 10GB

decarsul_0-1622786831641.png

Hola Amina,

hmmm . . . bueno, eso <inserta la palabra cuss aquí> . . .

Me gustaría que me daría una advertencia o algo así, en lugar de bloquear completamente mi sistema tho.

oh btw, hace este límite cuenta sólo para usuarios libres, o también para pro usuarios?

Porque yo soy el último.

Syndicate_Admin
Administrator
Administrator

Intente hacerlo en el servicio Power BI o a través de flujos de datos de Power BI en caso de que tenga una capacidad Premium o una licencia Pro. Eso puede reducir el uso de la memoria.

Otras opciones serían filtrar las tablas por algunos criterios/rango y luego anexarlas. No es eficiente, pero sigue siendo una solución.

La fuente de datos son flujos de datos PowerBI en un entorno premium. Y tengo una licencia profesional.

Sí... i Ya skimmed tanto como i podría, este crashing es también la razón i soy sólo intentando a la izquierda unir 1 columnn en vez de 8 (cuál es el bare mínimo i necesidad).

Ill intente exportar los flujos de datos a 2 archivos csv y vea i si puede unirse a ellos de esa manera. Si eso funcionaría, debería apuntar a un problema dentro del DataFlow, ¿no?

Si está intentando unir los flujos de datos en el escritorio, seguirá consumiendo la memoria del sistema. Intente unirse a ellos en el servicio Power BI en Obtener datos.

La exportación de los CSV puede funcionar, pero aún así, si tienen un tamaño considerable, es probable que se bloqueen de nuevo.

Otra cosa que podría funcionar podría ser crear un nuevo flujo de datos que se una a los otros 2 flujos de datos, puede usar el concepto de entidades vinculadas ya que tiene un entorno Premium.

Sí i soy consciente toma recursos de sistema, pero i no ve cómo un 2x 500Mb puede comer arriba de 32Gb de ram. Realmente solo estoy 'agregando' 1 columna con un código postal.

Sí, puedo intentar unirlos en el flujo de datos en el entorno premium. A ver si eso funciona.

Lo siento, no consemecí su escenario! Tiene 2 flujos de datos, llama a estos flujos de datos a su escritorio y elige diferentes entidades de estos 2 flujos de datos. ¿En su modelo intenta unir (relación) 2 entidades de esos 2 flujos de datos y su sistema se bloquea?

¿Es este su problema?

Hago la combinación izquierda desde PowerQuery, no desde DAX relationmanager si eso es lo que quiere decir.

Lo sentimos, pero ¿por qué usar PowerQuery para unirse? Power Query es bueno para ETL (extracción, transformación y carga). El modelado (combinaciones y relaciones) se realiza en Power Bi Desktop y DAX.

Tal vez no estamos entendiendo. Yo geuss una mejor traducción sería 'fusión'?

La razón por la que lo estoy haciendo en Powerquery es para que no tenga que cargar la tabla que contiene más datos de los que necesito para el modelo. Pero lo necesito para crear un identificador único para poder hacer una relación con otra tabla.

Ahh bien La fusión no es unirse. ahora entiendo y seguro que es un problema de tamaño que estás enfrentando.

Helpful resources

Announcements
Microsoft Fabric Learn Together

Microsoft Fabric Learn Together

Covering the world! 9:00-10:30 AM Sydney, 4:00-5:30 PM CET (Paris/Berlin), 7:00-8:30 PM Mexico City

PBI_APRIL_CAROUSEL1

Power BI Monthly Update - April 2024

Check out the April 2024 Power BI update to learn about new features.

April Fabric Community Update

Fabric Community Update - April 2024

Find out what's new and trending in the Fabric Community.