Skip to main content
cancel
Showing results for 
Search instead for 
Did you mean: 

Earn a 50% discount on the DP-600 certification exam by completing the Fabric 30 Days to Learn It challenge.

Reply
Syndicate_Admin
Administrator
Administrator

¿Técnicas de reducción de datos para columnas de texto de alta cardinalidad?

Tengo algunas columnas en diferentes tablas que ocupan MUCHO espacio. Una columna consume específicamente más del 40% del tamaño de nuestro modelo de datos.

Sé que los métodos típicos de reducción de datos son:

- Elimina las columnas que no necesitas

- Elimina las filas que no necesitas

- Convertir tipos de datos en valores numéricos cuando sea posible

Necesito estas columnas, ya he reducido el número de filas tanto como puedo, y los tipos de datos para estas columnas son texto porque los valores están en este formato: "a36be-f3c5-d293f93da2-f03df-a49f".

La alta cardinalidad de los datos para estas columnas está haciendo estallar el tamaño de nuestro modelo. ¿Cuál sería la mejor manera de reducir el tamaño de nuestros datos sin eliminar los datos de nuestro modelo por completo?

1 REPLY 1
Syndicate_Admin
Administrator
Administrator

No puede aplicar técnicas como la separación de partes de fecha y hora a los GUID. Los GUID por su propia naturaleza tienen que tener una alta cardinalidad. En teoría, podría reemplazar el GUID con una columna de índice entero, pero eso solo reduciría las necesidades de almacenamiento, no la cardinalidad.

Helpful resources

Announcements
LearnSurvey

Fabric certifications survey

Certification feedback opportunity for the community.

PBI_APRIL_CAROUSEL1

Power BI Monthly Update - April 2024

Check out the April 2024 Power BI update to learn about new features.

April Fabric Community Update

Fabric Community Update - April 2024

Find out what's new and trending in the Fabric Community.