Skip to main content
cancel
Showing results for 
Search instead for 
Did you mean: 

Register now to learn Fabric in free live sessions led by the best Microsoft experts. From Apr 16 to May 9, in English and Spanish.

Reply
Syndicate_Admin
Administrator
Administrator

Problema de limpieza de datos

Hola, tengo 3 problemas con respecto a la limpieza de datos.

1. "Fecha de inicio" contiene una presentación diferente en el tipo de datos de texto en Power Query. Algunos están en formato mes, dd/mm/aa y valor en blanco. ¿Cómo debo procesar esta columna y luego convertirla al tipo de datos Date?

alvin199_0-1641914126384.png

2. Para la columna "Salario bruto". He quitado algunas filas con "Rm" delante del valor numérico usando la función Reemplazar valor en Power Query, luego uso la función Reemplazar valor para reemplazar algunas filas con "," a no ",". Por ejemplo, reemplace de 2,700 a 2700 (¿cómo es que la cosa es demasiado manual ya que necesito identificar el valor a procesar, de alguna manera puede permitir que Power Query elimine todo "," en la columna "Salario bruto" automáticamente?

Luego también hay pocas filas con espacio entre el primer y segundo dígito. Utilizo el formato > recortar en toda la columna. Luego hago clic en el encabezado en Power Query para cambiar el tipo de datos de Texto a Número entero. Sin embargo, parece un comportamiento extraño como el siguiente.

alvin199_1-1641914860451.png

¿Qué he hecho mal?

3. En la columna "Fecha de graduación", además de tener el problema mencionado en la Pregunta 1, también hay datos de prueba y diferente formato de fecha. Por ejemplo, la mayoría de ellos están en dd/mm/aaaa (31/8/2021) y mm/dd/aaaa (26/08/2020). ¿Debo realizar la limpieza de datos directamente en Excel y luego importarlos a Power BI?

alvin199_2-1641914957492.png

Es un poco largo, pero espero aprender de esta práctica.

Aquí está el enlace de mis datos de muestra:

https://docs.google.com/spreadsheets/d/1zUEhJhlGjT0jUOxRiDcPVizpVAMTV702/edit?usp=sharing&ouid=10837...

1 ACCEPTED SOLUTION
Syndicate_Admin
Administrator
Administrator

Hola

A continuación la respuesta a la pregunta 2 integro el salario bruto sin error.

let
    Source = Excel.Workbook(File.Contents("xxx\Testing.xlsx"), null, true),
    Approved_Sheet = Source{[Item="Approved",Kind="Sheet"]}[Data],
    #"Promoted Headers" = Table.PromoteHeaders(Approved_Sheet, [PromoteAllScalars=true]),
    #"Changed Type1" = Table.TransformColumnTypes(#"Promoted Headers",{{"GROSS SALARY", type text}}),
    #"Cleaned Text" = Table.TransformColumns(#"Changed Type1",{{"GROSS SALARY", Text.Clean, type text}}),
    #"Trimmed Text" = Table.TransformColumns(#"Cleaned Text",{{"GROSS SALARY", Text.Trim, type text}}),
    #"Replaced Value" = Table.ReplaceValue(#"Trimmed Text","Rm ","",Replacer.ReplaceText,{"GROSS SALARY"}),
    #"Replaced Value1" = Table.ReplaceValue(#"Replaced Value",",","",Replacer.ReplaceText,{"GROSS SALARY"}),
    #"Changed Type" = Table.TransformColumnTypes(#"Replaced Value1",{{"COMMENCEMENT DATE", type date}, {"GROSS SALARY", Int64.Type}, {"GRADUATION DATE", type any}, {"Column4", type any}})
in
    #"Changed Type"

Sobre las fechas será más fácil si tienes el mismo formato en la columna

View solution in original post

1 REPLY 1
Syndicate_Admin
Administrator
Administrator

Hola

A continuación la respuesta a la pregunta 2 integro el salario bruto sin error.

let
    Source = Excel.Workbook(File.Contents("xxx\Testing.xlsx"), null, true),
    Approved_Sheet = Source{[Item="Approved",Kind="Sheet"]}[Data],
    #"Promoted Headers" = Table.PromoteHeaders(Approved_Sheet, [PromoteAllScalars=true]),
    #"Changed Type1" = Table.TransformColumnTypes(#"Promoted Headers",{{"GROSS SALARY", type text}}),
    #"Cleaned Text" = Table.TransformColumns(#"Changed Type1",{{"GROSS SALARY", Text.Clean, type text}}),
    #"Trimmed Text" = Table.TransformColumns(#"Cleaned Text",{{"GROSS SALARY", Text.Trim, type text}}),
    #"Replaced Value" = Table.ReplaceValue(#"Trimmed Text","Rm ","",Replacer.ReplaceText,{"GROSS SALARY"}),
    #"Replaced Value1" = Table.ReplaceValue(#"Replaced Value",",","",Replacer.ReplaceText,{"GROSS SALARY"}),
    #"Changed Type" = Table.TransformColumnTypes(#"Replaced Value1",{{"COMMENCEMENT DATE", type date}, {"GROSS SALARY", Int64.Type}, {"GRADUATION DATE", type any}, {"Column4", type any}})
in
    #"Changed Type"

Sobre las fechas será más fácil si tienes el mismo formato en la columna

Helpful resources

Announcements
Microsoft Fabric Learn Together

Microsoft Fabric Learn Together

Covering the world! 9:00-10:30 AM Sydney, 4:00-5:30 PM CET (Paris/Berlin), 7:00-8:30 PM Mexico City

PBI_APRIL_CAROUSEL1

Power BI Monthly Update - April 2024

Check out the April 2024 Power BI update to learn about new features.

April Fabric Community Update

Fabric Community Update - April 2024

Find out what's new and trending in the Fabric Community.