Register now to learn Fabric in free live sessions led by the best Microsoft experts. From Apr 16 to May 9, in English and Spanish.
Hola, tengo 3 problemas con respecto a la limpieza de datos.
1. "Fecha de inicio" contiene una presentación diferente en el tipo de datos de texto en Power Query. Algunos están en formato mes, dd/mm/aa y valor en blanco. ¿Cómo debo procesar esta columna y luego convertirla al tipo de datos Date?
2. Para la columna "Salario bruto". He quitado algunas filas con "Rm" delante del valor numérico usando la función Reemplazar valor en Power Query, luego uso la función Reemplazar valor para reemplazar algunas filas con "," a no ",". Por ejemplo, reemplace de 2,700 a 2700 (¿cómo es que la cosa es demasiado manual ya que necesito identificar el valor a procesar, de alguna manera puede permitir que Power Query elimine todo "," en la columna "Salario bruto" automáticamente?
Luego también hay pocas filas con espacio entre el primer y segundo dígito. Utilizo el formato > recortar en toda la columna. Luego hago clic en el encabezado en Power Query para cambiar el tipo de datos de Texto a Número entero. Sin embargo, parece un comportamiento extraño como el siguiente.
¿Qué he hecho mal?
3. En la columna "Fecha de graduación", además de tener el problema mencionado en la Pregunta 1, también hay datos de prueba y diferente formato de fecha. Por ejemplo, la mayoría de ellos están en dd/mm/aaaa (31/8/2021) y mm/dd/aaaa (26/08/2020). ¿Debo realizar la limpieza de datos directamente en Excel y luego importarlos a Power BI?
Es un poco largo, pero espero aprender de esta práctica.
Aquí está el enlace de mis datos de muestra:
Solved! Go to Solution.
Hola
A continuación la respuesta a la pregunta 2 integro el salario bruto sin error.
let
Source = Excel.Workbook(File.Contents("xxx\Testing.xlsx"), null, true),
Approved_Sheet = Source{[Item="Approved",Kind="Sheet"]}[Data],
#"Promoted Headers" = Table.PromoteHeaders(Approved_Sheet, [PromoteAllScalars=true]),
#"Changed Type1" = Table.TransformColumnTypes(#"Promoted Headers",{{"GROSS SALARY", type text}}),
#"Cleaned Text" = Table.TransformColumns(#"Changed Type1",{{"GROSS SALARY", Text.Clean, type text}}),
#"Trimmed Text" = Table.TransformColumns(#"Cleaned Text",{{"GROSS SALARY", Text.Trim, type text}}),
#"Replaced Value" = Table.ReplaceValue(#"Trimmed Text","Rm ","",Replacer.ReplaceText,{"GROSS SALARY"}),
#"Replaced Value1" = Table.ReplaceValue(#"Replaced Value",",","",Replacer.ReplaceText,{"GROSS SALARY"}),
#"Changed Type" = Table.TransformColumnTypes(#"Replaced Value1",{{"COMMENCEMENT DATE", type date}, {"GROSS SALARY", Int64.Type}, {"GRADUATION DATE", type any}, {"Column4", type any}})
in
#"Changed Type"
Sobre las fechas será más fácil si tienes el mismo formato en la columna
Hola
A continuación la respuesta a la pregunta 2 integro el salario bruto sin error.
let
Source = Excel.Workbook(File.Contents("xxx\Testing.xlsx"), null, true),
Approved_Sheet = Source{[Item="Approved",Kind="Sheet"]}[Data],
#"Promoted Headers" = Table.PromoteHeaders(Approved_Sheet, [PromoteAllScalars=true]),
#"Changed Type1" = Table.TransformColumnTypes(#"Promoted Headers",{{"GROSS SALARY", type text}}),
#"Cleaned Text" = Table.TransformColumns(#"Changed Type1",{{"GROSS SALARY", Text.Clean, type text}}),
#"Trimmed Text" = Table.TransformColumns(#"Cleaned Text",{{"GROSS SALARY", Text.Trim, type text}}),
#"Replaced Value" = Table.ReplaceValue(#"Trimmed Text","Rm ","",Replacer.ReplaceText,{"GROSS SALARY"}),
#"Replaced Value1" = Table.ReplaceValue(#"Replaced Value",",","",Replacer.ReplaceText,{"GROSS SALARY"}),
#"Changed Type" = Table.TransformColumnTypes(#"Replaced Value1",{{"COMMENCEMENT DATE", type date}, {"GROSS SALARY", Int64.Type}, {"GRADUATION DATE", type any}, {"Column4", type any}})
in
#"Changed Type"
Sobre las fechas será más fácil si tienes el mismo formato en la columna
Covering the world! 9:00-10:30 AM Sydney, 4:00-5:30 PM CET (Paris/Berlin), 7:00-8:30 PM Mexico City
Check out the April 2024 Power BI update to learn about new features.
User | Count |
---|---|
1 | |
1 | |
1 | |
1 | |
1 |