Skip to main content
cancel
Showing results for 
Search instead for 
Did you mean: 

Register now to learn Fabric in free live sessions led by the best Microsoft experts. From Apr 16 to May 9, in English and Spanish.

Reply
Pandadev
Post Prodigy
Post Prodigy

Importación de pdf table desde url web usando Python , pero no se almacena como marco de datos en PowerBI

Hola estoy tratando de importar una tabla pdf a PowerBI. de - https://www.caas.gov.sg/docs/default-source/pdf/singapore-registered-aircraft-engine-nos---apr-2020d...

Soy nuevo tanto en PowerBI como en Python, pero de la investigación logró que este código funcionara

importa tabula
Archivo "https://www.caas.gov.sg/docs/default-source/pdf/singapore-registered-aircraft-engine-nos---apr-2020d..."
tablas: tabula.read_pdf(archivo, páginas á "todos", multiple_tables a True)

pero por alguna razón no se muestra como una tabla en PowerBI, a pesar de que no se informa de errores

1 ACCEPTED SOLUTION

No @Pandadev ,

Puede usar Python para obtener la tabla en PDF y exportar la tabla y, a continuación, seleccionar el conector adecuado en power Bi para conectar el archivo de exportación.

http://theautomatic.net/2019/05/24/3-ways-to-scrape-tables-from-pdfs-with-python/

Saludos
Liang
Si esta publicación ayuda, entonces por favor considere Aceptarlo como la solución para ayudar a los otros miembros a encontrarlo más rápidamente.

View solution in original post

7 REPLIES 7

Hola @Pandadev ,

¿por qué no usa Power BI PDF Connector?

https://docs.microsoft.com/en-us/power-bi/connect-data/desktop-connect-pdf

Did I answer your question?
Please mark my post as solution, this will also help others.
Please give Kudos for support.

Marcus Wegener works as Full Stack Power BI Engineer at BI or DIE.
His mission is clear: "Get the most out of data, with Power BI."
twitter - LinkedIn - YouTube - website - podcast


Gracias, sí que funciona bien para este pdf, pero cuando importo un pdf donde sólo quiero ciertas tablas, ¿cómo puedo combinar todas esas tablas seleccionadas en una tabla. todas las tablas seleccionadas tendrán la misma estructura, orden de columnas, etc.

Hola @Pandadev ,

Basado en su descripción. Puede obtener este archivo PDF utilizando el conector web.

let
    Source = Pdf.Tables(Web.Contents("https://www.caas.gov.sg/docs/default-source/pdf/singapore-registered-aircraft-engine-nos---apr-2020d1324ca0a72f4d42bd40c25673b42c82.pdf-is-not/td-p/1121450"), [Implementation="1.1"]),
    Table001 = Source{[Id="Table001"]}[Data],
    #"Promoted Headers" = Table.PromoteHeaders(Table001, [PromoteAllScalars=true]),
    #"Changed Type" = Table.TransformColumnTypes(#"Promoted Headers",{{"NO.", Int64.Type}, {"TYPE", type text}, {"REG", type text}, {"OPERATOR", type text}, {"ENGINE TYPE", type text}})
in
    #"Changed Type"

test_ger_pdf.PNG

Utilice consultas de anexar para anexar más tablas.

append.PNG

Saludos
Liang
Si este post ayuda, por favor considere Aceptarlo como la solución para ayudar a los otros miembros a encontrarlo más rápidamente.

Gracias , aquí hay un ejemplo donde sólo necesito tablas seleccionadas del pdf - http://inaca.or.id/wp-content/uploads/2019/07/CAR19.pdf

donde los encabezados de columna son los mismos que a continuación, ¿es esto posibleindonesian column headers.JPG

Hola @Pandadev ,

se ve bien, pruébalo tú mismo 😉

PDFImport.png

Did I answer your question?
Please mark my post as solution, this will also help others.
Please give Kudos for support.

Marcus Wegener works as Full Stack Power BI Engineer at BI or DIE.
His mission is clear: "Get the most out of data, with Power BI."
twitter - LinkedIn - YouTube - website - podcast


hay una manera de crear una sola tabla que tiene tablas que contienen las columnas correctas, ya que el powerbi está tirando de muchos cuadros que no son necesarios. estaba vagando si pudiera decir si la tabla contiene los encabezados de columna y luego añadirlo.

No @Pandadev ,

Puede usar Python para obtener la tabla en PDF y exportar la tabla y, a continuación, seleccionar el conector adecuado en power Bi para conectar el archivo de exportación.

http://theautomatic.net/2019/05/24/3-ways-to-scrape-tables-from-pdfs-with-python/

Saludos
Liang
Si esta publicación ayuda, entonces por favor considere Aceptarlo como la solución para ayudar a los otros miembros a encontrarlo más rápidamente.

Helpful resources

Announcements
Microsoft Fabric Learn Together

Microsoft Fabric Learn Together

Covering the world! 9:00-10:30 AM Sydney, 4:00-5:30 PM CET (Paris/Berlin), 7:00-8:30 PM Mexico City

PBI_APRIL_CAROUSEL1

Power BI Monthly Update - April 2024

Check out the April 2024 Power BI update to learn about new features.

April Fabric Community Update

Fabric Community Update - April 2024

Find out what's new and trending in the Fabric Community.