www.valterborsato.it

Come importare in Excel tabelle da un file PDF

Una delle innovazioni più interessanti introdotte nel 2020 all'interno della versione Excel di Microsoft 365 è la possibilità di importare direttamente tabelle dati da file PDF.
Questa funzione, che amplia notevolmente le capacità di Excel, è resa possibile grazie all'integrazione di Power Query, uno strumento particolarmente versatile per la gestione e trasformazione dei dati.
La procedura per importare tabelle da un file PDF è sorprendentemente semplice e accessibile anche per chi non ha grande esperienza con le funzionalità avanzate di Excel.
Dopo aver selezionato il file PDF da cui si desidera estrarre i dati, Power Query esegue una scansione automatica del documento, identificando le tabelle e le strutture presenti al suo interno.
L'utente deve semplicemente scegliere la tabella di interesse tra quelle rilevate e, con poche operazioni, può trasformarla e importarla nel foglio di calcolo Excel.
Una volta che la tabella è stata selezionata, Power Query consente di apportare eventuali modifiche ai dati prima di importarli, come la pulizia di valori non necessari, la riorganizzazione delle colonne o l'applicazione di filtri.
Questo processo rende l'operazione estremamente flessibile, permettendo di adattare il contenuto del PDF alle proprie esigenze specifiche prima ancora che venga inserito nel foglio di lavoro.

Power Query, è uno strumento di business intelligence disponibile in Excel, che consente di importare dati da origini e fonti diverse, trasformare e rimodellare i dati in base alle proprie esigenze, e successivamente caricarli in Excel o in uno strumento di data analisi quali le Pivot.

Per una panoramica sullo strumento Power Query e una introduzione allo strumento si rimanda a: Power Query: caratteristiche generali e introduzione alle funzionalità

Come importare in Excel una tabella presente in un file PDF

Come esempio di spiegazione si prenda in considerazione un PDF molto complesso che illustra una seria di dati turistici (numero di visitatori) della città di Verona nell'anno 2019.
Il PDF è di una ventina di pagine e nello specifico la tabelle che si vuole importare si trova nella nona pagina del PDF.
L'immagina successiva illustra la pagina 9 del PDF nella quale sono presenti due tabelle affiancate nella parte inferiore del foglio, delle quali si vuole importare SOLO quella a sinistra, ovvero quella specifica all'afflusso di turisti stranieri a Verona.

Excel - Power query: importare dati da PDF: tabella sorgente

Impostare la conversione della tabella dal documento PDF in Excel

Per procedere con l'importazione della tabella, nella scheda Dati gruppo pulsanti Recupera e trasforma dati, fare clic sul pulsante Recupera dati, nei menu a tendina scegliere Da file e successivamente Da PDF. (vedi successiva immagine)

Impostare la conversione della tabella dal documento PDF in Excel

Una volta cliccata l'opzione Recupera dati  da PDF, Excel propone la classica finestra di dialogo di navigazione nelle risorse del computer, attraverso la quale è possibile scegliere il file che si vuole importare.
Confermato con OK la scelta del file, per alcuni secondi compare un messaggio di attesa che avverte:
CONENSSIONE: attendere mentre viene stabilita la connessione al file....

Al termine di questa attesa di connessione, viene proposto la finestra Strumento di navigazione nella quale vanno definite le impostazioni per l'importazione della tabella.
La finestra Strumento di navigazione è raffigurata nell'immagina sottostante e di seguito commentata.

Excel - Power query: importare dati da PDF: caricare i dati dal PDF

Strumento navigazione importazione dati da pdf

Nella Finestra Strumento di navigazione a sinistra sono elencate tutte le tabelle che sono state individuate nel documento PDF.
Selezionando a sinistra una tabella, sulla destra compare l'anteprima dei dati e nella parte superiore il riferimento alla pagina del documento nella quale si trova collocata.
Al di sotto dell'elenco delle tabelle a sinistra vengono proposte anche tutte le pagine (non visibili nell'immagine di cui sopra).
Una volta individuata e selezionata la tabella di interesse, sono possibili due distinte azioni.
Pulsante trasforma dati,  per passare alla finestra Power query dove sarà possibile effettuare tutta una serie di modifiche alla tabella.
Pulsante Carica per importare direttamente in Excel la tabella selezionata.
Il Pulsante Carica a sua volta ha due ulteriori opzioni Carica (senza alcuna ulteriore descrizione) per passare la tabella direttamente in Excel, oppure il pulsante Carica in... che mette a disposizione tutta una serie di specifiche su come si vogliono visualizzare i dati, dove devono essere inseriti (sul foglio di lavoro o su un nuovo foglio di lavoro) ed infine la possibilità di aggiungere i dati al modello di dati per passare a Power Pivot.

Strumento navigazione importazione dati da pdf

Una volta impostate le opzioni nella finestra di dialogo Importa dati, o dopo aver cliccato direttamente sul pulsante Carica, la tabella selezionata verrà inserita nel Foglio di lavoro di Excel.
Il risultato finale dell'operazione è visibile nell'immagine.

Excel - Power query: importare dati da PDF: risultato finale tabella in Excel

:: Osservazione. Unico elemento negativo dell'importazione è che nella tabella originale non era specificato a fianco dei numeri delle due ultime colonne il simbolo di percentualizzazione, pertanto Excel ha importato il valore in quanto tale.
Chiaramente la mancanza del simbolo di percentuale a fianco dei valori numerici non poteva essere interpretata come sottointesa dalla procedura di importazione.

Argomenti Correlati Power Query

Power Query: Caratteristiche generali. Introduzione alle funzionalità e all'editor di Power Query

Indice Generale Argomenti: EXCEL

[Valter Borsato: ottobre - 2022 | Ultimo aggiornamento 28/09/2023]