Perché le tabelle PDF si rompono in Excel
Un PDF nasce per essere stampato, non per essere editato. La struttura interna di un PDF è un insieme di rettangoli con testo posizionato in coordinate XY precise, senza alcuna nozione di "riga", "colonna" o "cella". Quando un convertitore generico apre un PDF, deve indovinare quali rettangoli appartengono a quale riga di una ipotetica tabella, basandosi su prossimità verticale e allineamento orizzontale. Funziona bene su tabelle rigide con bordi visibili, fallisce su tabelle con righe alte (descrizioni multilinea), celle unite, intestazioni ripetute ogni pagina, separatori invisibili.
Il trucco: testo selezionabile vs PDF immagine
Apri il PDF in Anteprima (Mac) o Acrobat (Windows). Prova a selezionare il testo con il mouse. Se il cursore evidenzia singoli caratteri, il PDF è testuale e i convertitori funzionano. Se invece selezioni rettangoli interi senza distinzione di caratteri, il PDF è una scansione (PDF immagine) e serve OCR (riconoscimento ottico). I PDF generati dagli home banking italiani sono quasi sempre testuali; quelli scansionati arrivano in genere da estratti vecchi rimasti in archivio cartaceo.
Strumenti che mantengono il formato
Per tabelle generiche con bordi chiari: Adobe Acrobat Export to Excel mantiene fedelmente il layout nella maggior parte dei casi, Smallpdf rende un risultato simile gratuitamente per PDF semplici. Per tabelle complesse con celle unite o intestazioni multiple: Tabula (gratuito open source) consente di selezionare manualmente le aree tabella e raffina il risultato. Per estratti conto bancari italiani: EstrattoContoExcel applica un parser specifico per ogni banca, già consapevole della struttura tipica (colonna data, descrizione, importo, saldo), quindi mantiene l'allineamento corretto senza richiedere intervento manuale.
Cosa controllare nel file Excel dopo la conversione
Cinque verifiche rapide. Prima: le intestazioni sono nella prima riga e non sparpagliate (succede quando il PDF ripete le intestazioni ad ogni pagina e il convertitore le copia tutte). Seconda: i numeri sono in formato numerico, non testo (Excel non somma le celle se sono testo; verifica con la funzione TIPO che ritorna 1 per numero, 2 per testo). Terza: le date sono date reali, non stringhe (Excel non ordina cronologicamente le date-stringa). Quarta: i totali corrispondono alla somma delle righe (se non torna, la conversione ha perso qualche riga). Quinta: le celle unite del PDF sono diventate singole celle Excel coerenti (di solito è meglio annullare unioni di celle dopo l'importazione).
Quando convertire e quando NON convertire
Conviene convertire quando il PDF ha tabelle ricorrenti che riutilizzerai (estratti conto mensili, listini prezzi, anagrafiche). Non conviene quando il PDF ha un'unica tabella di poche righe (è più veloce ribattere a mano), quando il PDF è pieno di celle unite e formattazione esotica (la conversione produrrà più lavoro di rifinitura del manuale), quando il PDF è la versione finale di un documento legale (modificare in Excel può portare a errori di trascrizione gravi). In dubbio, prova prima con una sola pagina e valuta il risultato.
Domande frequenti
Excel può aprire un PDF direttamente? Da Excel 365 sì, tramite Dati > Recupera dati > Da file > Da PDF; usa il motore Power Query e funziona bene su PDF semplici. Mantiene la formattazione visiva del PDF? Mantiene la struttura tabellare, non i colori, font o bordi (sono perse). Posso convertire mantenendo le formule? No: il PDF non contiene formule (sono già state calcolate e "appiattite" in numeri). Dovrai ricostruire le formule manualmente in Excel se vuoi calcolare totali dinamicamente.