Prova a selezionare una riga
Se il testo non si seleziona o viene evidenziata l'intera pagina come immagine, il PDF è probabilmente scannerizzato.
Scarica il documento originale
Quando possibile, scarica il PDF ufficiale dall'home banking invece di fotografare o scannerizzare un documento cartaceo.
Aspettati più revisione
Un PDF non selezionabile può essere convertito solo con OCR. Il risultato va controllato con più attenzione, soprattutto su importi e date.
Caso pratico: distinguere PDF testuale e PDF immagine
Un titolare di P.IVA scarica un estratto conto da BancoPosta e dalla home banking di Credit Agricole. Apre il primo in Anteprima su Mac, prova a selezionare una riga con il mouse: l'intera pagina viene evidenziata come blocco unico, segno che è un'immagine. Apre il secondo: il testo si seleziona riga per riga, confermando PDF testuale. Carica entrambi nello strumento, che riconosce automaticamente la differenza: il primo viene marcato come scannerizzato e viene avviata la pipeline OCR (più lenta, più crediti consumati), il secondo viene processato in pipeline standard (più veloce, meno crediti). Per il PDF scannerizzato richiede una revisione finale prima dell'export Excel, controllando in particolare gli importi a tre cifre.
Errori comuni con PDF non selezionabili
Quattro situazioni tipiche. Primo: scansionare un PDF testuale credendo migliori la conversione, mentre peggiora la qualità trasformandolo in immagine; soluzione, conservare sempre il PDF originale. Secondo: aspettarsi conversione istantanea su PDF di 100 pagine scannerizzate, mentre l'OCR è inevitabilmente più lento; soluzione, pianificare il lavoro e non aspettare risultato in pochi secondi. Tre: pensare che un PDF Credit Agricole nuovo sia sempre testuale, mentre alcuni rapporti privati ricevono ancora immagine; soluzione, verificare con la selezione testo prima di stimare i crediti necessari. Quattro: dare per scontato che MPS produca PDF immagine sempre; in realtà nuovi rapporti business hanno PDF testuali standard.
Domande frequenti sui PDF non selezionabili
Posso forzare un PDF immagine a diventare testuale con Adobe Acrobat? Sì, Acrobat Pro ha la funzione Riconosci testo che aggiunge un layer OCR al PDF originale: dopo l'elaborazione il testo diventa selezionabile. Il risultato è equivalente a un OCR esterno e dipende dalla qualità della scansione. Funziona anche con software gratuiti? Sì, Tesseract OCR (gratuito, open source) o le funzioni OCR di Anteprima Mac (recenti versioni di macOS) producono risultati accettabili per estratti conto puliti. Vale la pena fare OCR prima del caricamento? Solo se vuoi avere il PDF testuale come archivio: lo strumento esegue OCR autonomamente quando rileva PDF immagine.