A l'occasion d'une formation sur VB.NET, j'ai eu la question d'utiliser ce langage pour modifier les commentaires d'un grand nombre de fichiers PDF, sans avoir à les recréer individuellement.
VB.NET et le Framework.NET ne fournissent pas de moyens directs de manipuler des fichiers PDF, mais il existe une bibliothèque en .NET écrite pour ces manipulations : PDFSharp.
Une fois installée sur le poste de développement, son utilisation permet d'écrire très simplement une application de traitement des PDF. Voici par exemple un extrait qui crée la DataSource d'une DataGridView en parcourant une arborescence de répertoire, en utilsant LINQ pour construire la collection :
fichiers = (From f In _
SIO.Directory.GetFiles(répertoire, "*.pdf", IO.SearchOption.AllDirectories) _
Let info = PdfSharp.Pdf.IO.PdfReader.Open(f).Info _
Select Nom = f, Auteur = info.Author, Titre = info.Title).ToList
DataGridView1.DataSource = fichiers
La DataGridView affiche alors l'emplacement des fichiers PDF, ainsi que l'auteur et le titre du document. Vous noterez que l'écriture du même code sans LINQ aurait été bien plus laborieuse.