Magazine Internet

Outil : Extraction du texte d'un fichier PDF

Publié le 05 juillet 2008 par Captainbiz
Outil : Extraction du texte d'un fichier PDF

PDFTextOnline est un logiciel en ligne qui vous permet d’extraire tous les textes d’un fichier PDF.
Comment cela se passe-t-il? …

Vous chargez tout d’abord votre fichier PDF sur le site. PDFTextOnline le convertit en texte qui est affiché sur l’écran en mode page à page.
Il vous est alors possible soit de visionner chaque page et de récupérer les textes qui vous intéressent, ou alors de cliquer sur le bouton “Save All Text” pour obtenir un fichier .txt zippé contenant tous les textes du fichier PDF.
D’un point de vue limitations, PDFTextOnline n’extraira pas les textes des fichiers qui sont soient encryptés, soient protégés par un mot de passe.
A noter aussi que le logiciel est supposé pouvoir extraire les caractères asiatiques comme Chinois, Japonais ou Coréen. Je n’ai cependant pas testé cette option mais les caractères Français utilisés lors de mes tests n’étaient cependant pas rendus correctement.
Cela est un petit désavantage mais qui peut être facilement réglé par quelques copier/remplacer bien choisis.

En conclusion, PDFTextOnline est un logiciel simple et facile à utiliser, qui ne servira pas évidemment tous les jours, mais qui sera très utile ponctuellement.





Retour à La Une de Logo Paperblog

A propos de l’auteur


Captainbiz 21 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte

Magazine