Actualité informatique
Test comparatif matériel informatique
Jeux vidéo
Astuces informatique
Vidéo
Télécharger
Services en ligne
Forum informatique
01men
01net Pro Entreprise informatique
Bureautique
Multimédia
Internet
Utilitaires
Personnaliser son pc
Loisirs
Sécurité
Logiciels Mobiles
Services en ligne
Divers

Récupérez les textes contenus dans les PDF, CHM et HTML

Un ami ou un collègue vous a envoyé un PDF dont vous aimeriez bien récupérer une partie du texte pour le coller dans le document Word sur lequel vous travaillez... Oui mais voilà, comment faire pour récupérer simplement ce texte? Et si le fichier n'avait pas été un PDF, mais plutôt un fichier d'aide CHM ou une page HTML? La solution s'appelle "Text Mining Tool". Et elle est gratuite!

laisser un avis
agrandir la photo
Text Mining Tool est un logiciel "freeware" qui vous permet d'extraire en un clin d'oeil la partie textuelle d'un document PDF, d'une aide en ligne CHM, d'une page HTML ou d'un fichier RTF ou DOC. Il suffit de lancer le programme et de lui indiquer le fichier à transcrire pour voir le texte brut s'afficher à l'écran. Libre à vous, alors, d'exporter ce texte ou de le copier/coller...
En pratique, le programme s'avère aussi très pratique pour récupérer le contenu d'un fichier DOC endommagé ou d'un fichier PDF anormal et illisible.
- Commencez par télécharger le logiciel en suivant ce lien.
- Décompactez l'archive Zip dans un dossier.
- Le logiciel n'a pas besoin d'installation. Il suffit de double-cliquer sur l'icône TextMiningTool. Le programme peut donc facilement être utilisé depuis une clé USB, par exemple.
- Cliquez sur l'icône Open pour charger le fichier PDF, CHM, HTML, RTF ou DOC.
- Après quelques secondes d'analyse, la partie textuelle du document dans sa forme brute (sans image, ni style, ni enrichissement, ni code de mise en page) s'affiche.
- Cliquez sur Save pour sauvegarder ce texte au format ASCII directement lisible depuis le bloc-notes par exemple.
- Ou cliquez sur Clipboard pour copier l'intégralité du texte dans le presse-papiers Windows afin de le coller ensuite dans un document Word ou OpenOffice.org sur lequel vous êtes en train de travailler.
Remarques:
* Il arrive au logiciel de ne pas décrypter correctement les accents, notamment sur les documents HTML
* Vous pouvez, dans la fenêtre du logiciel, sélectionner un bloc de texte et utiliser le raccourci [Ctrl]+[C] pour copier cette sélection dans le presse-papiers Windows.
Ce qu'il vous faut
Niveau : Débutant / Temps : 5 minute(s)
Logiciels :
Text Mining Tool (Windows)
Matériel :
- Rien
envoyer
par mail
imprimer
l'article
PAS D'AVIS SUR CET ARTICLE
Répondre
 

Avis sur «Récupérez les textes contenus dans les PDF, CHM et HTML»

   
 
à lire aussi
TÉLÉCHARGEMENTS
Text Mining Tool (Windows)
SUR LES MÊMES THÈMES
Virgin bloque The Pirate Bay en Grande-Bretagne
La guerre du Cloud aura bien lieu
Comment les militants PS animent le débat sur les réseaux sociaux
Time 2 Market
Datacentres 2012
HIT Paris 2012
Driver genius 11
Comment lutter contre les fraudes téléphoniques ?
Avast Internet Security 7
TuneUp Utilities 2012
Neuf sites web sur dix utilisent un protocole SSL obsolète
WinRar
Nero 11
La Promo de la semaine : image de gauche
Architecte 3D Silver 2012
Kaspersky Antivirus 2012
Anti-Hacks 2.0
Le projecteur Epson pour iPod/iPad en vidéo
Windows XP, bientôt la fin
Matinée 01 : e-commerce, la conquête client à l’heure du cross-canal