jPDFText – Librairie Java PDF Extraction de Texte des Fichiers PDF

jPDFText – Librairie Java Extraction de Texte des Fichiers PDF

jPDFText est une librairie Java permettant d’extraire le texte des documents PDF. Connaissant le contenu textuel des fichiers PDF, il est alors possible de les indexer ou de les archiver.

jPDFText est basé sur la technologie développée par Qoppa Software et ne nécessite aucun programme ou logiciel tiers. jPDFText est une librairie 100% java, multiplate-forme et qui peut etre utilisée sous tout système d’exploitation qui supporte Java, tels que Windows, Mac OSX et Linux.

Principales Fonctions

  • Lecture des documents PDF à partir de fichiers, d’URLs ou de flux continus java
  • Extraction de texte
  • Extraction des mots contenus dans le document en tant que vecteur d’objets String
  • Extraction des mots contenus dans le document en tant que vecteur d’objets String
  • Ne nécessite aucun autre programme tiers ou logiciel lors du déploiement

Links

Voir la documentation et l’API Java de jPDFText
Téléchargement de la version d’évaluation gratuite de jPDFText

jPDFText est une bibliothèque Java destinée aux développeurs. Il est possible que vous soyez intéressé par l’un de nos autres produits:

Related Products