Je ne suis pas sûr de ce qui ne va pas avec mon code. Il lit le fichier PDF et saisit tout le texte, mais chaque élément est combiné dans une seule chaîne sans séparateur d'aucune sorte.Lire un PDF Ligne par ligne - iTextSharp
Exemples:
"Maisons: 2
Chambres: 3
Bathsroom 4"
vont se lire comme "Maisons: 2chambres: 3Bathsroom 4"
I » Nous avons cherché à travers tous les exemples en vain. J'ai également essayé LocationTextExtractionStrategy en vain. J'ai essayé d'employer la méthode de .split et aucune aide.
Public Shared Function ParseAllPdfText(ByVal filepath As String)
Dim sbtxt, currenttext As String
sbtxt = ""
Try
Using reader As New PdfReader(filepath)
For intPages As Integer = 1 To reader.NumberOfPages
currenttext = PdfTextExtractor.GetTextFromPage(reader, intPages, New LocationTextExtractionStrategy())
currenttext = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currenttext)))
sbtxt = sbtxt & currenttext & vbcrlf
Next
End Using
Catch ex As Exception
MsgBox(" There was an error extracting text from the file: " & ex.Message, vbInformation, "Error Extracting Text")
End Try
Return sbtxt
Pouvez-vous partager le pdf en question? En outre, que comptez-vous réaliser avec cette ligne de jonglage «Encoding»? – mkl