Bonjour :) Je ne suis pas en mesure de comprendre quelle est l'erreur dans le programme est-ce que vous pourriez m'aider s'il vous plaît avec elle. Merci .. :)python - erreur de syntaxe
Le fichier d'entrée contient les éléments suivants:
3. भारत का इतिहास काफी समृद्ध एवं विस्तृत है।
57. जैसे आज के झारखंड प्रदेश से, उन दिनों, बहुत से लोग चाय बागानों में मजदूरी करने के उद्देश्य से असम आए।
(ses phrases essentiellement échantillons pour lesquels j'ai besoin d'obtenir des positions de mot dans la sortie annexée à chaque mot en hindi)
pour exemple la sortie de la première phrase ressemblerait à ceci:
3. भारत(1) का(2) इतिहास(3) काफी(4) समृद्ध(5) एवं(6) विस्तृत(7) है(8) ।(9)
je devrais obtenir une séance similaire pour la phrase suivante (s)
Le code ressemble à ceci:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
# encoding: utf-8
separators = [u'।', ',', '.']
text = open("hinstest1.txt").read()
#This converts the encoded text to an internal unicode object, where
# all characters are properly recognized as an entity:
text = text.decode("UTF-8")
#this breaks the text on the white spaces, yielding a list of words:
words = text.split()
counter = 1
output = ""
#if the last char is a separator, and is joined to the word:
for word in words:
if word[-1] in separators and len(word) > 1:
#word up to the second to last char:
output += word[:-1] + u'(%d) ' % counter
counter += 1
#last char
output += word[-1] + u'(%d) ' % counter
else:
output += word + u'(%d) ' % counter
counter += 1
print output
L'erreur que je reçois est:
File "pyth_hinwp.py", line 22
output += word[-1] + u'(%d) ' % counter
^
SyntaxError: invalid syntax
Je sais que cette question est quelque chose de semblable à ce que j'ai demandé plus tôt, mais depuis que je ne suis pas capable d'exécuter avec succès certaines des réponses qui m'ont été données plus tôt, donc je suis en train de restructurer la question à l'endroit où je suis actuellement coincé.
Impossible de reproduire cette erreur sur Python 2.5.2! – batbrat