pyperclip ne fonctionne pas pour les textes volumineux

J'utilise Python 3.5 sur MacOS Sierra. Je travaille sur le cours, Automate the Boring Stuff avec Python et avoir un problème avec pyperclip. Le code (ci-dessous) fonctionne quand je ne copie que 4 lignes du pdf, cependant quand je copie tout le texte je reçois un message d'erreur (ci-dessous).pyperclip ne fonctionne pas pour les textes volumineux

Quelqu'un pourrait-il m'aider? Est-ce un problème avec pyperclip? Mon code? Mon ordinateur?

Message d'erreur:

Traceback (most recent call last): 
    File "/Users/ericgolden/Documents/MyPythonScripts/phoneAndEmail.py", line 35, in <module> 
     text = pyperclip.paste() 
    File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/pyperclip/clipboards.py", line 22, in paste_osx 
     return stdout.decode('utf-8') 
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 79: invalid continuation byte

Voici mon code:

#! python3 

import re, pyperclip 

# Create a regex for phone numbers 
phoneRegex = re.compile(r''' 
# 415-555-000, 555-0000, (415) 555-0000, 555-000 ext 12345, ext. 12345, x12345 
(
((\d\d\d) | (\(\d\d\d\)))?  # area code optional 
(\s|-)  # first separator 
\d\d\d  # first 3 digits 
-  # seperator 
\d\d\d\d  # last 4 digits 
(((ext(\.)?\s)|x)  # extension word-part optional 
(\d{2,5}))?   # extension number-part optional 
) 
''', re.VERBOSE) 



# Create a regex for email addresses 
emailRegex = re.compile(r''' 
# [email protected](\d{2,5}))?.com 
[a-zA-Z0-9_.+]+  # name part 
@  # @ symbol 
[a-zA-Z0-9_.+]+  # domain name part 
''', re.VERBOSE) 


# Get the text off the clipboard 
text = pyperclip.paste() 


# TODO: Extract the email/phone from this text 
extractedPhone = phoneRegex.findall(text) 
extractedEmail = emailRegex.findall(text) 

allPhoneNumbers = [] 
for phoneNumber in extractedPhone: 
    allPhoneNumbers.append(phoneNumber[0]) 

# TODO: Copy the extraced email/phone to the clipboard 
results = '\n'.join(allPhoneNumbers) + '\n' + '\n'.join(extractedEmail) 
pyperclip.copy(results)

Source

2017-04-17 eandrewgolden

pouvez-vous essayer de changer l'importation: pyperclip importation, re?

Aussi, voici juste un exemple de mon code si cela aide, puisque j'utilise le même livre.

#! python3 
# phoneAndEmail.py - Finds phone numbers and email addresses on the clipboard. 

import pyperclip, re 
phoneRegex = re.compile(r'''(
    (\d{3}|\(\d{3}\))?     # area code 
    (\s|-|\.)?       # separator 
    (\d{3})        # first 3 digits 
    (\s|-|\.)       # separator 
    (\d{4})        # last 4 digits 
    (\s*(ext|x|ext.)\s*(\d{2,5}))?  # extension 
    )''', re.VERBOSE) 

# Create email regex. 
emailRegex = re.compile(r'''(
[a-zA-Z0-9._%+-]+     # username 
@         # @ symbol 
[a-zA-Z0-9.-]+      # domain name 
(\.[a-zA-Z]{2,4})     # dot-something 
)''', re.VERBOSE) 



# Find matches in clipboard text. 
text = str(pyperclip.paste()) 
matches = [] 
for groups in phoneRegex.findall(text): 
    phoneNum = '-'.join([groups[1], groups[3], groups[5]]) 
    if groups[8] != '': 
     phoneNum += ' x' + groups[8] 
    matches.append(phoneNum) 
for groups in emailRegex.findall(text): 
    matches.append(groups[0]) 


# Copy results to the clipboard. 
if len(matches) > 0: 
    pyperclip.copy('\n'.join(matches)) 
    print('Copied to clipboard:') 
    print('\n'.join(matches)) 
else: 
    print('No phone numbers or email addresses found.')

Source

2017-04-24 08:13:34

pyperclip ne fonctionne pas pour les textes volumineux

Répondre

Questions connexes