J'utilise l'éditeur Summernote et le formatage est manquant lors de la copie et du collage à partir de documents PDF.Pourquoi manque-t-il la mise en forme lors de la copie à partir du PDF?
Ce problème existe dans tous les autres éditeurs, tels que google doc et doc onedrive. Mais msWord conserve le formatage lorsqu'il est copié et collé à partir de documents PDF. Quelqu'un comprend comment MS Word fait cela parce que le presse-papier ne conserve pas de balises html lorsqu'il est copié à partir de fichiers PDF?
J'ai vérifié le presse-papiers lors du collage de données. il a montré les résultats suivants qui ne contiennent que des balises div.
<div>This is Heading1 Text</div><div>This is a regular paragraph with the default style of Normal. This is a regular paragraph with the default style of Normal. This is a regular paragraph with the default style of Normal. This is a regular paragraph with the default style of Normal. This is a regular paragraph with the default style of Normal.</div><div>This is a Defined Block Style Called BlockStyleTest</div><div>This is more Normal text.</div><div>This is Heading 2 text</div><div>This is more Normal text. This is bold, this is italic, and this is bold italic. This is normal. This is in a defined inline style called InlineStyle. This is normal. This is red text. This is normal.</div><div>This block is centered.</div><div>This is left-aligned.</div><div> First item of bulleted list.</div><div> Second item of bulleted list.</div><div>Second paragraph of second item of bulleted list.</div><div> Third item of bulleted list.</div><div>o First item of third item’s nested list</div><div>o Second item of third item’s nested list</div><div> Fourth and final item of main bulleted list.</div><div>This is Normal text.</div><div>1. First item of numbered list.</div><div>2. Second item of numbered list.</div><div>Second paragraph of second item of numbered list.</div><div>3. Third item of numbered list.</div><div>Here is a BMP picture:</div><div>Here is a JPEG picture:</div><div>Here is a PNG picture:</div><div>Here is a table:</div><div>New York Boston Detroit</div><div>Baseball Mets Yankees Red Sox Tigers</div><div>Hockey Rangers Islanders Bruins Red Wings</div><div>Football Giants Jets Patriots Lions</div><div>Here is an embedded Excel spreadsheet:</div><div>pre- post- pre- postdogs</div><div>1234.43 0.33 354.30 777.00</div><div>cats 432.00 -432.20 654.45 333.00</div><div>turkeys 3.30 4.66 34.65 132.10</div><div>fish 52.55 55.33 37.88 31.50</div><div>total 1722.28 -371.88 1081.28 1273.60</div><div>2001 2002</div><div>https://en.wikipedia.org/wiki/United_States</div><div>This is more Underlined text.</div><div>This is more Strikethrough text.</div><div>Test superscript text. This is superscript texts.</div><div>Test subscript text. This is subscript texts.</div><div>Here are some special characters -!”&’(*)+’./:;?_ÈÓ 12\</div><div>This concludes our test.</div>
Votre question est partout. Tout d'abord, ce qui est copié à partir du PDF. Deuxièmement, pour clarifier, dites-vous que lorsque le texte PDF est copié et ensuite collé dans Summernote, Google Docs, etc. qu'il perd des balises HTML (ou un autre formatage) qui sont présents dans la sélection copiée dans le document PDF ? Troisièmement, lorsque vous dites que vous avez coché le presse-papiers, est-ce que ce sont les données réelles du presse-papiers ou est-ce ce qui est collé dans Word? –
Désolé pour la confusion. 1. Tableaux, en-têtes, texte en couleur etc 2. Oui 3. Je veux dire le presse-papier actuel auquel j'accède via javascript. (E.originalEvent.clipboardData.getData ('text/plain')) – anoj