> 記事 > GITS関連 ウェブ制作 マメ知識 > Wordファイルをpdf化したときに、コピーがおかしくなる場合の解決法

Wordファイルをpdf化したときに、コピーがおかしくなる場合の解決法

2016.01.29.(Fri)Masahiro Natori By.Masahiro Natori

こんにちは、masaです。

先日お客様より「Webサイトのメニューを変更したので、ウェブの情報もアップデートしたい」という連絡がありました。こちらのお客様のWebサイトは、弊社とは別なウェブ制作会社によって数年前に制作されたもので、何年か前より維持管理は弊社に委託されております。

そのお客様は日本食とオーストラリアのフュージョン料理を提供しているパースでも人気のレストランで、定期的にイベントの案内や、メニューの変更連絡があり、対応させていただいております。

Sponsored Link

PDFファイルとdocファイル


今回変更を行った際に、反映後に何度か微調整があり、メニューファイルを何度か受けとったのですが、それがWordファイルの場合と、PDFファイルの場合がありました。どうやら、Wordファイルを修正して、それをPDFファイルにしてから印刷しているようなので、そのプロセスのどこでメールを送るかによって、私に送られてくるファイルに差があるようなのです。

こちらのお客様のWebサイトはhtmlで作成されているので、こちらで行う作業としては、送られてきたメニューの内容をhtmlに変換してWebに反映するのですが、その際、送られてきたメニューのタイトル、料理の説明についてをコピーする必要があります。Wordファイルが送られてくる場合には問題なくコピーできるのですが、どういうわけか、pdfファイルが送られてくる場合には、メニューの詳細情報をコピーすると、本来コピーされるはずの文字列が単語ごとに何度も繰り返されたような状態でコピーされてしまう現象が起こり、ちょっと困ってしまいました。

元々の文字列
Steamed Barramundi, Grilled Prawn & Squid
Herbed Sarad, Plum Miso, Shiso Dressing
(Additional Fried Soft Shell Crab 6.50EA)

コピーした文字列
Steamed Steamed Steamed Steamed Steamed Barramundi, arramundi, arramundi, arramundi, arramundi, arramundi, arramundi, arramundi, arramundi, Grilled Grilled Grilled Grilled Grilled Grilled PrawnPrawnPrawnPrawnPrawn & Squid, Squid, Squid, Squid, Herbed Sa Herbed SaHerbed SaHerbed Sa Herbed Sa lad, lad, lad, lad, Plum MisoPlum MisoPlum MisoPlum MisoPlum MisoPlum MisoPlum MisoPlum MisoPlum Miso, Shiso DressingShiso DressingShiso DressingShiso DressingShiso DressingShiso DressingShiso Dressing Shiso Dressing Shiso DressingShiso DressingShiso Dressing (Add(Add(Add itional itional itional itional Fried Fried Fried Fried Fried Soft Shell Crab 6.5 Soft Shell Crab 6.5Soft Shell Crab 6.5 Soft Shell Crab 6.5Soft Shell Crab 6.5 Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.5Soft Shell Crab 6.50ea )

なんというか、お祭り騒ぎのような文字列になってしまいます。

このような状態になってしまうのをどうにかならないものかと調べてみたところ、こちらのページがまさに現在起こっている現象そのままでした。

Word 2010でPDF化した文書のテキストコピーがおかしい。 – マイクロソフト コミュニティ

こちらの現象はWord2010でPDFファイルを保存したときに起きてしまようです。ほかのバージョンについて、Word97と、Word2013では再現しないことを確認しました。

対策方法


Word2010でPDFを作成したときでも、普通に文字列がコピーできるようにする方法は、WordファイルをPDF保存する際に、[アクセシビリティ用のドキュメント構造タグ] という項目のチェックをオフにする、というのがポイントです。このチェックがオンになっていると、このような現象が起きてしまうようです。

ファイルダイアログを開くと下の方にオプションというボタンがありますので、それを押します。

word2010filedialog
オプションを設定する画面が出ますので、
真ん中より若干下あたりにある、「アクセシビリティ用のドキュメント構造タグ」のチェックボックスをチェックしない状態にします。画面上のようにチェックが入った状態で保存すると、コピーがうまくできません。

word2010option

まとめ


実際にWordファイルを使って「アクセシビリティ用のドキュメント構造タグ」をオンにしたものと、オフにしたもの、2つのPDFファイルを作成してみましたが、予想通り「アクセシビリティ用のドキュメント構造タグ」をオンにしたものはコピーがうまくいかないという状況になりました。

PDFファイルの文字列をコピーすると、おかしい状態になる方は、Wordから保存したときのオプションが原因の可能性もありますので、確認してみてください。

また弊社では、一からのWeb制作だけでなく、別な会社や個人が作成したWebサイトの維持管理(修正、変更、トラブル対応、バックアップ取得)についても対応可能です。
一度作ってそのままになっているWebサイトを変更したいが変更方法がわからない、Webサイトをリニューアルしたいがアカウント情報がわからないなど、どんなことであってもお気軽にご相談ください。

問い合わせフォーム

Masahiro Natori

Masahiro Natori
こんにちはMasaです。39歳の時に16年勤めた会社を辞め、2013年4月に家族で日本からパースに引っ越してきました。2013年6月よりGITSに勤務。2014年1月にGITSのサポートでProgrammerとして457ビザを取得。 趣味は音楽を聴くことと、部屋のレイアウトを変えること、ドライブすること。
    関連する記事は見当たりません。
  • facebook
  • twitter