[ツール] docx2html.exeの利点

Pythonファイルを実行ファイル化

PyInstallerを思い出し、先日紹介したPythonのWord文書html変換スクリプトを実行ファイルに変換しました(ちょい改良済み)。

https://co2.ddns.net/tools/docx2html_2019-05-14/
ツール開発2

本来あるべきWord文書からの出願

Word文書は、ワープロなので表示されているままに印刷が可能です。それを昔は、WYSIWYG(What you see is what you get.)ウィズウィグと呼んでいました。見ているものをそのまま印刷でき、紙の文書を手にすることができるという考えです。一方、特許庁が推奨しているWordの使い方では、Word文書の本文とイメージファイルとが別々になり、一つのファイルとして扱えません。ワープロソフトとしてはいまいちな使い方です。また事務所が出願人に提出する際も不便です。本来、Word文書の中に画像を貼りこみ、そのままの形で出願できるべきです。What you see is what you file. WYSIWYF ウィズウィフ。見ているまんまを出願できる!! しかし、Microsoft Wordのhtml書き出しが良くないために事務所は苦労していると思います。(一太郎を使ったり、LibreOfficeを使っているのでしょうか?)

docxからhtmlへ

そこで、docx2html.exeが役立ちます。docxの新しいWord文書形式に限られますが、htmlに書き出すときにイメージを貼りこんだ際の解像度で画像ファイルを吐き出してくれるツールです。

メリット

長々と前置きを書きましたが、docx2html.exeを使ってWord文書を変換する利点を記載します。

  • イメージも含めた1つのWord文書として扱うことができる(ファイルは1つ。提出も1つ。事務所・出願人共に自由に編集可)
  • 事務員がインターネット出願ソフトのためにWord文書を加工する必要がない(手間を省略)
  • 上記加工における作業ミスがなくなる(お客様が承認したものそのまま出願できる。WYSIWYF!!)

特許庁の受付可能文字

特許庁で受け付けるhtmlは、「XML系書類(特許/実用)では、文字修飾(半角/下線/上付/下付)と改行が使用できます」とのことです。つまりこれだけの属性の変換が 可能であれば、Wordのマクロでだって、変換できるかもです。ただ、docx2html.exeを作ってみたので、使ってみてください。

図面の切り出しは…

図面の切り出しに関しては、過去の記事をご覧ください。

図面取り込み(1)〜画像フォーマットの考察〜 やりたいこと 特許出願用図面をきれいに簡単にほぼ自動で取り込めるようにしたい。できれば、...
図面取り込み(2)~図面切り取り及び貼り付け~ やりたいこと 前回の画像フォーマットに関する考察に続き、今回は、図面を自動で切り抜きす...
図面取り込み(3)~Word文書からHTML文書へ~ やりたいこと 画像フォーマットに関する考察及び図面切り取り及び貼り付けに続き、今...
Translate »