[日誌] 2020年9月の弁理士情報の取得

弁理士ナビからの取得

弁理士ナビでは、弁理士がその所属事務所がどこであるのかが検索できるようになっています。特許出願ココでは、2018年1月から弁理士と所属事務所との関係を取得しております。

今月は、9/12~13にかけてデータを取得し、昨日(9/13)、手による修正を行いました。

引っ越しされた大きな事務所(定義: 在席弁理士2名以上)は、見当たりませんでした。ここ最近は、事務所の引っ越しは少ないようです。個人事務所さんが結構登録を変更されているようです。引っ越しなのか、単なる電話番号の変更かは、定かではありませんが、修正が5,6件は、毎月発生しています。

Python+Seleniumによる自動取得へ

弁理士ナビのページが新しくなり、いつまで今のスクリプトが正しく動作するのか不安になってきました。そこで、編集が簡単なPythonで記載できないか、検討をはじめました。Python+Seleniumによるスクレイピングは、強力ですね。2-30行でページを閲覧できるところまでは書けます。早くMySQLとの連携を記載して、自動化したいものです。

まとめ

コロナ禍において引っ越しはあまり見かけられませんでした。今月も手修正が割と楽でした。Pythonによるプログラミングを進めていければ思っております。ゆくゆくは、データ集計もPython+Seleniumでできないか検討したいです。

Translate »