[@nqounet](https://twitter.com/nqounet)です。
ここのところWordpressばかりいじっているような気がします。 ということで、今日はその関係のネタです。
今回、ブログを引っ越すに際して、過去記事をインポートしようと思っていました。 bloggerを使っていた前回で、すでに3つに点在していたので、一つに集めようと思いました。 一番古いMT3時代の記事が、出力後のHTMLファイルしかなくて困っていたんですが、それを解決してくれるプラグインがありました。
これは、HTMLファイルからスクレイピングしてインポートしてくれるので、必要な部分をタグで示してやればうまくインポートしてくれます。 [html-import2](/wp-content/uploads/2014/03/html-import2.png) もともと機械的に出力したものなので、構造がしっかりしていて読み込みが簡単そうでした。 ただ、一番困ったのが時間です。 ファイルの更新時を取得する、という方法が示されていたのですが、さすがにそれは無理でした。 で、なにか情報がないかと思ってソースを眺めていたら、コメントの中に更新時間のメタ情報(`<dc:date>`)があったので、それを使うことにしました。 このプラグインはコメント部分は無視するのか、あるいは無効な文字があるのか スクリプトを書こうかと思ったのですが、1回しか使わないので、エディタを使っていくつか加工してからインポートしました。 加工したのは以下のとおり。 * コメントを外す(開始タグ(`<!–`)のみを適当に置き換えました) * `<dc:date>`の部分を`<div id=“entry-date”>`で読めるように置き換え * moreを作るために、`</div>`から`<div class=“entry-more”>`までのタグを削除 こうすることで、`<div class=“entry-body”>`を読み込むだけで綺麗にインポートできるようになりました。
時間のかかる処理は控えめに
インポートした記事数は全部で350弱だったと思いますが、さすがにHTTP越しでやるとブラウザが固まったようになります。 返ってきたと思ったら真っ白な画面だったので、インポートできていないのかと思いましたが、確認するとちゃんと出来ていました。 プラグインがどこまで可能なのかはわかりませんが、こういう処理の見せ方がもう少し丁寧に作りこまれるといいなぁ、と思いました。