2011年06月03日

ブログ引っ越しのあれこれ

今回、ブログを引っ越そうと思ったのは、これまで使ってきたレンタルサーバーに不満があったからだ。まあ格安サービスに不満を言っても仕方ないのだけれど、「これだったら無料サービスでもかまわないんじゃない?」と、年間3,000円あまりの料金が気になりだしたというケチな話。もっと根本的には、私の本業の事業で確保しているこのドメインや別ドメインのSEOにまつわる思惑とかもあるわけだけれど、そのあたりはあまりくだくだしく書いても仕方ないことでもあるし。

ともかくも、引っ越しそのものは、古いエントリを見ていたら2年以上前から「近いうちに」と書いていたことがわかる。だから、構想そのものはもっと前からあったわけだ。それをズルズルと引き延ばしていた理由は、ほとんど何もない。単に「めんどくさいなあ」というだけのものだった。ようやく思い切って、気持ちが楽になった。

さて、引っ越すとなると、データの移動をやらねばならない。これがけっこう面倒くさい。いや、ふつうならそれほど面倒でもないはず。エクスポートして引越し先でインポートするだけで済む。

ところが、これがレンタルサーバーへの不満にもなるのだけれど、エクスポートしたら、データが途中で切れてしまう。推測でしかないのだけれど、エントリ数が多すぎて時間がかかるため、処理を途中で中断されるからのようだ。サーバーへの負荷集中を回避するためそういう制限をかけている様子なのだけれど、これはけっこう困る。エクスポートのためのわずか数分だけでも解除してくれればいいのだけれど、そんなわがままには対処してくれそうにないし。

しかたないので、HTMLで回収して、そこから整形してやることにした。MT形式にすれば、たいていどこへでも引っ越しができるはず。
まず、全エントリを一括してダウンロードする必要がある。これにはいろいろとツールがあるようなのだけれど、私はFirefoxのDownThemAllというアドオンを使った。最初にWordPressでトップページのエントリ表示数を500に設定してやり、トップページにアクセスする。すると、ここから全エントリへのリンクを辿ることができるわけで、DownThemAllを起動すると、リンク先のページが一覧で表示される。この一覧の表示順序を変えて、過去エントリに相当するページを一気に複数選択し、一括でダウンロード指定。これで、過去記事のHTMLが指定のディレクトリに保存される。

で、MT形式は複数エントリを1つのファイルにするので、この400件以上あるHTMLファイルを1つのファイルに合成する。こういう操作はコマンドの基礎らしいのだけれど、私はGUI派。いろいろGUIユーティリティを捜すのだけれど、Windows版は数多くあれど、Ubuntuで動作するものを見つけられない。Windows用のユーティリティをWineで試してみたけれど、1つは動作しても文字化けでダメ、1つは動作するけれどエラー、1つは動作もしないということで、全部ダメ。仕方ないので、こちらのあたりを参考に、コマンドで処理。いや、確かに早いし、確実だし、文句はありませんよ。ただ、それを知っていないとできないのは…

ともかくも、これで10MB近い巨大なテキストファイルができあがった。ここから一気に整形していく。だいたい必要な情報はパターンで出てくるので、そのパターンを読み取って、MT形式のパターンに検索&置換で変形していくだけ。パズルのようなもの。このパターンの中にはファイルごとの固有の値が間に入ってくる部分が多いので、そこは正規表現でワイルドカードを使わねばならない。これに関しては話が長くなるので別エントリを書こうと思う。

ともかくも、検索&置換を繰り返して、ほぼMT形式っぽくなるが、最終的に「カテゴリ」の行が最後に来てしまうのと、エントリ時刻が日付と分割されて別の場所にくるのが解決できずに残った。これに関しては、データをいったんエクセル(というかLibreOfficeのCalc)に読み込んで処理すれば一瞬で変換できそうだなと見当はつけたけれど、その過程で発生しそうな無数の問題に対処する気力がなく、結局、データの目視チェックを兼ねて手動で移動した。数時間かかったけれど、おかげで過去にどんな記事を書いていたのかを思い出せて、それはそれでよかったかもしれない。この処理で、ファイルの大きさは1.8MBに。ブログというものがいかに繰り返しパターンの化物かということがよくわかる。

そして最後に、インポート。本当はGoogleのBloggerを使うつもりだったのだけれど、Bloggerは独自のXML形式で、MT形式は受け付けない。一応Googleには変換用のAPIがあって、Webサービスとしても変換用のサイトが存在するのだけれど、やってみてもエラーが出る。そのエラーに対処する変換ソフトも出回っているようなのだけれど、なんだか面倒なのでBloggerをあきらめて、SeeSaaブログさんにお世話になることにした。こちらはこちらで、長いこと使って手に馴染んだサイトなので。

とまあ、引っ越しの顛末を報告したが、まだまだ残務はある。本業に差し障らないように早いこと片付けねば。

posted by 松本 at 10:56| Comment(0) | 総記・雑記 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。