2007年05月28日

ゴミとりにはQuanta

トラブルはあったもののこのブログのデータは全てhtmlとして回収できたし、あとは引っ越すだけというところになって、やっぱりゴミがどうしても気に なった。ゴミというのは自動的についてくるレイアウト上の不要な部分や広告、サイト特有のリンクなどで、こういったものは引っ越し先ではどうせ使えないか ら削っておきたいわけだ。

しかし、150余りもあるファイルをいちいち開いて削除していたのでは日が暮れる。ここは一括変換をしたいところだ。元来Linuxの世界では一 括変換は日常的に行われる作業で、30年以上前に開発されたsedというプログラムが多用されている。しかし、このsed、慣れたひとには使い易いらしい のだが、私のようなIT素人にはとても使いこなせるものではない。MacintoshやWindowsにはこのsedをもとにしたGUIのアプリケーショ ンもあるのだが、Linuxにはない。少し前までLinuxを使うのはかなりプロフェッショナルだったわけで、そういうひとはスクリプトを書いてかなり複 雑な一括処理を一気にやってしまう。だからGUIは不要だし、あっても邪魔になるだけということだったのだろう。
そこで代案を探してみた。creamを使おうとしてダメだった話は以前に書いたが、この原因は代案を探す過程ではっきりした。
まず見つけたのが、rplというプログラムだった。これはsedによく似ているが、sedがかなり何でもできる高機能なプログラムなのに対し、rpl(つ まりreplace=置換)という名前にあらわされている通り、検索置換に特化したプログラムだ。だが、このぐらい単純なプログラムの方が、私のような素 人には使いやすい。sed同様にコマンドラインで動かさねばならないのだが、この程度ならなんとかなりそうだ。
だが、やってみると、見事に空振った。原因をさぐっていると、やっぱり文字エンコーディングの問題だということがわかった。つまり、この楽天ブログは基本 的にEUC-Jで文字エンコーディングをおこなっている。しかし(おそらくは環境がUTF-8だからなのだろうが)、rplはUTF-8しか(少なくとも 日本語は)認識しないようだ。試しにいくつかUTF-8にエンコーディングを変換して保存してやると、きっちりと置換していってくれる。
そこで、それならと文字エンコーディングを一括置換できるソフトを探した。ベーシックなものとしてiconv、もうちょっとましなものとしてenca (enconv)というものがあるらしい。けれど、これらも見事に空振った。「jaには対応していません」ということらしい。
ここまででだいぶ時間をつぶしていて、1枚ずつファイルを開くなんてバカなことをやっていても半分以上は終わっていたんじゃないかとさえ思える状態だった のだが、半分意地になって「一括で文字エンコーディングを変えるもっとマシな方法があったはずだがなあ」と探していると、KFileReplaceという のが出てきた。これこそ探していた複数ファイルの一括置換プログラムではないか。さらに、芋づる式にこのKFileReplaceをプラグインとして動か すためのQuanta Plusというのが出てきたので、これらをインストール。
Quantaを立ち上げると、どうやらこれはNVUと同じようなGUIのウェブサイト構築プログラムらしい。一見したところ、NVU以上の機能があるよう に思えるが、確認するよりもまずは目的の一括置換と、プラグインからKFileReplaceを立ち上げる。ちょっと癖があって最初はうまくいかなかった が、慣れると順調に複数ファイルの検索置換ができるようになった。そう、私が探していた機能はまさにこれ!
ファイルの中にはそれぞれのエントリーに固有の文字列もふくまれているため、完全にゴミをとりきることはできなかったが、それでもかなりのゴミは削除でき た。どのくらい減ったかというと、ウェブサイト上にアップした状態でファイルの重さが半分位になった。これは助かる、というか、やっぱりゴミをアップする のは道義上問題があるよ、と、昔かたぎに思ってしまう。
Quantaは、例によってKDEのアプリケーションらしい、やっぱりKDEはアプリケーションが豊富なんだなあと改めて思う。
ともかくも、ファイルのアップ先は
http://ubuntu.memebot.com/r/diaryall.html
まだちょっと修正しなければいけない部分もあるし、今後続けていくブログとの連携もとれていないからまだ正式移転ではないけれど、ここまでくればあと数日かなあ。がんばろう。
posted by 松本 at 15:51| Comment(0) | Ubuntuのアプリケーション | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。