2010年4月5日月曜日

mixi日記の移転

最終的にはmixi日記をこのブログにして統一したいと思ってるけどブログを登録すると過去にmixiに書いた日記は見られなくなってしまうみたいなのでそれはなんとかしたい、大半はどうでもいいネタだけど旅行時の行動記録な部分も多々あるので。

同じことを考える人は当然たくさんいるのでちょっとググったら一応やり方は分かったけどBloggerの癖のせいで細かいところでトラブルが…

以下、忘備録としてこれまでに分かった手順を記載してみる



まずmixi日記を手元に全部吸い出す
http://milk-tea.que.jp/milk-cake/soft/
のbackup_mixiというプログラムでconfig.txtの内容をoption2,0→1に変更して実行。
すると自分のHDD内にhtml形式でちゃんと見られる日記一覧とMovableTypeという標準的なブログのインポート・エクスポート用のファイルが作成される。



このブログのあるgoogleのBloggerはMT形式はインポートできないので読み込めるxml形式に変換しなければいけないのだがそれはgoogle様がwebサービスとして用意しておられる。

http://movabletype2blogger.appspot.com/

しかしこれが標準的なMovableTypeからエクスポートされたファイルしか前提にしてないようで、上のbackup_mixiで出したファイルをそのまま食わせるとグダグダに(´д`;;)

1. 入力ファイルの文字コードはUTF-8限定
 backup_mixiで出力されるファイルはSJISなので適当なエディタ等で変換して保存し直す

2. タイムゾーンとか知ったこっちゃないらしく国内時刻のままだと9時間ズレる
 これはまぁよくある話

3. MT形式は12/24時間どっちでもOKらしいのだが12時間形式しか認識しない
 日付が解釈できないと変換した時刻を日記の書き込み時刻にされてしまうのでインポートすると今日の日付で過去日記が大量に発生して惨いことに…
これは何度か試してみた結果として
00:00:00 → 12:00:00 PM
01:00:00 → 01:00:00 AM
12:00:00 → 12:00:00 AM
てな感じで時刻を変換しないとちゃんと変換してくれないっぽい

4. backup_mixiで出力される日記には絵文字部分がhtmlのIMGタグとして残されているがこれはエラーとされて投稿自体が削除される
 自分では絵文字は使わないけど携帯からコメントしてくれた人のに結構使われててそれが抜けると話が分からなくなるので変換に食わせる前に消しておかないといけないらしい

5. 写真は転送されない
 仕様上仕方ないんだろうけど。日記に貼った写真はローカルHDDには拡大サイズで取り込まれてるけどMT形式ファイルには出てこないので変換もインポートもできない。どうしても必要なら後から手動で一枚づつ張り込むしかなさそう。


以上の変換処理をして完成したxmlファイルをBloggerにインポートすると元の投稿日に書かれたようにブログ記事が読み込まれるわけだが…いろいろと面倒くさいなこれorz


取り込んだhtml形式の日記を自鯖に置いて終わりってのが一番無難なんだけどそれだと検索し放題というgoogle最大の利点が生かせないし、スクリプト言語が使えない私としてはVBで時刻変換とIMGタグ除去のフィルタプログラム書くしかないかなぁ

0 件のコメント:

コメントを投稿