映画とネットのDIARY(tDiary版)
since 2004/07/15
ここは古い日記です。2013年11月からadiaryを使った新サイトに移行しました。
検索エンジンからのアクセスで、お探しのキーワードが見あたらない場合はNamazuで再検索してみてください。
【映画の感想一覧】 2004年7月以降 2005年 2006年 2007年 2008年 2009年
検索エンジンからのアクセスで、お探しのキーワードが見あたらない場合はNamazuで再検索してみてください。
【映画の感想一覧】 2004年7月以降 2005年 2006年 2007年 2008年 2009年
2006年02月20日 [Mon]
■ 処理時間3秒
さらに手を加えて、映画フォーラムのログコンバータが完成。1発処理ボタンというのを作って、処理をやってみたら3秒で終わった。FTPでのログダウンロード→整形→過去1カ月分抽出→ファイル保存までの時間である。FTP後に「1秒待つ」処理を入れているので、実際の処理に要した時間は2秒ということになる。
今まではPerlで一括表示するスクリプトを自作して処理していたが、表示したものを手動でコピーして不要な部分(1カ月以上前の部分)を手動で削除していたので文章整形には少なくとも20分程度はかかっていただろう。掲示板のログは書き込みの順番が時々変わるので抜ける部分も多かった。それが正確に抽出されて3秒。プログラムって作るものだなあ。
作っている途中で、なでしこのバグをいくつか発見。古いものから新しいものに並んだログをTSV取得し、文字列を表ソートすると、タイトル順には並ぶのだが、同じタイトルの日付が新しいものが先に来てしまう。これはちょっと悩んで、表ソートを2回やったら、OKだった。タブで区切られたログをTSV取得すると、コンマで区切られてしまうのは仕様らしい。これはコンマをタブに置換すればいいだけなので、困ることはない。ちなみに処理時間の算出は
fは今。 ……#処理開始時間を記録 ログFTP取得 ……#ログをFTPでダウンロードする処理 一次処理 ……#日時、タイトル、名前、コメントを抽出する処理 過去1カ月分 ……#過去1カ月分のログの抽出処理 タイトル順 ……#タイトル順に並べ替える処理 lは今。 ……#処理終了時間を記録 pはfとlの秒差 ……#秒差を計算 フォーラムメモのテキストは「一発処理を行いました。処理に要した時間{p}秒。」
で計算している。せめて100分の1秒まで計算できると、面白いと思うんですけどね。