Personal tools

December 2005

138 posts
  • b.hatena のコメントを全回収する企み on by ultraviolet, [Perl,WWW] Hatena Bookmark

    被ブックマークウェブサイト管理人から見たはてなブックマークのどうしようもない使えなさ。 および はてなブックマークで、自分のブログの「被ブクマ新着RSS」が欲しいという話を見かけて、ほほう、確かに b.hatena で自分の blog についたコメントを逃さずチェックするのはなかなか難しいようぢゃのう、いやしかし LWPで GET してくれば割と簡単にでけるかもしれんのう、コメントを全部取ってきてから日時ソートすれば過去の記事の人気が再燃してもばっちぐーで捕捉できるぢゃろ、とか安易に考えて、大晦日の夜に4時間ほどかけて組んでみたんですが、あんまり実用的なものに仕上がりませんでしたの巻。しょぼーん。 やってることは、まず http://b.hatena.ne.jp/entrylist を GET して (複数ページある場合は当然全部回収して) それをパースして entry を切り出し、entry 数だけ http://b.hatena.ne.jp/entry/ を呼び出して、それぞれの中からコメントを切り出す、とまあ極悪なことをやってます。 Rauru Blog の場合は今130個ぐらい bookmark されてるんですが、テストで実行すると全部取ってくるのに1分ぐらいかかりました。CGI 化して困ってる人に使ってもらおう (そしてAdSenseをクリックしてもらおう) と企んでたんですが、こんなに時間がかかるんだとちょっち無理ぢゃなあ。hatena サーバにも負荷かけてそうだし。 cron で毎日1回実行するとかがせいぜいのところかなあ。特定サイトだけで使う場合、DB に記事毎の被ブックマーク数を入れておいて、前日と比較して増えてる分だけ取ってくる、ような感じで負荷は減らせると思います。 2006/01/29 追記: inosisibeyan の日記に そんなことをやっているせいで重いのだろう と書かれてしまったので、ちょっとだけ弁明。 私もさすがに全回収を毎日 cron で動かすのはアレだとわかっておりましたので、その後 b.hatena のコメントを逐次取得するアイデア で書いたアイデアに基づいて、誰かにブックマークされたときだけ取得に行くシステムに変更してあります。これなら 該当する entry ページを見に行くだけなので、hatena 側サーバの負荷的にも問題無しと認識しております。権利関係はー、よくわからない。

  • Wikipedia とオンライン広告 on by mara, [Business,Wikipedia] Hatena Bookmark

    Times が Jimmy Wales にインタビューしたらしいんだけど、その中で彼がうっかり Wikipedia に広告を掲載して収益を上げることも将来は検討する必要がある と口を滑らせてしまったようで、それだけの単体記事で取り上げられてる ヒット数で他のサイトを圧倒してる Wikipedia のことだから、広告を掲載すれば年間1億ドルにはなる、と Wales は踏んでるらしい もしそうなれば、もう寄付を集める必要なんて無いねよね Dana Blankenhorn や duke が言ってるように、Wikipedia が自力で金を稼げるビジネスモデルが必要だってのには私も同意 でも広告ってどうなんだろう 前から話にはのぼってるけど、Wikipedia コミュニティ内では広告掲載に対しての反発も根強いみたいだし、また Jimbo の独断 ってことになる? まあ Board of Trustee は早く選任しなきゃね 2005/1/3 追記: この件について Threadwatch が Rumor: Wikipedia to Sell Out? なんていう扇情的なタイトルを でも思ったんだけど、本当に年間1億ドル入ってきたら、きっと分配で揉めるよね Administrator にも金払えとか、そうしたら金を動かせる地位を巡って醜い争いが起きたり 2006/1/3 さらに追記: Clickz が Jimmy Wales による 将来に渡って Wikipedia で広告を受けるつもりはないとのコメント [...]

  • 2006年はクリック詐欺の年 on by mara, [Business,Security] Hatena Bookmark

    脱税2.0 に対抗して詐欺2.0 とでも名付けたいところだけど、これを読んでる人の中にも自分の blog に貼った AdSense を自分でこつこつクリックしてる人がいるんじゃない? Wired に載った How Click Fraud Could Swallow the Internet という記事が、アフィリエイト広告のクリック詐欺が蔓延するアメリカの状況を伝えてる 記事の最初に出てくる Stuart Cauff の旅行会社の出しているアフィリエイト広告のクリック数の40%は、単一のIPアドレスから来ていて、しかもそれはライバル旅行会社のアドレスだったと言う 次に紹介される MarketingExperiments.com の調査結果では、実験用に作ったGoogle Adsense 広告のクリックを分析した結果、29.5%が不正なものと推測されたらしい 他には、referrer を偽装するクリック詐欺用のソフト、それに対抗する Yahoo! や Google のエンジニア達、元クリック詐欺師の証言、インドにあると噂される人海戦術による クリック農場、Splog にゾンビPCと、もりだくさんの内容 しかも記事の最後を読むと、クリック詐欺への対抗策をコンサルする会社、というのが既に山のようにできてるらしい そんな状態だから、Paul Kedrosky は 2006年の予想として クリック詐欺がメインストリームに踊り出る を挙げてて、確かにそうなりそうな勢い ところで TechShout が Google AdSense を偽装するトロイの木馬の話を伝えてて、Om Malik が飛びついて騒いでるけど、こっちはよく意味がわからなかった トロイの木馬を仕込むことができてしまえば、AdSense を偽装する必要なんか無いと思うんだけど

  • wordpress.com vs splog on by mara, [Spam,WordPress] Hatena Bookmark , bilingual

    Some says it was just a matter of time before this happened. Spam bloggers are targetting wordpress.com, Fantastico reports. Of course Doncha moved quickly so the reported splog has already been deleted, however it needs more preventive measures before wordpress.com becomes like Splogspo.., er, Blogspot.

  • 今年失敗した10の技術 on by ultraviolet, [Google,Technology] Hatena Bookmark

    Extreme Tech が、Ten Failed Tech Trends for 2005 と題して、今年失敗した10の技術トレンドを挙げてます。これが結構興味深くて The BTX Form Factor High-Definition Video on the PC High Fidelity Digital Audio Windows XP Professional x64 Edition High Definition Optical Drives Copy Protection for Music CDs iPod Competitors Emerge The Digital Home Gmail Dual Graphics Cards ほおー、Gmail を失敗だと見なすか。しかし確かに言ってることにも一理あって、 Do you have a Gmail address? If [...]

  • Sony rootkit 裁判が和解へ on by mara, [Law,Security] Hatena Bookmark

    Washington Post によると、Sony BMG が rootkit 問題のクラスアクション訴訟で原告と和解することに同意した模様 現在裁判所の審査待ちとのこと 和解案は Sunbelt Blog から PDF 形式でダウンロードできる 和解案で示された条件の中には immediately recall all XCP CDs が入ってるんだけど、てことはやっぱりまだ回収されないで売られてる分があるんだろうね

  • Menéame 日本語化スクリプト作成プロジェクト on by ultraviolet, [WebApps] Hatena Bookmark

    meneame.rauru-block.org にも書きましたが、本家 Menéame スペイン語版のバージョンアップが妙に激しく、手作業で日本語化してたら終わらないうちに次のバージョンが出てしまう状況のため、文字列置換でだいたいのところを自動的に日本語化する perl スクリプト作成を企んじょります。 それで、スペイン語→日本語対応表を作るための Wiki ページを立ち上げましたので、スペイン語に詳しい方のご協力を仰ぎたく。 なんか最近のバージョンでは、パスワード再発行とか、投稿済ニュースを後から編集する機能とか、slashdot みたいなコメント採点システムとか、わけのわからん機能が次々に盛り込まれてるような感触なんすよ。

  • SEO on Wikipedia on by mara, [Spam,Wikipedia] Hatena Bookmark , bilingual

    SEO Refugee encourages people to employ Wikipedia as SEO tool, editing entries to include links to their websites. It says such links should raise the site rank significantly because Wikipedia is a respected site with high page ranks. Damn. Another wikispam consultant. I insist every outgoing link on Wikipedia should automatically include nofollow attribute.

  • アラスカ航空機の事故 on by duke, [Blogging,Media] Hatena Bookmark

    すでに CNN や 産経新聞などで報じられているが、アラスカ航空の MD-80 旅客機が高度7800mを飛行中に機体に穴が開いて減圧するという事故を起こした。 この航空機にたまたま二人の blogger が乗り合わせていた。一人は blog ジャーナリスト の Jeremy Hermanns で、騒然とする客室をカメラ付き携帯で撮影し (飛行中に使っていいのか?)、彼の blog に記事を書いた。彼の撮影した映像はTVニュースでも使われ、tech.memeorandum でも騒がれている。やはり 当事者がニュースを伝える時代である。 もう一人乗り合わせていた blogger とは、これが大笑いなのだが、いや笑ってはいけないのだが、Robert Scoble だった。彼も Scobleizer で記事を書いているが、こちらは「怖かった」と書くのがやっとで、さすがに本業にはかなわないと言うか、当事者なら誰でも立派な記事を書けるわけではないと言うことか。Blog Herald にも Scoble suffers relevance deprivation syndrome over Alaskan Airlines emergency とからかわれている。 2005/12/30 追記: この話が予想外の方向へ展開している。Hermanns の blog 記事に対して罵倒するコメントが複数ついたのだが、Hermanns によるとそれらはいずれもアラスカ航空のIPアドレスからポストされたものだと言う。 この手の「やらせ疑惑」は blogger 達が最も喜ぶものであり、さっそく digg.com でも人気を集めているようだ。

  • イギリスを動かしてるのは誰? on by mara, [Google,Politics] Hatena Bookmark

    Inquirer で見つけたんだけど、BBC Radio 4 が Who Runs Britain? ていう Web 投票をやってる このイギリス支配者候補として挙げられてるのが バロソEU委員長 スーパーマーケット王 Terry Leahy ブラウン大蔵大臣 ブレア首相 オドネル内閣官房長 ルパート・マードック 議会 イギリス人民 人権団体リバティの議長 Chakrabarti Google 最後のはいったい何?