-
Influencer 広告
on
2008/07/07 by
, [Business, Google]
人間関係をもとにした広告についての特許を Google が2006年暮れに出願していた。集団内での Influencer を識別して集中的に広告を打とうというもの。
-
ログを紙で提出
on
2008/07/05 by
, [Google, Law]
Google がログ提出を裁判所から命令されたことに対して TechCrunch が「紙で提出すればいい」って言ってる件について
-
プログラミング言語の生誕地
on
2008/07/04 by
, [Google, Programming]
reddit で拾ってきたネタですが、メジャーなプログラミング言語が生まれた場所を Google Maps 上にプロットした地図だそおです。 大きな地図で見る そうか、Ruby の生誕地って Shimane Prefecture だったなそう言えば。しかし知らない言語って結構いっぱいあるなー。 でもこの地図ってオチがあって、Perl も Python も Ruby も入ってるけど、PHP が入ってないんだよね…
-
Google Trends と猥褻さ
on
2008/06/25 by
, [Google, Law]
ある語句/概念が猥褻かどうかを裁判で争う際に Google Trends の検索語句データを証拠として提出しようという話
-
Google の自動学習
on
2008/05/26 by
, [Google]
Google による人類への叛乱 が未だに起きていないのはなぜか。その理由が判明しました。 Google で Director of Search Quality という役職にいた Peter Norvig 氏が語った話を Datawocky が掲載してるんですけど、それによると、Google の研究者は Google 自身に学習させることを一部禁止してるらしい。 Google の検索アルゴリズムについては日々研究と改良が続いてるんですが、それは大きく2レベルに分かれるんだそうです。 集めてきたページから情報を抽出してインデックスを作るフェイズ ユーザの検索語句とインデックスを付き合せて検索結果を生成するフェイズ 第1フェイズはオフラインで時間をかけて行われます。第2フェイズはユーザの検索に対してリアルタイムで行われます。 このうち、第2フェイズについては、ユーザの検索語句統計を Google が学習して回帰分析とか使って自動的にパラメータを調整するようなことになってます。まあデータが膨大になるしな。 ところが第1フェイズにおいては、自動学習はさせず、研究者が手でパラメータ調整を行ってるんだそうです。どういう情報を抽出すれば有効なインデックスが作れるかってのは、ユーザの検索語句統計にも依存するんで、パラメータ調整ってかなり大変そうに思えます。それでも、Google 研究者は頑として手動調整を続けてるんだそうな。 その理由を Norvig は二つ挙げてて、 機械より研究者自身の方が名人芸的な微調整ができる 機械に自動学習させた場合、学習に使ったデータと大幅に異なる状況に直面すると壊滅的(catastrophic)な事態を引き起こす恐れがある なのだそおです。後者がポイントだな。 Datawocky では、Google 以外のエキスパートシステムで自動学習が使われているケースでも同じ問題を抱えているんじゃないか、例えば航空機の自動操縦システムとか、自動株取引システムとか、てな問題提起をしています。 言われて見ると、1987年のブラックマンデーの株価暴落って、自動学習じゃないけど似たような問題がプログラム売買で起きてたわけだしなあ。確かにあり得る。 ちょっと前に、初音ミクが Google 検索結果に表示されなくなった、てな話がありましたが、これもひょっとしたら第2フェイズの自動学習で学習データと現実データの齟齬が生じた結果なのかもしれんですね。Google がどう学習したのかの内部が人間ではよくわからないので、原因究明に時間がかかったとか。 もし第1フェイズまで自動学習させてたら、もっと壊滅的な悲劇を生んでたのかもしれん。例えば かに道楽でぐぐると加瀬大周が出てくる とかな。 しかしどうなんだろう。この学習データと現実データとの齟齬で問題が起きるってのは、まあ人工知能の自動学習では一番問題になりやすいけど、似たようなことは人間でもあるんじゃなかろうか。 人間の場合は、学習データと現実データが違うと「なんか変だぞ」てな常識チェックが働き易いので、そういう問題を回避しやすい、って話だと思います。でも常にそういうチェックが働くかってえと、そうでもなさげな。疑問を持たずに漫然と仕事続けてるとヤバいぞきっと。常識てのは、他人と同じことをするためじゃなくて、何かが正常域を外れた際のアラームとして使われるべきだと思うのだよね。
-
Google Sites
on
2008/02/28 by
, [Google, Wiki]
Google に買収された Jotspot が Google Sites として新装開店
-
Google News のRSSフィード
on
2008/02/14 by
, [Google, RSSFeed]
Google News 英語版には検索結果のRSSフィードへのリンクがあるのに、日本語版だとなぜかリンクが無い
-
Google でネガティブキャンペーン
on
2008/01/31 by
, [Google, Politics]
Google Blogoscoped に載ってた Google ネタを二題 一つ目は Scientology ネタ Google 英語版で Dangerous Cult を検索すると、サイエントロジーの公式サイトがトップに来る これは、アンチサイエントロジーの人が Dangerous Cult っていうテキストに scientology.org へのリンクを張る、いわゆる Google Bomb によって Google の検索結果を操作した結果 過去いろいろ問題になってて、Google もそのたびにアルゴリズムの改良で対処しようとしてるんだけど、やっぱり難しいよね とか言うのが騒がれてたら、それのせいなのかどうかわかんないけど、Google の類義語検索機能を使って ~scientology を検索すると、cult と Travolta も scientology の類義語と見なされて検索される、って状況を Philipp Lenssen が発見 こういうゲーミングをアルゴリズムで対処するのって難しいんだろうなあ そういう点では確かに Wikia が有利なのかも 二つ目はオバマネタ Google Suggest で “is ” まで入力すると、is obama muslim とか is barack obama a muslim とか、オバマはイスラム教徒? 的な質問が多数上位に来る、って話がやはり Google Blogoscoped で報告 確かにそういう検索かけてる有権者は多そう でもこういうのって、前も 人種差別的な Google [...]
-
Google + JotSpot = Google Sites
on
2007/12/03 by
, [Google, Wiki]
Google に買収された JotSpot の Wiki 技術が Google Apps に統合され、さらに Google Page Creator を巻き込んでイントラネット用サービス Google Sites として2008年にサービス開始される模様。
-
Google が Typosquatting を奨励している
on
2007/11/28 by
, [Google, WWW]
Google は typosquatting ビジネス食物連鎖の中で欠く事のできない地位を占めており、typosquatting から利益を上げており、そして typosquatting を奨励している