連想単語検索

っていう感じのスクリプトを書いている。「ほげほげ」と入力すると、「ほげほげ」といえば「ふがふが」ですよーという単語をサジェストしてくれる。入力された単語をGoogleに投げて、検索結果のページで共起頻度の高い名詞をピックアップするしくみ。
未完成段階で「マドンナ」と入れてみると、「愛媛」や「松山」が浮上。一瞬なぜだろうと首をかしげるが、つまりは夏目漱石の『坊つちやん』なのであった。ウェブサーチは観光業界に翻弄されておるな。意味の部分まで抽出できるスクリプトを自力で書けたらすごいんだろうけど、できるかな。結局Googleから知識を抽出しようとすれば、「なぜだかわからないけれども、とにかくそうなのだ」という形での知識が最初に出てくることになる。