2007-10-01から1ヶ月間の記事一覧

ちかりた

今日は何だかものすごくパワフルな一日を送った。

gdgd

今日のゼミでは、グダグダながらもこの一週間でやったことを何とかみんなに説明したんだけど、そこそこ賛否両論反応が良かったし、のたうちまわった甲斐はあったかなという感。あと二週間かけて一応の形にする予定。

算出

シンプソン係数を応用する見通しが、何となく立った。 しかし、0.7前後の値をとるときがいちばん難しい。

伝説のあなた

素人探偵ししゃもシリーズ ジャスコ上越店湯けむりツアー連鎖列車強盗事件 このへん経由。 伝説のほうでやってみた 伝説のあなた 隊長がfollowしてくれたので、記念にチャレンジしてみました。 伝説のあなた:id:honさんバージョン hon…。彼女は人間としての…

新社名、どーん

「有限会社ハミダス*1」 有限なのにハミ出すあたり。 *1:「株式会社ハミダス」は新潟県に実在しました

やばいのは

こういうことに没頭すると、生活とかが本当にどうでもよくなってくることです。だって今、すごく面白いもん*1。 そこで、ナイスバディかつ容姿端麗なメイドを募集したいと思います。思うだけに留めますが。 *1:中学生のころ、こういう妄想をひたすらノートに…

とっちらかってきた

前提として、ネットワークを形成できるのは名詞の繋がりが相互再帰的である場合だけだ。その前提において、下位の名詞が次々ネットワークに介入してくることはない。まず、その相互再帰性を算出するアルゴリズムを考える必要があるだろう。これを明日の課題…

おかしいところ

シンプソン係数を使うということは、単語の出現数が少なければ数値が高くなるわけだから、出現数の少ない単語があとからあとからネットワークに割り込んできた場合ヒエラルキーが当たり前に逆転することになる。そういう点で今の方針には誤りがある。

こんご

ノード数を考慮に入れる 連関強度の高いノードを採用していく順番は、どのようにするのが効果的か。

そして反例

某アーティスト名で調べると「無料」「視聴」「試聴」のトライアングルに固められる。これも間違っているわけじゃないんだけど、アーティストの楽曲名の方が先に来て然るべきだろう。 ウェブってものが単なるデータベースではなく、商売道具になっているわけ…

あれ

さらに計算を進めたら、アホアホブラザーでもダウンタウンが上位に。間違ってはいないが。次点が坂本龍一。

MML記法の音の仕様、変わった?

以前打ち込んだやつが、全然違う音にきこえるんだけど。気のせい?

シンプソン係数

を応用して冷静に(?)計算し直してみると、アホアホマンを入力したときはダウンタウンが上位に来て、アホアホブラザーを入力したときは坂本龍一が上位に来る。おお、正しいぞ(何が)。 日本語の語法上、特に重要でない単語が頻出してしまうことはありうる…

こんご

接続コストなどの参照(有意な数値が出るかどうか) ネットワークのランク算出

ハミ出せ! 今日のエアプログラマっぷり

散々いろんなコードで見てきたし、頭ではわかっていたのだけれど、 sub foo () { my $bar = shift; # # do something # return $jitensya; } とshiftで書くっていうのをようやく体で理解したのが今日です。 ダイスキ!

単語による文脈の同定

動詞によって意味を形成する余地は最後まで留保しようと思っている(いずれ採用しなければならない)。これは「愛媛」「ポンジュース」「蛇口」という3つの単語があれば一つの文脈(述語による一定の連関)が同定できるという発想に動機の端を発する。 人間…

r(

同一文脈内において共起する名詞同士でネットワークを形成することを考える。そのために、文脈単位での名詞共起頻度を数値化するための簡易データベースを作成。名詞と数字とがコロンを挟んでいる行においてはGoogleでの検索結果にその名詞の出現する数が示…

今日の秘密

朝方夢を見ながらウトウトしていたら、特に便意を催したわけでもないのに肛門括約筋に緊張と激痛とが走り、目が覚めました。例えて言うなら、足がつるような感じです。善意ある読者のために一応言っておきますが、僕に痔の気はありません。 というわけで、し…

なんじゃこりゃ

曇りがちでもこういう日は素敵だなあ 夕焼けモードで撮ってみた

れ(

インターネット特有の文脈を持った単語を、句読点を含んだ自然文ではない文字列を除くことによって弾くというワザにしたって、その有効性に対する疑問は捨てきれない。実際そういう特異な単語は、サイト説明の役割を果たす自然文に多く含まれている。 いくら…

さらに

『ガリレオ』 => 探偵、ドラマ、月、東野、圭吾、フジテレビ って具合に、タイムリーな話題が抽出されちゃうこともありますね。このへんは、さすがGoogle? ただ、この場合、結果としてはOKかもしれませんね。

連想単語検索のケーススタディ

ただ使い倒してるだけなんですが。 『ダディクール』 => 勉強、漢字、英単語 『年賀状』 => イラスト、無料、素材 『名刺』 => 印刷、作成、デザイン ダディには本当に感服した。 大きな数値を叩き出す単語にしばしば見られる現象ですが、おそらくインターネ…

/\___/\ / ⌒ ⌒ ::: \ | (●), 、(●)、 | | ,,ノ(、_, )ヽ、,, | びっくりかき揚げおうどんください | ト‐=‐ァ' .::::| \ `ニニ´ .:::/ `ー‐--‐‐―´´ _| ⊃/(___ / └-(____/

あーでも

これ、見た感じデータ全部を取り込んでから再生してるか。さもありなんというか。

やはり。

まさかとは思ったが、我が家のロースペックWin機じゃ聴けたものではない。Linuxですらアプリが落ちるのだからな。この程度の音数でぶちぶち切れる。時代の要請はメモリの容量であるのだなあ。

MML記法でFirefoxが落ちる

いろんな曲を聴いてからGmailに飛ぼうとしたところで、落ちた。メモリとかの関係ですかね。

ミク

複数人数の初音ミクが合唱曲を歌っているのを聴いた。ダメすぎる。気持ち悪い! じゃあ、歌唱力っていうのはどうやってエミュレートすればいいのだろう。

MML修正

ものすごい勢いで間違っていたので直した。恥ずかしい。たぶん大体これでいいんじゃないかと思う。いや、自信ない。スラッピングのところがわからない。耳が当てにならないので理詰めで。でもわかんない。 音楽のこととなると目の色が変わるのです。 追記:…

あの名曲(の前奏)をMML記法で

今日これ書いてMML記法はだいたい理解した。一定のルールさえ把握すれば、冗長にならないように書けるみたいだ。 というわけで、あの名曲を再現(雷電はいくつか見たのでこっちを)。ぅおお。こんなに神がかったベースラインしてたんだ。しかし、こうやって…

進捗

MeCabの提供する文字種情報によりノイズ判別、除去。