こんご

これを書かないと作業が中断できないことに気づいた。 3語のネットワークを作る 係数≒1を叩き出す語が類にまとめられうる閾値を探る 類にまとめる場合の技術的方策 3語中で主導権を握る語を係数から算出 一日だとネットワーク作るので限界かな。 あと、どう…

いやもう

マジで居眠り禁止。うがーぐがーがー

今日の進捗

最適化のようなもの。あと、有意でないデータを閾値の設定によって削った。 昼起きな上、某所からの連絡を取り次いでいたらあまり集中できなかった。シングルタスクしかこなせないってのは本当にいかんね。

きちくった

そういえば、kichikutterでいちばん笑ったのはこれ。

明日は

コードの最適化 シンプソン係数データを応用して3語のネットワークを構成 可能であれば、連想単語の評価

今日の進捗

2つの単語が相互にネットワークを形成できる場合のシンプソン係数を算出してリスト化することに成功。リファレンスが使いこなせなくて苦労した。データをハッシュに入れることもできたので*1、次の段階でもすぐに応用することができそうだ。 *1:ハッシュのハ…

てすと

#!/usr/bin/perl use strict; use warnings; my %a = ( "a" => 1, "b" => 2, "c" => 3, ); my %b = ( "d" => 4, "e" => 5, "f" => 6, ); my %c = ( "g" => {%a}, "h" => {%b}, ); my $a = ${$c{"g"}}{"a"}; my $b = $c{"g"}->{"b"}; print "$a\n"; # 1 と表…

Perlのリファレンスに触れる

必要に迫られてというか、自分のやりたいことを実現するために習得するっていうのは、勉強嫌いな僕にとっていちばんいい方法。とにかく、試しに使ってみよう。

落ち込んでいるのか、体調が悪いのか

これらを区別するのが意外と難しいんだということにようやく気づきました。体で理解すると、納得するものです。 身体的な倦怠感があるときにいろいろ考えなきゃいけないことがあると、特にネガティブな想念があるわけでもないのに「俺って後ろ向き…」的な思…

席替え

名前とギャグの続きを教えて下さい - TVで2回位しかみた事がないんです... - Yahoo!知恵袋 なんだこのやりとり

ちかりた

今日は何だかものすごくパワフルな一日を送った。

gdgd

今日のゼミでは、グダグダながらもこの一週間でやったことを何とかみんなに説明したんだけど、そこそこ賛否両論反応が良かったし、のたうちまわった甲斐はあったかなという感。あと二週間かけて一応の形にする予定。

算出

シンプソン係数を応用する見通しが、何となく立った。 しかし、0.7前後の値をとるときがいちばん難しい。

伝説のあなた

素人探偵ししゃもシリーズ ジャスコ上越店湯けむりツアー連鎖列車強盗事件 このへん経由。 伝説のほうでやってみた 伝説のあなた 隊長がfollowしてくれたので、記念にチャレンジしてみました。 伝説のあなた:id:honさんバージョン hon…。彼女は人間としての…

新社名、どーん

「有限会社ハミダス*1」 有限なのにハミ出すあたり。 *1:「株式会社ハミダス」は新潟県に実在しました

やばいのは

こういうことに没頭すると、生活とかが本当にどうでもよくなってくることです。だって今、すごく面白いもん*1。 そこで、ナイスバディかつ容姿端麗なメイドを募集したいと思います。思うだけに留めますが。 *1:中学生のころ、こういう妄想をひたすらノートに…

とっちらかってきた

前提として、ネットワークを形成できるのは名詞の繋がりが相互再帰的である場合だけだ。その前提において、下位の名詞が次々ネットワークに介入してくることはない。まず、その相互再帰性を算出するアルゴリズムを考える必要があるだろう。これを明日の課題…

おかしいところ

シンプソン係数を使うということは、単語の出現数が少なければ数値が高くなるわけだから、出現数の少ない単語があとからあとからネットワークに割り込んできた場合ヒエラルキーが当たり前に逆転することになる。そういう点で今の方針には誤りがある。

こんご

ノード数を考慮に入れる 連関強度の高いノードを採用していく順番は、どのようにするのが効果的か。

そして反例

某アーティスト名で調べると「無料」「視聴」「試聴」のトライアングルに固められる。これも間違っているわけじゃないんだけど、アーティストの楽曲名の方が先に来て然るべきだろう。 ウェブってものが単なるデータベースではなく、商売道具になっているわけ…

あれ

さらに計算を進めたら、アホアホブラザーでもダウンタウンが上位に。間違ってはいないが。次点が坂本龍一。

MML記法の音の仕様、変わった?

以前打ち込んだやつが、全然違う音にきこえるんだけど。気のせい?

シンプソン係数

を応用して冷静に(?)計算し直してみると、アホアホマンを入力したときはダウンタウンが上位に来て、アホアホブラザーを入力したときは坂本龍一が上位に来る。おお、正しいぞ(何が)。 日本語の語法上、特に重要でない単語が頻出してしまうことはありうる…

こんご

接続コストなどの参照(有意な数値が出るかどうか) ネットワークのランク算出

ハミ出せ! 今日のエアプログラマっぷり

散々いろんなコードで見てきたし、頭ではわかっていたのだけれど、 sub foo () { my $bar = shift; # # do something # return $jitensya; } とshiftで書くっていうのをようやく体で理解したのが今日です。 ダイスキ!

単語による文脈の同定

動詞によって意味を形成する余地は最後まで留保しようと思っている(いずれ採用しなければならない)。これは「愛媛」「ポンジュース」「蛇口」という3つの単語があれば一つの文脈(述語による一定の連関)が同定できるという発想に動機の端を発する。 人間…

r(

同一文脈内において共起する名詞同士でネットワークを形成することを考える。そのために、文脈単位での名詞共起頻度を数値化するための簡易データベースを作成。名詞と数字とがコロンを挟んでいる行においてはGoogleでの検索結果にその名詞の出現する数が示…

今日の秘密

朝方夢を見ながらウトウトしていたら、特に便意を催したわけでもないのに肛門括約筋に緊張と激痛とが走り、目が覚めました。例えて言うなら、足がつるような感じです。善意ある読者のために一応言っておきますが、僕に痔の気はありません。 というわけで、し…

なんじゃこりゃ

曇りがちでもこういう日は素敵だなあ 夕焼けモードで撮ってみた

れ(

インターネット特有の文脈を持った単語を、句読点を含んだ自然文ではない文字列を除くことによって弾くというワザにしたって、その有効性に対する疑問は捨てきれない。実際そういう特異な単語は、サイト説明の役割を果たす自然文に多く含まれている。 いくら…