掲示板お問い合わせランダムジャンプ

トップスペース
 

2007年12月14日
2つのテキストの類似度測定(&文字数カウント)
文章A:

文章B:

 含まないもの 改行 半角空白 タブ

 文章Aと文章Bの類似度(引用度)を測定しつつ、文字カウントします。

 下のブログで紹介されているアルゴリズムを元にJavaScript作りました。
 livedoor Developers Blog:String::Trigram でテキストの類似度を測る

 「類似度」といっても正確には反対側の文章からどれくらい引用しているか測定しているだけなので、表記上は「引用度」としています。
 こんなのを作って何ですが、このスクリプトが何の役に立つか分からず作りました。文字カウント機能もついているので、他の文字カウントサイト程度には使えると思います。
[ 投稿者:うえぽん at 22:20 | 雑記 | コメント(0) | トラックバック(0) ]

この記事へのコメント

この記事へのトラックバック

この記事へのトラックバックURL
http://shinshu.fm/MHz/14.30/a00011/0000218821.trackback

この記事の固定URL
http://shinshu.fm/MHz/14.30/archives/0000218821.html

記事へのコメント
 
簡単演算認証: 8 x 5 + 5 =
計算の答えを半角英数字で入力して下さい。
名前: [必須]
URL/Email:
タイトル:
コメント:
※記事・コメントなどの削除要請はこちら