掲示板お問い合わせランダムジャンプ

トップスペース
 

2007年12月14日
2つのテキストの類似度測定(&文字数カウント)
文章A:

文章B:

 含まないもの 改行 半角空白 タブ

 文章Aと文章Bの類似度(引用度)を測定しつつ、文字カウントします。

 下のブログで紹介されているアルゴリズムを元にJavaScript作りました。
 livedoor Developers Blog:String::Trigram でテキストの類似度を測る

 「類似度」といっても正確には反対側の文章からどれくらい引用しているか測定しているだけなので、表記上は「引用度」としています。
 こんなのを作って何ですが、このスクリプトが何の役に立つか分からず作りました。文字カウント機能もついているので、他の文字カウントサイト程度には使えると思います。
[ 投稿者:うえぽん at 22:20 | 雑記 | コメント(0) | トラックバック(0) ]