« もしや花粉症再発? | メイン | タイムシーケンシャルなコンテンツ »

2006年02月12日

IPAえらい!

[ネットとか]

IPAという団体があります。その筋では大変有名ですが、実態がよくわからないと勝手に思っていました。

たまたまASCII24の記事を見ていて一番下に「この記事が関連していると思われます」と表示されているのをも見て、「ああ、良くある形態素解析かなにかなのかな」としたまで見ていくとそこに「IPA」の文字が!

バナーもあったので、クリックしてみてみると

汎用連想計算エンジン GETA
汎用連想計算エンジン(GETA)は、文書検索における頻度付き索引データ(どの文書にどの単語が何回出現するというような)を典型とする大規模かつ粗な行列を対象として、行と行あるいは列と列(具体的には文書間および単語間)の類似度を内積型メジャーで高速計算するツールです。
連想検索をはじめ、文書分類、単語間類似度計算など、大規模文書の分析に必要な要素技術をサポートすることを目的としています。

GETA: Generic Engine for Transposable Association


実施機関:(株)日立製作所、国立情報学研究所
東京工業大学、北陸先端科学技術大学院大学、国文学研究資料館

という説明が。これ、FreeBSDで開発されていて、商利用も含めて自由に使えるそうです。なんと、2002年から公開されていて、2003年にはバージョンアップもしていました。

ちなみにIPAとは「独立行政法人 情報処理推進機構」の略です。理事長挨拶を拝借しますと

情報処理推進機構:機構情報

「2005年に世界最先端のIT国家となる」「2006年以降も世界最先端であり続けることを目指す」という国家戦略(e-Japan 戦略)を推進するプロフェッショナル集団が、私たち独立行政法人情報処理推進機構(IPA)です。

とのこと。ひゃあ、そうだったのか。e-Japan 推進集団だったのですね。でも、このテキストマイニング系のソフトうまく使えるといいなぁ。なぜか、IPAのサイト自体の検索は普通の namazu が使われていますが…。ぜひここにも GETA を使っていただいてはどうでしょうね。

でもこういった誰でも使えて、誰もが欲しがっていて、単体では商売に結び付けにくい技術ってのを、行政的役割で整備していくって言うのはいいですなぁ。「日本語」に特化している限り、日本からの流出はおのずと制限されることでしょうし、もっといろいろがんばっちゃってください!

投稿者 akio : 2006年02月12日 06:40

blog seo tool : track word  blog SEO tool