Prolog 二分木をWebから利用可能にした

日本語Wikipediaの全本文をWebから利用できるようにした。

Prolog 二分木検索の使い方

Javascript経由でブラウザから、データを受け取り、phpで、prologサーバーにアクセスし、prologサーバーがwikipediaの二分木データにアクセスし、回答すると言う手順になっている。

prologサーバーがメモリ上に展開し、wikipediaの二分木を咥え込むと、26Gバイトくらいになるので、VPSでは対応できないので、このサーバーだけ、自宅のPCにおいて、そこにアクセスするようになっている。自宅PCは、メモリを64G積んでいるので、なんとか対応できる。大学のPCも16Gなので、メモリエラーになってしまうのだ。

だから、自宅PCでサーバーを動かしている時しか検索できない。問い合わせいただければ、動かす時間をお知らせすることができる。

これで、prologでやろうとしたことの1クールが終わったことになる。

次は、twitterデータを使って、話し言葉でこれに対応してみたい。そして、もっと人間の言葉、日本語の言葉の知能的処理に挑戦したいと思っている。