兵庫県神戸市中央区小野浜町 1-4
国産の全文検索エンジンGroongaに関する勉強会です。主催者は、Groonga/Mroongaを使ったサービス構築経験があり、浅い部分であれば、多少のパッチを作れる程度の知識は有しています。
参加人数が少ないため、今回の開催は見送りたいと思います。何か疑問点があれば、個別に相談はお受けします@naoa_y。
・「全文検索の仕組みとGroongaのトークナイザー別の特性の違い」(主催者:@naoa_y)
全文検索エンジンでは、検索クエリを単位語句(トークン)に分割し、トークンを木構造で探索して文書IDとトークンの文章中の出現位置情報を比較することにより、高速な検索を実現しています(完全転置索引方式)。grep型の検索と違い全文検索エンジンでは、転置索引の作り方によっては検索にヒットしないケースがでてきます。
全文検索の仕組みとGroongaのトークナイザー別の特性の違いを簡単に解説します。
・「GroongaのNgramトークナイザーのカスタマイズ検証(予定) 」(主催者:@naoa_y)
Ngramトークナイザーの弱点である転置索引の肥大化、マッチ回数の増加を抑えるためのカスタマイズを(多少検索できないケースが増えるのを代償に)加えた場合の性能検証結果を紹介する予定です。(まだ実装も検証もしていないので予定です。この部分はなくなるかもしれません。)
・Groonga関連について発表したい方がいれば募集します。当日その場での発表でもOKです。
・発表者がいない場合は、各自でGroonga関連のチュートリアルや、Groonga関連でやりたい作業をやる形にしたいと思います。
使い方やチュートリアルは、公式のドキュメントを参照してください。
疑問点やわからない点等があれば主催者がわかる範囲であればお答えし、わからなければ一緒にお悩みします。
・公式ドキュメント
Groonga http://groonga.org/ja/
MySQLからSQLでGroongaを使えるMroonga http://mroonga.org/ja/
Rubyらしい記法でGroongaを使えるRroonga http://ranguba.org/ja/
その他の言語から使いたい場合 Groonga-GObject http://qiita.com/groonga/items/71b145b37d77bd160bf2 (OS、言語によっては環境構築がちょっと難しいかもしれません。)
Groongaを分散できるDroonga http://droonga.org/ja/
・WebブラウザーでGroongaのコマンドを試すことができるTry Groonga
http://try-groonga.herokuapp.com/
メンテナンス状態はわかりませんが、探せば他にも個人による言語バインディングがあるかもしれません。
http://koberoonga.doorkeeper.jp/events/11578
http://blog.createfield.com/entry/2014/07/03/125507
神戸を中心に関西近郊のGroongaユーザが国産の高速全文検索エンジンGroongaに関する情報を交換するためのコミュニティ Groongaは、国内で活発に開発が続けられており、以下のような多数の関連プロダクトがあります。Groongaに関するものであれば、何でも扱います。 Mroonga: MySQLからGroongaを使うためのストレージエンジン Droonga: 分散Groo...
メンバーになる