WebDB Forum 2013
2012年10月にリクルートグループの技術部門として設立
http://recruit-tech.co.jp/
2011/09/01 リクルート入社
Query Analyze Search System
これまでバラバラに構築していた、検索基盤を1つの共通基盤に集約することで、検索品質、フィードバック、
メイン基盤にElasticsearchを利用して必要な機能(Plugin)をJavaで開発。データ集計、機械学習をHadoop。Jenkinsにて、Test〜デプロイの自動化。サーバ環境の自動構築にChef。極力自動化をすることでオペミスを減らす。
Query及びindexの正規化
クエリ < = > indexを正規化することでヒット率の向上
検索のモジュールを共通化する事で、機能実装が簡単
1つの検索システムで複数のサービスを提供することで、運用&開発コストを下げる
バラバラだったログフォーマットを共通化することで簡単に分析できるようにする
分析基盤を整える事で、メトリクス指標の共通化、検索品質のフィードバックをシステムに取り入れやすくする
2013/08/01 リクルートテクノジーズ入社
件数 | 評価 | |||
0. ゼロマッチ | ||||
A. Ranking を考慮した CTR | ||||
1. 適切な Hit 数 | ||||
Relevance (関連性) | ⇒ | B. 直帰率 | ||
2. too many | ⇒ | |||
C. 離脱率 | ||||
3. too few | ||||
D. Conversion率 |
コンテンツがない (望まれた未開の領域) | ||||
1. クエリ OK | ⇒ | |||
Vocabulary Mismatch (Query Revision, Query Contraction) | ||||
ゼロマッチ | ⇒ | |||
2. クエリ NG | ⇒ | スペラー |
Query Expansion (クエリ拡張) | Query Revision (クエリ訂正) | Query Contraction (クエリ縮退) | |
Too many | 有効 | 有効 | 無効 |
Too few | 無効 | 有効 | 有効 |
「関連性の向上」「重点の解決」を目指すが、破ってはいけないユーザーへの防御