ElasticSearchとよく間違えられる、AWSのサービスであるCloudSearchですが、値下げが発表されました。
https://aws.amazon.com/jp/blogs/aws/cloudsearch-price-reduction-plus-features/
元の値段がいくらか忘れてしまったので、Billing履歴から確認してみました。東京リージョンの価格です。
m1.small $0.13/h -> $0.082/h (37% off)
m2.xlarge $0.71/h -> $0.359 (50% off)
文字通り50%オフされておりました。また、日本語のサポートとありますが、もともと日本語のデータを入れることはできていました。CloudSearchは特に全文検索で生きてくるので、各種トークナイゼーションに言語が対応していると、より賢い検索が出来ます。
このトークナイゼーションについて、用語と共に少しだけ説明
ステミング
説明文のパクリですが、「走った」と「走ってる」などの表現を「走る」に正規化することにより、より漏れのない検索が可能
日本語の場合の説明がうまく出来ないですが、英語の "a" や "the" など、それ自体をインデックスとしても意味のない言葉を指します。日本語の場合は「は」や「です」「ます」あたりが該当するのかな?
シノニム
これはエンジニアだったら分かる言葉です。言い換えですね。たとえば 「加藤茶」 = 「カトちゃん」 など。
全文検索自体は奥が深く、自前構築にはそれなりに知識が必要になってきます。新機能についても、後ほど触ってみたいと思います。
あと、最初に出てきたElasticSearchですが、こちらも検索エンジンですが、AWSとは直接関係有りません。名前からしてAWSのサービスっぽいですが。個人的にはElasticSearchのマネージド・サービスがあれば嬉しいなとも思います。(今の時点ではElasticSearchの方が検索ヒット数が多いとおもいますが...)