読者です 読者をやめる 読者になる 読者になる

続 カッコの付け方

AWSを始めとしたクラウドコンピューティング全般と、唯一神emacsにおける()の付け方についてだらだら書きます

AWS CloudSearch値下げ

ElasticSearchとよく間違えられる、AWSのサービスであるCloudSearchですが、値下げが発表されました。

https://aws.amazon.com/jp/blogs/aws/cloudsearch-price-reduction-plus-features/

元の値段がいくらか忘れてしまったので、Billing履歴から確認してみました。東京リージョンの価格です。

m1.small $0.13/h -> $0.082/h (37% off)

m2.xlarge $0.71/h -> $0.359 (50% off)

文字通り50%オフされておりました。また、日本語のサポートとありますが、もともと日本語のデータを入れることはできていました。CloudSearchは特に全文検索で生きてくるので、各種トークナイゼーションに言語が対応していると、より賢い検索が出来ます。

http://docs.aws.amazon.com/ja_jp/cloudsearch/latest/developerguide/configuring-analysis-schemes.html#customizing-japanese-tokenization

このトークナイゼーションについて、用語と共に少しだけ説明

ステミング

説明文のパクリですが、「走った」と「走ってる」などの表現を「走る」に正規化することにより、より漏れのない検索が可能

ストップワード

日本語の場合の説明がうまく出来ないですが、英語の "a" や "the" など、それ自体をインデックスとしても意味のない言葉を指します。日本語の場合は「は」や「です」「ます」あたりが該当するのかな?

シノニム

これはエンジニアだったら分かる言葉です。言い換えですね。たとえば 「加藤茶」 = 「カトちゃん」 など。

全文検索自体は奥が深く、自前構築にはそれなりに知識が必要になってきます。新機能についても、後ほど触ってみたいと思います。

あと、最初に出てきたElasticSearchですが、こちらも検索エンジンですが、AWSとは直接関係有りません。名前からしてAWSのサービスっぽいですが。個人的にはElasticSearchのマネージド・サービスがあれば嬉しいなとも思います。(今の時点ではElasticSearchの方が検索ヒット数が多いとおもいますが...)

広告を非表示にする