ここでは、DoqueDBの検索機能を、実際に試していただくことができます。
PC上のChrome, Edge, Firefox での動作を確認しておりますが、モバイル環境や、ブラウザによっては動作しない可能性があります。
デモサイトで検索を実施
通常のSQLと同じ、Like検索を実施します。検索結果の順序には条件を付けていないため、上位に表示されるものが該当語句を多く含むなどの結果は期待できません。
マッチするものは通常の検索と同じですが、DoqueDB独自のアルゴリズムにより、検索結果に順位をつけ、その順で出力されます。
カフェ
「カッフェ」、「カフエ」、「カツフエ」、「カフヱ」などを含む部分が表示されます。
難破船 無人島 太平洋 漂流
キーワードに多くマッチした文章が上位に表示されます。関連がありそうな文章は、AND検索では上位に表示されなかったものが、ORでは表示されることがあります。
この結果を比較すると、'early'での検索結果に'nearly'や'clearly'のみが含まれる文章がヒットしていないことがわかります。(両方が出てくる文書は'early'での検索結果にも出てきます。) 英文字列の検索では部分一致によるノイズが膨大になることがあるため、単語単位で検索されることは大きなメリットになります。
前述の標準(Like)検索、キーワード検索の場合は、検索語と完全に一致する文章が対象となります。(ただし、このサイトでは異表記の正規化を実施する設定としてあるので、異表記の文字列が含まれていても一致すると判断されます。)
この類似文書検索では、入力文章を解析し、類似する文章を検索します。
(本来は、文書全体を入力して、類似文書を探す目的でも使用できますが、本サイトでは入力文字数は制限しております。)
覚えている概要を入れて検索
ある作家の文章の一文をそのまま入力して試してみるのも面白いでしょう。(江戸川乱歩『仮面の恐怖王』より)
東京上野公園の不忍池のそばに、ふしぎな建物がたちました。両国のもとの国技館をぐっと小さくしたような、まるい建物で、外がわの壁も、まる屋根も、ぜんぶ、まっ白にぬってあるのです。
同じような語を多く含む作品が検索結果となります。
次のボタンではもう少し長く入力して検索してみる例となります。この場合、検索結果の上位に同じ作家のテキストがより多く現れます。