【TECH BLOG】Elasticsearchで日本語検索を扱うためのマッピング定義

こんにちは、検索基盤部検索基盤ブロックの渡です。私は検索基盤ブロックで、主にZOZOTOWNの検索周りのシステム開発に従事しています。

以前の記事では、Elasticsearchのマッピング設定の最適化について取り上げました。そして、今回は日本語による形態素解析を実現するまでの手順をご紹介します。

Elasticsearchのマッピング設定最適化によるインデキシングパフォーマンス改善への取り組み - ZOZO TECH BLOG

こんにちは。EC基盤本部検索基盤部検索基盤チームの有村（@paki0o ）です。みなさん、Elasticsearchのマッピングはどこまで厳密に管理されているでしょうか。弊社では以前のテックブログでご紹介した通り、一部を除き Explicit Mapping にてデータを管理しています。 ...

https://techblog.zozo.com/entry/es-mapping-configuration

はじめに

ZOZOTOWNの検索機能では、Elasticsearchを利用しています。現在では検索機能の全般でElasticsearchを利用していますが、リリース当初はキーワード検索を実現するために採用していました。そのため、全文検索を実現するためのマッピング定義やAnalyzerを理解する必要がありました。

Elasticsearchで全文検索を実現させる手順

Elasticsearchの環境準備
マッピングの定義どのようにデータを格納するかを決める
　・どのようにデータを格納するかを決める
Analyzerの定義どのように分割するか（検索でヒットさせるか）を決める
　・どのように分割するか（検索でヒットさせるか）を決める
データの投入
検索

本記事では、2. と 3. を取り扱います。

全文検索のためのマッピング定義

ドキュメント内の各フィールドのデータ構造やデータ型を記述した情報のことをマッピングと呼びます。

Mapping | Elasticsearch Guide [7.15] | Elastic

Mapping is the process of defining how a document, and the fields it contains, are stored and indexed. Each document is a collection of fields, which each have their own data type. When mapping your data, you create a mapping definition, which contains a

https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping.html

下記はマッピング定義の例です。

PUT /sample_index
{
  "mappings": {
    "properties": {
      "age":    { "type": "integer" },
      "email":  { "type": "keyword" },
      "name":   { "type": "text" }
    }
  }
}

また、文字列をフィールドに格納するためのデータ型には下記の2種類が存在します。全文検索では、文章から特定の文字列を検索することを指すため、前者のtext型のフィールドを使用します。

text型
　Analyzerによる単語の分割が行われ、転置インデックスが形成される
keyword型
　Analyzerによる単語の分割が行われず、原形のまま転置インデックスが形成される

Analyzerの構造

全文検索するために文章を単語の単位に分割する処理機能をAnalyzerと呼びます。

下記はマッピング定義の例です。

なお、Elasticsearchがデフォルトで提供するAnalyzerは公式ドキュメントで参照可能です。

Built-in analyzer reference | Elasticsearch Guide [7.15] | Elastic

Elasticsearch ships with a wide range of built-in analyzers, which can be used in any index without further configuration: The standard analyzer divides text into terms on word boundaries, as defined by the Unicode Text Segmentation algorithm. It removes

https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-analyzers.html

PUT sample_index
{
  "mappings": {
    "properties": {
      "goods_name":{
        "type": "text",
        "analyzer": "standard"
      }
    }
  }
}

そして、Analyzerは3つの処理ブロックから構成されています。

Character filters
　1文字単位の変換処理
Tokenizer
　トークン（単語）に分割する処理
Token filters
　各トークンに対する変換処理

上記の処理を用い、Analyzerは下記の流れで変換処理を行います。

続きはこちら

株式会社ZOZOでは一緒に働く仲間を募集しています

株式会社ZOZOからお誘い

この話題に共感したら、メンバーと話してみませんか？

【TECH BLOG】Elasticsearchで日本語検索を扱うためのマッピング定義

株式会社 ZOZO

株式会社ZOZO / その他

株式会社ZOZO

ZOZOは、ファッションEC「ZOZOTOWN」を中心とする様々なファッションサービスを展開しています。 ■「ZOZOTOWN」 https://zozo.jp/ ファッションEC。 1,600以上のショップ、9,000以上のブランドを取り扱う。常時107万点以上の商品数と毎日平均2,700点以上の新着商品を掲載。（2025年9月末時点） ■「WEAR by ZOZO」 https://wear.jp/ 日本最大級のファッションコーディネートアプリ。ダウンロード数は1,900万件を突破。幅広いジャンルのユーザーによる1,400万件以上の投稿から、AIによる診断をもとに、あなたに「似合う」コーディネートや最新トレンドが探せて、さらにノウハウ動画やメイク投稿、フルメイクAR機能で、メイクを含む豊富なファッション情報が手に入る。（2025年9月末時点） ■「ZOZOUSED」 https://zozo.jp/zozoused/ ブランド古着のファッションゾーン。平均約7,000のブランドを取り扱い、毎日1万点以上の新着アイテムを掲載。（2024年度末時点）カジュアルブランドからハイブランドまで幅広いアイテムを中古ならではのお得な価格で販売。 ■「Fulfillment by ZOZO」 https://fbz.zozo.com/ ZOZOTOWN出店企業の自社ECのフルフィルメント支援サービス。自社EC運営のための撮影・採寸・梱包・配送などの各種フルフィルメント業務を、ZOZOの物流拠点「ZOZOBASE」が受託。設備投資・人件費・在庫保管料などの負担なしで、自社ECの運営が可能。各販売チャネル（自社EC・店舗・ZOZOTOWN）の在庫連携が可能なため、商品欠品による販売機会の損失を最小化。 ■「ZOZOSUIT」 https://corp.zozo.com/measurement-technology/ 3D計測用ボディースーツ「ZOZOSUIT」は、スーツ全体に施されたドットマーカーをスマートフォンのカメラで360度撮影することで、身体の精緻な3Dモデル生成が可能。 ■ZOZOMAT https://zozo.jp/zozomat/ 足の3D計測用マット「ZOZOMAT」は、マット全体に施されたドットマーカーをスマートフォンのカメラで360度撮影することで、自宅にいながら簡単に高精度な足の3D計測が可能な計測ツール。マットに片足ずつのせ、それぞれの足をスマートフォンで撮影することで、足長・足幅・足囲などの複数箇所の計測が可能。 ■ZOZOGLASS https://zozo.jp/zozoglass/ フェイスカラー計測ツール「ZOZOGLASS」は、ECにおけるコスメ購入時の課題であった「色選び」に関する不安や悩みを解消する計測ツール。スマートフォンのカメラで撮影したグラス本体の丸いマーカーによってカラーチップの位置と配置を識別し、正面に施されたカラーチップの色をもとに肌の色を検出、カラーチップ本来の登録カラーとの補正によって肌の色を計測することが可能。 ■ZOZOFIT https://zozofit.com/ 3Dボディースキャンサービス「ZOZOFIT」は、ジムや自宅にいながら手軽で高精度な3Dボディースキャンおよび計測データのトラッキングを可能にするサービス。 3D計測用ボディースーツ「ZOZOSUIT」の技術を活用した初のサービスとして、米国にて展開。

フォロー

株式会社 ZOZOさんにいいねを伝えよう

株式会社 ZOZOさんや会社があなたに興味を持つかも

株式会社ZOZO

【TECH BLOG】Elasticsearchで日本語検索を扱うためのマッピング定義

はじめに

Elasticsearchで全文検索を実現させる手順

全文検索のためのマッピング定義

Analyzerの構造

株式会社ZOZO

同じタグの記事

今週のランキング