Mercari Engineering Blog

We're the software engineers behind Mercari. Check out our blog to see the tech that powers our marketplace.

ナレッジグラフを使った解釈可能な推薦システム

The English version is available here.

こんにちは。メルカリで 8 月から機械学習エンジニアのインターンをしている @joisino_ です。インターンでは、ナレッジグラフを使った推薦システムをメルカリの実データを用いて検証を行いました。その結果をこの記事で紹介します。

ナレッジグラフとは?

ナレッジグラフ(知識グラフ・ナレッジベース)とは、様々な知識を一つの巨大なグラフにまとめたデータベースです。たとえば、本のデータの場合、本そのものや著者や出版社などがグラフのノードになり、どの本がどの著者によって書かれたか、どの出版社がどの本を出版したといった関係が辺によって表されます。

世の中には DBPediaYAGO など様々なナレッジグラフが公開されていますが、今回は推薦システムを作るにあたって、メルカリのカタログデータから独自のナレッジグラフを構築しました。カタログデータは以下のような形式になります。

タイトル 著者 出版社 ターゲット カテゴリ
ぼくは王さま 和歌山静子/寺村輝夫 理論社 幼児
あいうえおうさま 和歌山静子/寺村輝夫/杉浦範茂 理論社 幼児 仮名

以下の図が、構築したナレッジグラフの一部分を図示したものと、その中から上の表に対応する部分を拡大したものです。

f:id:joisino:20190828142132p:plain:w400:left f:id:joisino:20190828142101p:plain:w400

ナレッジグラフの属性ノードの情報を活用することで、お客さまが以前に購入した本と同じ著者の本を推薦するといった、商品情報をもとにした推薦が可能になります。

モデルについて

知識グラフを使った推薦は HeteRec [Yu et al., 2014] をはじめ、数年前から盛んに研究されています。今回はそのなかでも解釈性が高く、大きなデータにもスケールする KGCN [Wang et al., 2019] をもとにモデルを作りました。KGCN はグラフニューラルネットワークをもとにしたモデルです。技術的な詳細については英語版の記事を参照してください。

実験

以下の 3 つのタスクをメルカリの本のデータを使って実験することで、ナレッジグラフを使った推薦の有効性を確認しました。

  • 商品推薦
  • 商品・商品推薦
  • 著者・著者推薦

定量的な評価や速度の評価など、技術的な実験結果については英語版の記事を参照してください。

商品推薦

まずは基本となる、お客さまに対して商品を推薦するタスクの実験を行いました。ここでは、実際のお客さまの購入履歴を公開することはできないので、仮想的なお客さまの購入履歴を作成し、その仮想的なお客さまに対する推薦結果を紹介します。

以下の表は、左列の 10 件がお客さまの購入した商品履歴で、右側の 10 件がこのお客さまに対する推薦商品です。購入履歴と推薦商品の行は対応しているわけではなく、それぞれ独立していることに注意してください。また、右側にある推薦理由はモデルによって自動で生成されます。このような理由を提示することで、納得感の強い推薦になっているかと思います。解釈性を伴った推薦ができることも、ナレッジグラフを使った推薦システムの大きな強みのひとつです。

まずは、小さいこどもを持つ裁縫好きの主婦・主夫を想定して作ったお客さまです。推薦商品を見てみると、こども服の裁縫に関する本が中心に推薦されています。

お客さまが購入した商品推薦商品推薦理由
おうちで給食ごはん小さくてもきちんとした服洋裁(子ども服)に関する本のため
愛情いっぱい手作りの赤ちゃん服かんたん!かわいい!はじめての赤ちゃん服と小物洋裁(子ども服)に関する本のため
ハンドメイドベビー服きれいに縫うための基礎の基礎洋裁に関する本のため
いちばんよくわかる赤ちゃんと小さな子の服女の子のまいにちの服洋裁(子ども服)に関する本のため
3歳からのおべんとう女の子のシンプルでかわいい服洋裁(子ども服)に関する本のため
ぼく、アンパンマン!簡単に作れて、とことん使える日常着洋裁(婦人服)に関する本のため
ちくちくはじめて赤ちゃんスタイ初めての育児ひよこクラブによる出版のため
ワンポイント刺しゅう図案365女の子のおしゃれ服洋裁(子ども服)に関する本のため
1色刺繍と小さな雑貨おしゃれが好きな女の子の服洋裁(子ども服)に関する本のため
あかちゃんのために作るもの子供服ソーイングLESSON BOOK洋裁(子ども服)に関する本のため

次に、東野圭吾や百田尚樹の小説が好きということを想定して作ったお客さまです。推薦商品と理由を見てみると、東野圭吾の小説が中心に推薦されています。

お客さまが購入した商品推薦商品推薦理由
西の魔女が死んだ危険なビーナス東野圭吾による著作のため
ナミヤ雑貨店の奇蹟祈りの幕が下りる時東野圭吾による著作のため
マスカレード・イブマスカレード・ナイト東野圭吾による著作のため
陸王パラレルワールド・ラブストーリー東野圭吾による著作のため
下町ロケット新参者東野圭吾による著作のため
夢幻花悪意東野圭吾による著作のため
幸福な生活ラプラスの魔女東野圭吾による著作のため
影法師眠りの森東野圭吾による著作のため
流星の絆ルビンの壺が割れた新潮社による出版のため
アキラとあきらフォルトゥナの瞳百田尚樹による著作のため

最後に、文系の高校生・受験生ということを想定して作ったお客さまです。推薦商品を見ると、高校生向けの参考書を推薦できています。また、このお客さまが購入したことのある「大学入試全レベル問題集現代文」や「パラグラフリーディングのストラテジー」の続編を推薦できています。

お客さまが購入した商品推薦商品推薦理由
漢文ヤマのヤマ漢文道場Z会による出版のため
得点奪取現代文古文上達仲光雄による著作のため
パラグラフリーディングのストラテジー 1大学入試全レベル問題集現代文 3高校生をターゲットとした本のため
大学入試全レベル問題集現代文 1中堅私大古文演習高校生をターゲットとした本のため
大学入試全レベル問題集現代文 2実力をつける日本史100題Z会出版編集部による出版のため
実力をつける世界史100題パラグラフリーディングのストラテジー 2高校生をターゲットとした本のため
はじめる日本史 要点&演習古文高校生をターゲットとした本のため
生物〈生物基礎・生物〉基礎問題精講センター試験現代社会集中講義高校生をターゲットとした本のため
センター古文満点のコツ「源氏」でわかる古典常識高校生をターゲットとした本のため
金の漢字最強編 大学受験大学入試全レベル問題集現代文 4高校生をターゲットとした本のため

商品・商品推薦

次に、商品に対して別の商品を推薦するタスクの実験を行いました。こちらは商品ページに関連商品として提示することを想定しています。「この商品を買った人は、この商品も購入しています」を思い浮かべるとわかりやすいかと思います。以下の表が、実際にモデルが出力した商品・商品推薦の結果です。一番上の行が元にする商品で、二行目以降が、その商品に対する推薦商品です。関連の強い商品が推薦されていることが見て取れます。

クエリ
アンパンマンのパトロール
高校入試でる順ターゲット中学英単語1800練習ノート
はじめてのゲーム理論
1 位メロンパンナのはなばたけ高校入試でる順中学英単語練習ノートターゲット1800ゲーム理論・入門 人間社会の理解のために
2 位ロールパンナとカレーパンマン高校入試グループでまとめて覚える中学英単語ゲーム理論ワークブック
3 位きれいにしようねみんなのて高校入試でる順ターゲット中学英熟語380ゲーム理論
4 位アンパンマンのおいしいなかまたち高校入試スーパーゼミ英語リスニング新版 ゲーム理論・入門 人間社会の理解のために
5 位ともだちいっぱい中学英語レベル別問題集 高校受験 1マクロ経済学
6 位アンパンマンとおかいものすっきりわかる中学英語長文1~3年マクロ経済学入門
7 位アンパンマンとアイウエオ英文法パターンドリル 英文法はくり返し書いて覚える 中学1年入門社会経済学 資本主義を理解する
8 位しょくぱんまんとトースターマン英文法・英作文問題精講 高校入試都市・地域経済学への招待状
9 位アンパンマンとすいぞくかん中学英語レベル別問題集 高校受験 2経営学で考える
10 位やきそばパンマンとめいけんチーズ英文法パターンドリル 英文法はくり返し書いて覚える 中学2年マクロ経済学

著者・著者推薦

今回使ったモデルは、商品やお客さまだけでなく、著者やカテゴリといった属性ノードについても埋め込みが得られるので、お気に入りの著者に対して他の著者を推薦するといった属性に対する属性の推薦も可能になります。お気に入りの著者の著作を読み尽くしたあと、その著者に似た別の著者を見つけるのに苦労することも多いので、このような機能があるといかに便利かは納得いただけるかと思います。このような属性どうしの推薦が可能なのもナレッジグラフを使った推薦の強みです。

以下の表が実際にモデルが出力した著者・著者推薦の結果です。たとえば、東野圭吾には、辻村深月や湊かなえといったミステリ・推理作家が推薦されています。また、池上彰には、同じくビジネスパーソン向けの解説書などを多く執筆する齋藤孝、茂木健一郎、林修が推薦されています。「ジョジョの奇妙な冒険」で有名な漫画家の荒木飛呂彦には、「進撃の巨人」で有名な諫山創や「鋼の錬金術師」で有名な荒川弘が推薦されています。有元葉子は料理研究家として多くの主婦・主夫向けの料理本や暮らしについての本を執筆している方です。彼女に対しては、同じく料理研究家のワタナベマキや、暮らしについての本を執筆する柳沢小実が推薦されています。

クエリ
東野圭吾
伊坂幸太郎
池上彰
荒木飛呂彦
有元葉子
1 位辻村深月有川浩齋藤孝諫山創ワタナベマキ
2 位湊かなえ東野圭吾茂木健一郎荒川弘柳沢小実
3 位薬丸岳朝井リョウ林修小畑健石村由起子
4 位西加奈子恩田陸古市憲寿石田スイ石井佳苗
5 位三浦しをん荻原浩塚本亮森薫梶晶子
6 位雫井脩介西加奈子池谷裕二長月達平中川たま
7 位伊岡瞬中村文則野中香方子堀越耕平山脇りこ
8 位芦沢央真梨幸子テレビ東京報道局冨樫義博青山有紀
9 位池井戸潤乾くるみ岸見一郎小太刀右京三宅郁美
10 位村田沙耶香島本理生外山滋比古押見修造渡辺有子

この例の他にも、お客さまへの著者の推薦や、商品に対する関連著者の推薦など、ナレッジグラフを用いた推薦システムは様々な応用が可能になります。

おわりに

この記事では、今回のインターンで行った、ナレッジグラフを使った推薦システムの検証を紹介しました。実験では、解釈可能な推薦や、属性間の推薦など、従来の協調フィルタリングベースの推薦では不可能だったタスクが実行可能になったことを確認しました。このナレッジグラフを使った推薦システムにより、より良い体験をお客さまにお届けできるようになると考えています。

ここまでお読みいただきありがとうございました。楽しんでいただければ幸いです。

参考文献

Hongwei Wang, Miao Zhao, Xing Xie, Wenjie Li, Minyi Guo. Knowledge Graph Convolutional Networks for Recommender Systems. WWW, 2019.

Xiao Yu, Xiang Ren, Yizhou Sun, Quanquan Gu, Bradley Sturt, Urvashi Khandelwal, Brandon Norick, Jiawei Han. Personalized entity recommendation: a heterogeneous information network approach. WSDM, 2014.