プレイリストの自動継続機能に対する
グラフに基づいた楽曲推薦アルゴリズムの提案
伊藤寿浩1 塩川浩昭2
1. 筑波大学情報科学群情報科学類, 2. 筑波大学計算科学研究センター
1
• APC: 与えられたプレイリストに最も続きそうな楽曲を推薦するタスク
• 良いAPCシステム…
• 与えられたプレイリストからその特徴,ユーザの好みを的確に推論できる
• 特徴に合う楽曲を的確に推薦できる
• ユーザの好みを適切に捉えるプレイリスト自動継続(APC)システム
2
🎵 紅蓮華 / LiSA
🎵 KICK BACK / 米津玄師
🎵 アイドル / YOASOBI
…
プレイリスト 推薦システム
アニメの主題歌が多い 最近の曲が多い
🎵 残響散歌 / Aimer
🎵 ミックスナッツ / Official
髭男dism
…
推薦結果
本研究の目的
(APC問題)
楽曲配信サービスの持つ楽曲全体の集合を ℳ,プレイリスト全体の集合を 𝒫,クエリとし
て与えられるプレイリストを 𝑝! ,自然数 𝑘 が与えられたとき,APC問題は
!
!∈ℳ"(%#)
𝑓(𝑚)
を最大にするような 𝑘 曲の楽曲 ℳ$(𝑝!) を楽曲集合 ℳ ∖ 𝑝! から選択し,推薦する問題と
定義される.
𝑓(𝑚) は楽曲 𝑚 とプレイリスト 𝑝! の適合度を表す関数である.
(使用できる情報)
• 楽曲配信サービスに含まれる楽曲
• 楽曲の属性
• 楽曲配信サービス上のプレイリスト
3
問題定義
p コンテンツベースの手法
• 楽曲の属性に基づいて楽曲間の類似度を測定
• 楽曲の属性の例:アーティスト,ジャンル,リリース年など
• 問題点 : 楽曲の属性情報だけではプレイリストの特徴を捉えきれない
4
🎵 紅蓮華 / LiSA
🎵 KICK BACK / 米津玄師
🎵 アイドル / YOASOBI
…
プレイリスト 最近の曲が多い
アニメの主題歌が多い
人気な曲が多い × 属性情報では全くわからない!
○ 捉えられる
△ 好きなアニメの種類まではわからない
⇨推薦結果に人気のない楽曲が多く含まれてしまう
既存研究
p 協調フィルタリング
• アイデア: プレイリストが似ていれば,作成したユーザの好みも似ている
• 与えたプレイリストに類似するプレイリストの楽曲から優先して推薦される
• 問題点:属性情報が考慮できない,コールドスタート
5
推薦システム
🎵×50
プレイリスト
プレイリストの特徴を
よく捉えた推薦
推薦結果
🎵×3
プレイリスト
類似性を求めるのが困難,
品質の低い推薦
推薦結果
既存研究
アイデア:楽曲の属性とプレイリストの類似性の両方を考慮
6
提案手法: 概要
1.楽曲と楽曲の属性,プレイリストの
関係をグラフでモデル化
2.入力のプレイリストに関連する
サブグラフ(SoI)を抽出
3. SoI でPersonalized PageRank
(PPR)を計算し,推薦する楽曲を
決定
楽曲配信サービス上のプレイリスト,楽曲,楽曲の属性を頂点で表し,
1つのグラフでモデル化
楽曲の属性とプレイリストの類似性の両方を考慮できる基盤となる
7
プレイリストA プレイリストB プレイリストC
紅蓮華 KICK BACK アイドル 夜に駆ける 怪物
LiSA 米津玄師 YOASOBI アニメ 2023リリース
Step 1 : 三部グラフの構築
Playlists
Tracks
Properties
Playlists
SoI: 与えられるプレイリストに含まれる楽曲の2-hop先の頂点までを
含んだサブグラフ
8
Step 2 : サブグラフ(SoI)の抽出
Tracks
Properties
Playlists
Tracks
Properties
入力プレイリストに含まれる楽曲をSoIに含む
9
Step 2 : サブグラフ(SoI)の抽出
Playlists
Tracks
Properties
SoIに含まれた楽曲が入っているプレイリスト,関連する属性,接続し
ているエッジをSoIに含む
10
Step 2 : サブグラフ(SoI)の抽出
Playlists
Tracks
Properties
SoIに含まれたプレイリストに属する楽曲,SoIに含まれた属性を持つ
楽曲,接続しているエッジをSoIに含む
11
Step 2 : サブグラフ(SoI)の抽出
SoIの抽出は入力のプレイリストに関連しない部分を除外する
Personalized PageRank (PPR)
• グラフ上で興味のある頂点を指定したとき,その頂点への影響度を示す値
• Personalized Vectorによって興味のある頂点に重みを与える
楽曲推薦の手順
1. 入力プレイリストに含まれる楽曲に均等な重みを与え,PPR値を各楽曲ごとに算出
2. PPR値の高い順に上位k曲を選択しユーザに推薦
0 1 2
4
3
Graph Personalized Vector
(頂点0を指定)
1
0
0
0
0
PPR
0: 0.308 …
1: 0.261 …
2: 0.074 …
3: 0.198 …
4: 0.158 …
各頂点のPPR値
12
Step 3 : Personalized PageRank (PPR) による楽曲推薦
• 原因:PPR固有の性質
• PPRでは次数の低い頂点に隣接する頂点のPPR値が高くなる傾向
• 次数の低い頂点=プレイリストに入るのが珍しい楽曲
• 解決:頂点の次数に応じて重みを与える
• 次数が小さければ小さい重み,大きければ大きい重みを与えることで解消
次数の多い頂点:
周りの頂点のPPR値は低い
次数の低い頂点:
周りの頂点のPPR値は高い
13
PPRの問題点1. 人気のない楽曲に推薦が偏りやすい
• 原因:Personalized vectorの重みを楽曲のみに与えていること
• Mustoらの研究*1によって,ユーザは楽曲の属性に対して強い好みを持つこ
とが示唆されている
• 解決:楽曲だけでなく属性に対しても重みを与える
*1: Musto et al., Tuning Personalized PageRank for Semantics-Aware Recommendations Based on
Linked Open Data, In Proc. ESWC 2017, pp. 169–183 (2017).
改良前: 楽曲のみに重み 改良後: 楽曲と属性に重み
14
PPRの問題点2. ユーザの属性への好みを反映できていない
• プレイリスト:Spotify Million Playlist Dataset Challenge*1によって公開されて
いるプレイリストのうち10000個のプレイリストを使用する
• プレイリストは2つに分割しておく
• プレイリスト群A:楽曲配信サービス上のプレイリストとして利用する
• プレイリスト群B:クエリとして与えるプレイリストとして利用する
• 楽曲の属性情報としては以下を用いた
Ø アーティスト名
Ø アルバム名
Ø ジャンル
Ø 楽曲がリリースされた年
楽曲 プレイリスト アーティスト アルバム ジャンル
170,089 10,000 35,892 81,552 3,865
使用するデータセットの統計情報
15
https://www.aicrowd.com/challenges/spotify-million-playlist-dataset-challenge
データセット
推薦の品質に関して提案するアルゴリズムの有効性を考察
• 推薦の品質を測る方法:推薦結果の正解データを用意
プレイリスト群B
クエリのプレイリスト
入力
各プレイリストから
ランダムに10曲選択
k曲推薦
推薦結果
正解データ
テストプレイリストで
使用した楽曲以外の楽曲
推薦結果の評価
プレイリスト群A
楽曲 楽曲の属性
推薦システム
16
実験設定
1. HIN-MRS*1
• コンテンツに基づく最先端のAPC手法
• 楽曲のみで構成されたネットワーク上で PPR を用いて楽曲を推薦
2. 協調フィルタリング
• 楽曲とプレイリストで構成される二部グラフ上でPPRを用いて楽曲を推薦
3. コンテンツベースの手法
• 入力のプレイリストに含まれる楽曲と共有する属性の数が多い楽曲を推薦
*1: Wang, R et al., Heterogeneous Information Network-Based Music Recommendation System in
Mobile Networks, Computer Communications, Vol. 150, pp. 429–437 (2020). 17
使用する評価指標 : 平均適合率, NDCG
• 平均適合率:APCの推薦結果が正解データと何曲合致しているかを測定
• NDCG:推薦順位がどれだけ適切であるかを測定
比較手法,評価指標
提案手法は三部グラフによって楽曲の属性とプレイリストの類似性を
効果的に利用できている
kを変化させた場合の平均適合率 kを変化させた場合のNDCG
18
推薦結果の曲数を変化させた場合の推薦品質の比較
提案手法は十分な曲数を持つ場合により効果的
入力のプレイリストの曲数を変化させた場合の平均適合率・NDCG
⼿法 5曲 10曲 15曲 20曲
提案⼿法 0.192 0.246 0.260 0.258
HIN-MRS 0.196 0.231 0.238 0.243
協調フィルタリング 0.152 0.166 0.166 0.164
コンテンツベース 0.099 0.122 0.129 0.136
⼿法 5曲 10曲 15曲 20曲
提案⼿法 0.600 0.661 0.667 0.674
HIN-MRS 0.616 0.648 0.648 0.656
協調フィルタリング 0.549 0.570 0.574 0.576
コンテンツベース 0.483 0.511 0.511 0.526
19
• 曲数が少ない場合はコールドスタートが発生してしまう→今後の課題
入力のプレイリストの曲数を変化させた場合の推薦品質の比較
改良前では推薦結果上位にマイナーな曲が集中するが,効果的な
重みづけによってこれを回避
改良前後の平均適合率の比較 改良前後のNDCGの比較
20
PPRの改良前後での推薦品質の比較
まとめ
• 本研究は楽曲配信サービスにおけるプレイリストの自動継続機能のための効
果的な楽曲推薦アルゴリズムを提案した
• 提案手法は楽曲,プレイリスト,楽曲の属性から三部グラフを構築し,推薦品質
を向上させるために不可欠な属性やプレイリストを強調した
• 実際のプレイリストを使用した実験では,提案手法が最先端の手法を含む全て
の比較手法を上回ることを実証した
今後の課題
• コールドスタートの改善
• プレイリストの名前やユーザの基本情報を利用した推薦
21
まとめと今後の課題

More Related Content

PDF
プロパティグラフに対するDISTINCT句を含む問合せ処理の高速化_IPSJ2024.pdf
PDF
グラフデータベースにおけるWorst-case optimal joinの最適化_DEIM2024.pdf
PDF
ASONAM2023_presection_slide_track-recommendation.pdf
PDF
2024 Trend Updates: What Really Works In SEO & Content Marketing
PDF
Storytelling For The Web: Integrate Storytelling in your Design Process
PDF
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
PDF
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
PDF
2024 State of Marketing Report – by Hubspot
プロパティグラフに対するDISTINCT句を含む問合せ処理の高速化_IPSJ2024.pdf
グラフデータベースにおけるWorst-case optimal joinの最適化_DEIM2024.pdf
ASONAM2023_presection_slide_track-recommendation.pdf
2024 Trend Updates: What Really Works In SEO & Content Marketing
Storytelling For The Web: Integrate Storytelling in your Design Process
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
2024 State of Marketing Report – by Hubspot
Ad

WebDBF2023_楽曲推薦アルゴリズム.pdf