SlideShare a Scribd company logo
Live-Streaming Fraud Detection: A Heterogeneous Graph
Neural Network Approach (KDD, 2021)
1
Kazuki Fujikawa
サマリ
• 書誌情報
– Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach
(KDD, 2021)
• 著者
– Zhao Li, Haishuai Wang, Peng Zhang, Pengrui Hui, Jiaming Huang, Jian Liao,
Ji Zhang, Jiajun Bu
• 概要
– ライブ配信プラットフォームに対する不正検知を行うGNNアプローチを紹介
• ユーザ・配信者・商品の関係性をグラフ化し、モデリング
– 不正検知の実験において、本手法の有効性を確認
• ユーザ→配信者のLike数などの結合特徴量が精度改善に貢献していることを確認
• ケーススタディにおいて、不正ユーザから不正コミュニティを探す分析を実施
2
アウトライン
• 背景
• 関連研究
• 提案手法
• 実験・結果
3
アウトライン
• 背景
• 関連研究
• 提案手法
• 実験・結果
4
• ライブ配信で商品販売するプラットフォーム(e.g. Taobao)が流行
– トラフィックやLikeを機械的に増やすことで、不正な
ランキング操作などが行われている
• 従来のグラフ異常検知モデルはユーザ・商品の
二者を扱うアプローチが多い
– ライブ配信商品販売には、ユーザ・商品に加えて
配信者という役割が存在
背景
5
ユーザ・商品・配信者の3者を扱うグラフ異常検知モデルを開発したい
アウトライン
• 背景
• 関連研究
• 提案手法
• 実験・結果
6
関連研究
• Graph Attention Networks(GAT)[Velickovic+, ICLR2018]
– 周囲のノードと対象ノードとの関連性で重みづけてMessage Passing
•
– Attentionの計算はノード・結合の種類に寄らず、一様に計算する
7
関連研究
• Heterogeneous Graph Transformer(HGT)[Hu+, WWW2020]
– ノード埋め込みベクトルの写像関数をノード種毎に変更(K-Linear, Q-Linear, A-
Linear)
– Attention計算を結合種毎に変更( )
– Transformerと同様、Key, Value, Queryに分割、MultiHeadでAttention計算
8
アウトライン
• 背景
• 関連研究
• 提案手法
• 実験・結果
9
提案手法
• ユーザ・配信者・商品の情報をグラフ化
– ユーザ⇔配信者
• 配信者に対するアクションの有無で結合を決定(e.g. like, buy)
• like数・buy数を結合特徴量として利用
– 配信者⇔商品
• 配信者が紹介した商品に対して結合を生成
• 紹介数を結合特徴量として利用
– ユーザ⇔ユーザ
• 同一の配信者から購入している場合、隣接ノードとして考える
– 商品⇔商品
• 同一の配信者が紹介している商品を隣接ノードとして考える
– 配信者⇔配信者
• 同一のユーザ・商品と結合関係にある配信者を隣接ノード
として考える
10
提案手法
• ユーザノード埋め込み
– 隣接ユーザの埋め込みベクトルを取得
• 結合埋め込み(like数・buy数等)をConcat
– HGTと同様、Multi-head Attentionで埋め込みを取得
s
u
u2
u1
11
‘
‘
提案手法
• 配信者ノード埋め込み
– 隣接配信者の埋め込みベクトルを取得
• 結合埋め込み(ユーザ: like数・buy数、商品: 紹介数等)をConcat
– HGTと同様、Multi-head Attentionで埋め込みを取得
s
u
12
s
s
i
提案手法
• 商品ノード埋め込み
– 隣接商品の埋め込みベクトルを取得
• 結合埋め込み(紹介数等)をConcat
– HGTと同様、Multi-head Attentionで埋め込みを取得
s
i
13
i
i
提案手法
• 以下を入力にWide-and-Deep構造の二値分類モデルで不正を検出する
– 各トランザクションに関連するノード・結合のembedding
– トランザクションに直接関連する特徴量
14
アウトライン
• 背景
• 関連研究
• 提案手法
• 実験・結果
15
実験
16
• データセット: Taobao Live
– ユーザ・配信者・商品の3種で構成されたグラフデータ
• 各ノードには属性が存在
– ユーザ(登録情報)、配信者(配信時間帯)、商品(価格・過去の販売数)等
• 各結合は以下で定義し、回数などの属性を持つ
– ユーザ⇔配信者(Like・フォロー・購入)、ユーザ⇔商品(購入)、配信者⇔商品(宣伝)等
• 購入トランザクション
– 注文時間・IP・価格・支払い方法
• データ分割
– 以下の要領で、不正検知対象のトランザクション発生前の時点でグラフを固定
• Train: 1週間のユーザ行動(472万ユーザ・12万配信者・117万商品)
• Test: 1週間のユーザ行動(486万ユーザ・12万配信者・126万商品)
実験
17
• 実験結果
– 提案法: LIFEがAUC, F1, Precision, R90Pでベースラインを上回る結果を確認
• vs HGT: 性能向上は結合特徴の導入有無の影響
• vs GCN, GAT: 均質なグラフを想定した手法であり、異種グラフへの拡張が困難
• vs HAN, HetGNN: GNNの重み行列がノード種・結合種で区別していない点の影響が大きい
– 今回のタスクではノード種・結合種で次数などの特性が大きく異なるため、その影響の可能性
実験
18
• ケーススタディ
– 検出された不正ユーザを基に、不正コミュニティを探索を実施
• 不正ユーザの地理的な分布を分析した所、一部の地域にクラスターを作っていることを確認
(下図左右)
– 実際に検出された不正コミュニティが下図右
• 17人のユーザ、56人の配信者に対し、828本のエッジが貼られている
• 13人のユーザが同じIPアドレスを共有
• 多数のデバイスで偽のトラフィックを発生させ、ランキング操作されている
まとめ
• ライブ配信プラットフォームに対する不正検知を行うGNNアプローチを紹介
– ユーザ・配信者・商品の関係性をグラフ化し、モデリング
• 不正検知の実験において、本手法の有効性を確認
– ユーザ→配信者のLike数などの結合特徴量が精度改善に貢献していることを確認
– ケーススタディにおいて、不正ユーザから不正コミュニティを探す分析を実施
19
References
• Li, Zhao, et al. "Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach." In
KDD 2021.
• Velickovic, Petar, et al. "Graph attention networks." In ICLR 2018.
• Hu, Ziniu, et al. "Heterogeneous graph transformer." In WWW 2020.
20

More Related Content

PDF
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
PDF
Transformerを多層にする際の勾配消失問題と解決法について
PDF
最適輸送の計算アルゴリズムの研究動向
PDF
Neural networks for Graph Data NeurIPS2018読み会@PFN
PDF
方策勾配型強化学習の基礎と応用
PDF
【メタサーベイ】基盤モデル / Foundation Models
PDF
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
PPTX
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Transformerを多層にする際の勾配消失問題と解決法について
最適輸送の計算アルゴリズムの研究動向
Neural networks for Graph Data NeurIPS2018読み会@PFN
方策勾配型強化学習の基礎と応用
【メタサーベイ】基盤モデル / Foundation Models
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)

What's hot (20)

PPTX
[DL輪読会]Focal Loss for Dense Object Detection
PPTX
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
PPTX
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
PDF
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
PPTX
近年のHierarchical Vision Transformer
PPTX
[DL輪読会]World Models
PPTX
backbone としての timm 入門
PDF
[DL輪読会]Relational inductive biases, deep learning, and graph networks
PDF
[DL輪読会]Hindsight Experience Replay
PPTX
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
PDF
【メタサーベイ】数式ドリブン教師あり学習
PDF
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
PDF
[DL輪読会]SlowFast Networks for Video Recognition
PDF
深層生成モデルを用いたマルチモーダル学習
PPTX
[DL輪読会]GQNと関連研究,世界モデルとの関係について
PDF
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
PPTX
[DL輪読会]Meta Reinforcement Learning
PDF
多様な強化学習の概念と課題認識
PPTX
【論文紹介】How Powerful are Graph Neural Networks?
PPTX
【DL輪読会】Scaling Laws for Neural Language Models
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
近年のHierarchical Vision Transformer
[DL輪読会]World Models
backbone としての timm 入門
[DL輪読会]Relational inductive biases, deep learning, and graph networks
[DL輪読会]Hindsight Experience Replay
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
【メタサーベイ】数式ドリブン教師あり学習
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
[DL輪読会]SlowFast Networks for Video Recognition
深層生成モデルを用いたマルチモーダル学習
[DL輪読会]GQNと関連研究,世界モデルとの関係について
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
[DL輪読会]Meta Reinforcement Learning
多様な強化学習の概念と課題認識
【論文紹介】How Powerful are Graph Neural Networks?
【DL輪読会】Scaling Laws for Neural Language Models
Ad

More from Deep Learning JP (20)

PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
PPTX
【DL輪読会】事前学習用データセットについて
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
PPTX
【DL輪読会】マルチモーダル LLM
PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
PPTX
【DL輪読会】Hopfield network 関連研究について
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】事前学習用データセットについて
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】マルチモーダル LLM
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Ad

[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach(KDD 2021)