18. ケーススタディ: SPLADEで上手くいったケース(1 /2) 18
Query bm25 splade
Too Much Iodine Can Be as Bad as Too Little 0.00 0.77
low-carb diets 0.09 0.55
What’s Driving America’s Obesity Problem? 0.08 0.50
crib death 0.00 0.47
Preventing Cataracts with Diet 0.00 0.44
Meat & Multiple Myeloma 0.00 0.41
Relieving Yourself of Excess Estrogen 0.00 0.39
Apthous Ulcer Mystery Solved 0.00 0.36
● BM25(Elasticsearchのmulti_matchクエリ)とSPLADEの結果を比較
○ どういうクエリでSPLADEが上手くいったかを調査
○ NFCorpusでのクエリごとnDCG@10を比較
nDCG@10
Iodine: ヨウ素
医療系のデータセット
19. ● BM25で1位だった文書
○ タイトル:Too much of too little : xylitol, an unusual trigger of a chronic metabolic hyperchloremic acidosis.
(適合度:0/2)
○ スコアの約60% が、タイトルの「too」
■ クエリに2つtooが含まれる
● SPLADEで1位だった文書
○ タイトル:Iodine -induced neonatal hypothyroidism secondary to maternal seaweed consumption: …
(適合度:2/2)
○ 疎ベクトルの重みをみると、iodineからのウェイトが集まっている
ケーススタディ: SPLADEで上手くいったケース(2 /2) 19
クエリ: Too Much Iodine Can Be as Bad as Too Little
io ##dine too
2.73 2.51 0.31
文書の疎ベクトルの重み(一部)
io ##dine too
2.61 1.79 1.57
クエリの疎ベクトルの重み(一部)
約8倍の差!
文書内の重要な単語に重みが集中することで検索できている
20. ケーススタディ: SPLADEで上手くいかなかったケース(1 /2) 20
Query bm25 splade
Harvard Physicians’ Study II 0.61 0.09
The Actual Benefit of Diet vs. Drugs 0.44 0.00
Diet and Cellulite 0.37 0.00
Fish Fog 0.29 0.00
medical ethics 0.22 0.09
The Saturated Fat Studies: Buttering Up the Public 0.19 0.00
mouth cancer 0.11 0.00
● SPLADEがBM25より上手くいかなかったクエリ
○ どういうクエリでSPLADEが上手くいかなかったか
○ NFCorpusでのクエリごとnDCG@10を比較
21. 固有名詞の検索はゼロショットで課題になりそう
● BM25で1位だった文書
○ タイトル:Multivitamins in the Prevention of Cancer in Men: The Physicians’ Health Study II Randomized …
(適合度:1/2)
○ “The Physicians’ Health Study II”というシリーズ名に正確にマッチしている
● SPLADEで1位だった文書
○ タイトル:A global survey of physicians' perceptions on cholesterol management: the From …
(適合度:0/2)
○ ”Physician”や “Study“ のような語はよく拡張されそう
○ 適合文書の方では、これらの語は重みが相対的に低くなっていることで順位が低くなっていそう
ケーススタディ: SPLADEで上手くいかなかったケース(2 /2) 21
クエリ: Harvard Physicians’ Study II
prostate cancer multi study physician
2.45 2.37 2.30 1.45 1.44
BM25で1位だった文書の疎ベクトルの重み(一部)
harvard physician study ii
2.59 1.30 2.00 2.56
クエリの疎ベクトルの重み(一部)