“The Limits of Popularity-Based Recommendations, and the Role of Social Ties.”[1] について. mathjaxで書くと時間かかるので数式は論文を要参照.
冷静に考えると最近アニメや漫画にかけている時間が少なすぎる気がしてきました.
まとめると
- SNSのつながりを利用した推薦システムの数理モデルを作って解析したい
- 既存研究では「影響力の高いユーザー(有名人など)」の推薦や友人の影響でユーザーの購入が変化することが指摘されていた
- 推薦システムによってユーザーにコンテンツを推薦して購入する商品を変化させたいが
- SNSのようなつながりはこの購入する商品の変化を妨げることが数理モデルで示唆された
モデル
推薦システムが利用されている市場と利用されていない市場のモデルを作る
推薦システムが利用されていない市場のモデル
- f: コンテンツを購入する確率(市場の中で時刻tに商品を購入することを決定するパラメータ)をユーザーごとに持つ
- b: ユーザー個人の嗜好で, 時刻tでコンテンツを購入すると決まった時に購入する商品の分布に影響を与えるパラメータ
推薦システムが利用されている市場のモデル
上記に加えて
- 時刻t以前に購入した商品の履歴
- α: ユーザーが推薦にしたがって商品を購入するかを決定するパラメータ
- w(v, u): ユーザーv, u の間の信頼関係であり, 友人の購入に影響されてコンテンツを購入する状態をモデル化するために必要
突然「時刻t以前」と書きましたが, t=1より前の購入履歴はあらかじめ与えられている. 初期のユーザーの嗜好bの分布は幾つかの分布で実験を行う.
Market distortion
推薦システムが存在しない場合, ユーザーは何らかの事前分布に基づいて適当にコンテンツを購入する. 推薦システムによってこの事前分布がどれくらい変化して購入するコンテンツが変化するかの指標がMarket distortion. [1]中の(5)に定義.
実験
利用データ
Amazon, Yelp, TripAdvisor, SoundCloud, Last.fmの友人のつながりのグラフデータを使う. そこに上でモデル化した商品購入・レコメンデーションのモデルを適用する. そのため, データそのものには商品購入のデータは含まれていないことに注意. 以下のStanford Large Network Dataset Collectionなどからこのようなグラフ構造のデータを入手できる. Yelpは別ページにて.
super-node
全てのユーザーに常に同一の商品を推薦する. テレビコマーシャルなどをモデル化するためのもの.
結果
有名人などの影響力のあるユーザーが存在しても, t→無限大とすればMarket distortionは収束してしまう. つまり推薦システムを利用しても市場の変化はほとんどない状態で, SNSによるつながりが推薦システムによる市場の変化を妨害していることが示唆される.
一方でsuper-nodeがある場合はデータによってMarket distortionが異なる. これはテレビコマーシャルなど大量のユーザーへのコンテンツの訴求が市場に影響を与えることを示唆している.
感想など
論文ではsuper-nodeは全員に推薦をしていたが, 実際にはテレビコマーシャルなどは全員が見るわけではない. 全体の数割にのみ影響を与えて, その友人にはさらに半分の影響を与えて…といったように拡散カーネルで伝搬していく感じなのだろうか(適当).
行動の変化/分析対象 | ユーザーの行動によって 周辺の環境が変化しない | ユーザーの行動によって 周辺の環境が変化する |
---|---|---|
モデルの出力の確率分布がわからない | 多腕バンディット | 強化学習 |
モデルの出力の確率分布が決まっている | 決定理論 | マルコフ決定過程 |
の分類で理解をしているけれど, 今回のモデルは右下に該当するものだと思う. 推薦システムの文脈では多腕バンディットもよく出てくる. 下にメモがあったような.
コード
論文著者のコードは以下.
https://github.com/Steven–/recommender
参考文献など
[1] Bres Marco, et al. “The Limits of Popularity-Based Recommendations, and the Role of Social Ties.” arXiv preprint arXiv:1607.04263 (2016)