種子教師研究計畫成果分享:11月22日資管系盧信銘教授分享:「Predicting Winning Price in Real-Time Bidding via Shaded Forest」
發佈日期:2018-12-17 
瀏覽數:2005
 2018-12-17 更新


  近年來有愈來愈多的企業把錢投在網路廣告上,希望藉由網路廣告曝光的機會來吸引潛在顧客,而其中網路廣告投放的方式也從早期「買斷」的模式轉成實時競價 (Real-Time Bidding, RTB),因為以往廣告主若想在網站刊登廣告,需要給付該網站預設的金額,藉此獲得某段時間的廣告展示機會,但這樣的運作模式對廣告主而言存在某些缺點,像是無法即時決定自己的廣告該被哪些使用者瀏覽,因此較無法控制投放廣告的效益。而實時競價廣告則可以改善這些問題。

  所謂的實時競價廣告是指採用即時競價的機制購買展示廣告,舉例來說,當使用者打開某個有廣告版位的APP,此廣告版位訊息和用戶資訊會傳給廣告交易平台 (Ad Exchange),Ad Exchange再把相關訊息傳給廣告主,讓其決定是否要出價競標,最後得標者的廣告內容會顯示在使用者眼前,不過注意在這過程裡,廣告主並非直接與廣告平台聯絡,而是和需求方平台 (Demand-Side Platform, DSP) 簽訂合約,廣告主付出一定的費用,DSP則承諾達到一定的績效(例如:多少轉換率),而這也帶出某個議題:DSP如何在較低的成本下達到承諾的績效呢?此議題與兩個面向有關,一是怎麼增加用戶轉換率,因為高轉換率意味著能用較少的競標次數完成目標;二是怎麼更精準地預測得標價,因為出價時若能很接近最後的得標價,可以減少每次得標的成本,所以綜合來看,DSP可從這兩面向著手來提高自己的獲利。 

  盧教授的研究主要著重在RTB的得標價預測,它的其中一項困難點為競標價格的分布無法完全得知,因為如果某次投標未得標,則只知道有人出價更高,但不知最終得標價,所以它是一個被截斷、部分無法觀測的資料,亦即RTB具有「truncation」特性,因此假設原始的競標價來自於常態分佈,並預設我們知道它在哪個點被截斷與截斷的比例,有了這些資訊後,因為截斷之前與之後的分布間有某種函數關係,故能計算出原本的常態分佈。

  以上就是研究的基本構想,而根據此概念設計出的模型相似於隨機森林(Random Forest),但每棵樹的葉節點都用前面提到的推導方法來做修正,所以此模型命名為遮蔽森林 (Shaded Forest)。至於遮蔽森林的實際運作想法如下:首先針對一棵樹來看,我們將訓練集中有得標的資料建成一棵樹,接著把所有訓練資料放到樹中做預測,因此每個葉節點會有不同的競標資料,而且因假設它的葉節點是一個log-normal distribution,故透過使用相關推導公式,可得到葉節點原始的常態分佈;在知道一棵樹怎麼產生後,可以利用隨機森林演算法建出整座森林,並需要比照遮蔽樹方法,來對每棵樹的葉節點做適當調整,最終預測得標值時,是對所有遮蔽樹的預測值取平均。另外本研究使用iPinYou公司提供的資料集做模型的訓練與測試,其中為了更符合真實RTB狀況,特別採用Training-Testing sliding window──用24小時的資料做訓練,相連的後兩小時做測試,之後把window向後移動兩小時,進行下一次訓練和測試──,結果發現相較其他方法,遮蔽森林的預測能力佳。

  最後在盧教授與其他教授互動的過程中,也有教授提出一些有趣的想法,例如從賽局的角度研究,去推估別人會怎麼做(如:其程式邏輯、用什麼學習演算法等等),也就是策略性的預測別人如何寫程式算出投標價格,猜出對方可能的競標價後,即可使用稍高一點的價格來得標。雖然這些想法還未得到證實也不確定可行性,但這正是本活動辦理的目的──藉由不同領域的教師互相交流,讓彼此有機會傾聽他人的看法,進而激盪出新觀點與新思維,未來或許便能創造出更多新穎特別的研究。



撰文者/資訊管理學系暨研究所碩士 凃育婷