National Taiwan University College of Management 種子教師研究計畫成果分享：11月22日資管系盧信銘教授分享：「Predicting Winning Price in Real-Time Bidding via Shaded Forest」

Activities and Announcements

Announcements
Newsletters

種子教師研究計畫成果分享：11月22日資管系盧信銘教授分享：「Predicting Winning Price in Real-Time Bidding via Shaded Forest」

Published At：2018-12-17

2018-12-17 updated

　　近年來有愈來愈多的企業把錢投在網路廣告上，希望藉由網路廣告曝光的機會來吸引潛在顧客，而其中網路廣告投放的方式也從早期「買斷」的模式轉成實時競價 (Real-Time Bidding, RTB)，因為以往廣告主若想在網站刊登廣告，需要給付該網站預設的金額，藉此獲得某段時間的廣告展示機會，但這樣的運作模式對廣告主而言存在某些缺點，像是無法即時決定自己的廣告該被哪些使用者瀏覽，因此較無法控制投放廣告的效益。而實時競價廣告則可以改善這些問題。

　　所謂的實時競價廣告是指採用即時競價的機制購買展示廣告，舉例來說，當使用者打開某個有廣告版位的APP，此廣告版位訊息和用戶資訊會傳給廣告交易平台 (Ad Exchange)，Ad Exchange再把相關訊息傳給廣告主，讓其決定是否要出價競標，最後得標者的廣告內容會顯示在使用者眼前，不過注意在這過程裡，廣告主並非直接與廣告平台聯絡，而是和需求方平台 (Demand-Side Platform, DSP) 簽訂合約，廣告主付出一定的費用，DSP則承諾達到一定的績效(例如：多少轉換率)，而這也帶出某個議題：DSP如何在較低的成本下達到承諾的績效呢？此議題與兩個面向有關，一是怎麼增加用戶轉換率，因為高轉換率意味著能用較少的競標次數完成目標；二是怎麼更精準地預測得標價，因為出價時若能很接近最後的得標價，可以減少每次得標的成本，所以綜合來看，DSP可從這兩面向著手來提高自己的獲利。

　　盧教授的研究主要著重在RTB的得標價預測，它的其中一項困難點為競標價格的分布無法完全得知，因為如果某次投標未得標，則只知道有人出價更高，但不知最終得標價，所以它是一個被截斷、部分無法觀測的資料，亦即RTB具有「truncation」特性，因此假設原始的競標價來自於常態分佈，並預設我們知道它在哪個點被截斷與截斷的比例，有了這些資訊後，因為截斷之前與之後的分布間有某種函數關係，故能計算出原本的常態分佈。

　　以上就是研究的基本構想，而根據此概念設計出的模型相似於隨機森林(Random Forest)，但每棵樹的葉節點都用前面提到的推導方法來做修正，所以此模型命名為遮蔽森林 (Shaded Forest)。至於遮蔽森林的實際運作想法如下：首先針對一棵樹來看，我們將訓練集中有得標的資料建成一棵樹，接著把所有訓練資料放到樹中做預測，因此每個葉節點會有不同的競標資料，而且因假設它的葉節點是一個log-normal distribution，故透過使用相關推導公式，可得到葉節點原始的常態分佈；在知道一棵樹怎麼產生後，可以利用隨機森林演算法建出整座森林，並需要比照遮蔽樹方法，來對每棵樹的葉節點做適當調整，最終預測得標值時，是對所有遮蔽樹的預測值取平均。另外本研究使用iPinYou公司提供的資料集做模型的訓練與測試，其中為了更符合真實RTB狀況，特別採用Training-Testing sliding window──用24小時的資料做訓練，相連的後兩小時做測試，之後把window向後移動兩小時，進行下一次訓練和測試──，結果發現相較其他方法，遮蔽森林的預測能力佳。

　　最後在盧教授與其他教授互動的過程中，也有教授提出一些有趣的想法，例如從賽局的角度研究，去推估別人會怎麼做(如：其程式邏輯、用什麼學習演算法等等)，也就是策略性的預測別人如何寫程式算出投標價格，猜出對方可能的競標價後，即可使用稍高一點的價格來得標。雖然這些想法還未得到證實也不確定可行性，但這正是本活動辦理的目的──藉由不同領域的教師互相交流，讓彼此有機會傾聽他人的看法，進而激盪出新觀點與新思維，未來或許便能創造出更多新穎特別的研究。

撰文者／資訊管理學系暨研究所碩士凃育婷

	國立臺灣大學
	管理學院
	College of Management , National Taiwan University