计算机与现代化

• 算法设计与分析 • 上一篇    下一篇

基于随机森林与LambdaMART的搜索排序模型

  

  1. 1.武汉邮电科学研究院,湖北武汉430074; 2.烽火通信科技股份有限公司南京研发部,江苏南京210019
  • 收稿日期:2016-08-03 出版日期:2017-03-29 发布日期:2017-03-30
  • 作者简介:雷武(1992-),男,湖北武汉人,武汉邮电科学研究院、烽火通信科技股份有限公司南京研发部硕士研究生,研究方向:海量数据挖掘,信息检索; 廖闻剑(1970-),男,教授级高级工程 师,博士,研究方向:信息安全,海量数据挖掘,网络行为分析; 彭艳兵(1974-),男,高级工程师,博士,研究方向:网络行为分析,海量数据挖掘。

Search Rank Model Based on Random Forests and LambdaMART

  1. 1. Wuhan Research Institute of Posts and Telecommunications, Wuhan 430074, China;
    2. Nanjing R & D, FiberHome Telecommunication Technologies Co., Ltd., Nanjing 210019, China
  • Received:2016-08-03 Online:2017-03-29 Published:2017-03-30

摘要:

目前的研究表明,Boosting算法在各种任务中都能提供良好的预测性能。而在学习排序中,基于Boosting的模型,例如Rankboost和LambdaMART,在对公共数据集的评估中表现优秀。本文通过研究
随机森林算法和LambdaMART,将随机森林算法作为基础模型,学习一个排序函数,将函数的输出作为LambdaMART的初始函数,最终生成排序模型。在公共数据集上基于评价指标ERR和NDCG对排序模型进行
验证,结果表明本排序模型均要优于原始算法。

关键词: 排序学习, 随机森林算法, LambdaMART算法, 集成学习, 排序模型

Abstract:

Recent studies have shown that Boosting provides excellent predictive performance across a wide variety of tasks. In learningtorank, boosted models such as
RankBoost and LambdaMART have been shown to be among the best performing learning methods based on evaluations on public data sets. In this paper, we investigate Random Forests
(RF) and LambdaMART. Then we combine the two algorithms by first learning a ranking function with RF and using it as initialization for LambdaMART to create a new rank model.
We report our results on the public learningtorank data sets using two metrics ERR and NDCG. The new rank model performs better than two original algorithms models.

Key words:  , learning to rank; Random Forests; LambdaMART; ensemble learning; ranking model

中图分类号: