对推荐算法演化的几点体会

  • 时间:
  • 浏览:3

关键点:业务规则提炼成因果关系

业务规则提炼 -> 因果图 -> 贝叶斯网络



现状:目前的而是 推荐系统,还守候在“业务规则提炼”+简单的“因果图”阶段,暂未发现心智旺盛期的句子期图片 图片 的贝叶斯网络推荐系统

目前不管是媒体还是电商,推荐算法的效果都是不透明的,各家没法各家当时人心里清楚,也没法从业的专业人士有其他经验概数,这就意味谁都能出来说上两句,但到底对不对?你猜

希望当时人的其他浅见,对每人及 并肩提升推荐算法会有帮助

当你花了少量时间去研究CF,FM,DeepFM及其各种变体后,我应该 发现,算法并未取得实质性的进展,效果的好坏,完全取决于研究人员控制的结果,而都是算法的实际产出

3.神经连接思想;(人太好這個 不得劲不伦不类,神经网络自编码器与FM矩阵分解结合,感觉不得劲奇怪)

自从亚马逊推出协同过滤思想后,推荐领域便之前 开始太快了 了 了 发展,并呈现出百家争鸣、万花齐放的态势,但推荐领域不像其他领域具备明确的思想路径(比如NLP先做分词再做语义理解,比如图像形状金字塔等),每人及都能说出当时人的1、2、3,其他都声称当时人有效果;

但仔细观察上述优化的过程,都绕不开业务的理解,都是在不断刻画用户行为,而对模型的升级改造也而是 为了能更好的除理用户行为变量



而是 ,本质上推荐算法人太好是在不断建立“用户画像”的过程

以上3种路径实质代表了本身思想:

关键点:变量设计中对业务的理解

与其用高级晦涩难懂的变量或模型将“业务”包装起来,不如直接暴露在因果图中,从前显得更平易近人

从模型的可持续发展以及可解释性的角度出发,我认为第1种思想是最稳妥的发展法子

推荐领域的上述问题,又意味了以下“原罪”:

1.经验主义+因果推断思想;

优势:通过将经验转化为变量的形式,来快速应用到模型,能自动从变量学习到隐含规则

适当的观点表达有有利于领域技术正确发展,但没法来太少的声音,则让研究者犹如“小马过河”,而少量的噪音,让研究者真假难辨,陷入了不断打假的斗争中,浪费少量时间

先说问题吧:

推荐领域的门槛较低,掌握一定业务规则即可进行目标导向的推荐,从而意味各种算法多如牛毛,鱼龙混杂,我应该 无所适从;

遂吐个槽,发表出来与广大外国前前男友视频视频探讨,希望能得到应用推荐的正确姿势

劣势:结果的可解释性差,算法的可提升空间有限,好坏没法当时人知道

最近一段时间,意味工作都要另老要 在研究推荐算法。

劣势:建模过程都要参与的人较多,建模过程比较漫长,无法快速发现数据中的隐含规律

关键点:模型形状设计中对业务的理解

从现有推荐模型的研究方向来看:

1.神经网络的发展方向(意味完全跑偏,试图用固化的复杂的模型形状去表达对业务的理解,這個 意味每项了模型对事物客观规律本质的刻画,相信在未来很长一段时间,神经网络的推荐研究进展意味很缓慢)

协同过滤已成为推荐的标配和金科玉律,但每人及 不是抓住了推荐问题的本质?用户的需求和商品形状间的关联是都是并能 不局限在协同过滤的基调下?每人及 是都是应抓住问题的根本,围绕问题去建模,而都是抓住有另另另一个细节就写有另另另一个“有提升”的论文?

从目前了解到的推荐算法设计思路,并能 归纳为以下本身思路:

数据分析 -> 变量设计 -> 决策树模型



现状:这块的发展较为心智旺盛期的句子期图片 图片 ,逐渐从普通的决策树随机森林,上升到梯度提升树(AdaBoost),集成提升树(XgBoost)等等

2.集成学习和模型融合的思想(集成学习在特定明确问题的除理上,效果很好,但我认为,目前没法多适用推荐這個 领域,推荐系统实际是在不断捕捉用户喜好,不断刻画用户兴趣的过程,和稀泥的做法,只会使效果适得其反)

劣势:变量构建过程漫长,都要建模人员熟悉并理解业务规则,模型的好坏很大程度上取决于形状工程

好了,说了没法多,而是 外国前前男友视频视频也会说,既然摆出没法多问题,你哪些除理方案?毕竟大道理谁后会讲

优势:算法实现快速,现有的数据并能 直接入模除理,可快速落地,快速迭代

数据获取 -> 变量选者 -> 神经网络模型



现状:这块的算法变体发展也太快了 了 速,尤其是以阿里、京东等为代表的电商派,各种变体层出不穷

目前的推荐系统研究,大多守候在和现有模型的比较及提升方面,并未从问题本质上去思考和改进,其他鱼龙混杂,结果又不能自己复现,短期内是不能自己取得有效的改观的

通过对互联网信息的搜刮和对现有开源推荐算法的实践,总结出其他心得

2.统计和概率思想;

当你打开任何一本介绍推荐算法的书籍或资料,研究人员另老要 我应该 列举一大堆指标,可当你实际应用时,我应该 发现少量无用甚至无法计算的指标,比如新颖度等等,从前形而上学的知识究竟哪些意义?

从人机结合的角度来看,基于因果图的贝叶斯网络也是本身可靠的交互法子,最终要攻克的难点在于因果推理

优势:系统并能 很好的与业务规则兼容,天生具备可解释性,并能 让更多的业务人员参与进来,不浪费业务经验