专访腾讯广告算法赛冠军:如果能重来,我会选做菜

《赛圈江湖英雄录》是图灵联邦推出的人物专访系列,我们将目光聚焦于数据竞赛圈中的活跃ID、顶级大佬和开源达人,邀请他们为大家分享自己的成长经验、参赛技巧以及心路历程等等。

本期我们的采访嘉宾是 @鱼遇雨欲语与余

关键词:活跃冠军、开源达人。

(鱼佬本鱼)

本期嘉宾鱼遇雨欲语与余,赛圈人称“鱼佬“,本名王贺,是武汉大学计算机技术硕士,目前在京东工作,任职算法工程师。

他从2018年初开始参加数据竞赛,大大小小的比赛共计三十场左右,已获得三冠五亚一季的成绩,参赛经历丰富且战果惊人。

1、 您的ID很有趣,能给我们解释一下这个昵称的由来吗?

这个名字的的特点是不好读,每次答辩的时候,但凡主持人念这个名字都会显得很绕口,然后引来阵阵笑声。

我觉得除了绕口外,关键是容易让人记住,有趣,没有其它背后意思或者故事(别脑补)。

2、 很多人认识您应该是通过腾讯广告算法大赛,19年您更是获得了冠军,能简单给我们回顾一下当时的参赛动机、夺冠历程吗?

确实,在腾讯赛的时候,从初赛到复赛都在做分享,简简单单的一个比赛,我就写了八篇分享文章,其中包括两次知乎live,正因为这些分享,才让大家开始认识我。

在2018腾讯赛的时候,我最终获得了第十一名的成就,很遗憾当时没有进入决赛。也正是在那个时候让我产生了想要进入决赛的想法,所以2019我就又参赛了。

整个比赛历时三个月,也是从比赛初期参与进来的,每天都会看排行榜的变化情况,不断的挖掘新的特征,尝试不同的建模思路。尤其在最后阶段,不知道排行榜变化的情况下,想尽各种办法提升分数,从特征工程、模型选择、规则策略以及模型融合上都进行了很多的尝试。

3、您日常做哪方面的工作比较多?

竞赛方面主要是数据挖掘类比较多些,具体到广告点击率预告、推荐算法相关的赛题。在工作中更多是与业务打交道,用模型来解决业务上出现的难题。

4、您现在参赛多吗,主要集中在哪个方向?

工作之后参加的比赛就少了很多,主要还是在数据挖掘这方面的比赛,同时会更加关注推荐与广告相关的比赛,未来有计划从事这方面的工作。

5、如何平衡参赛和工作的关系?

工作之后这个问题经常被问到,我认为只有投入更多的精力才能平衡参赛与工作的关系。如今已经不能像读书那会儿,每天投入大量的时间在比赛上面。工作后,我个人基本上都是在下班后做比赛,不过慢慢的除了工作和竞赛外还有更多的事情进来,一般都是压缩竞赛时间,选择对自己有帮助的比赛,而不是浪费时间在无意义的比赛上面。

6、您觉得如果想拿比赛冠军最关键的是什么?需要哪些关键技能?

当然是实力,有了实力才会有拿比赛冠军的可能性;其次是运气,我见过很多大佬实力远高过我,可一直未能获得冠军,这可能就是运气差了点。

有一套好的pipeline能够帮助你快速得到top分数,然后能够理解数据背后的业务或故事,构建有效的特征,选择合适的模型。

7、如果让您用一句话总结赛圈文化,您最先想到的是什么呢?

应该是“自由、开源、共享”,这也是赛圈慢慢走向的方向。

8、您觉得参赛对找工作影响大吗?

虽然不能说对找工作有很大的影响,但也不可否认,参赛确实可以帮助找工作。

9、您未来一段时间是怎么规划的?还会继续打比赛吗,会有偏好的类型吗?

未来一段时间会是非常忙碌的,比赛已经是生活的一部分了,只不过投入的时间会比较少。当然会有偏好的类型,正如前面讲到的推荐和广告相关都将是我所关注的。

10、能给大家推荐几本最近在看的书吗?

工作之后就很少看书了,给大家推荐本刘鹏老师的书《计算广告》,这也是目前市面上计算广告领域最系统的书籍。

11、您在圈内的偶像是谁?为什么?

应该就是杰少了,总能找出比赛的tricks,在竞赛中也帮助我很多,亦师亦友的关系。

在某池全球城市计算挑战赛中,杰少一次提交直接top,有幸那次成为队友,这也让我见识的杰少对于竞赛知识的深度和广度。

12、您怎么评价自己?

热爱分享和开源,在比赛中喜欢与大家一起交流思路,分享我的观点和baseline。

沉迷竞赛,已经成为生活的一部分。

13、最近圈内很多人唱衰CV岗供过于求,也有很多人说AI的冬天要来了,很多研究成果的红利基本已经用完了,对此您怎么看?

对于圈内很多人唱衰CV岗供过于求,我所了解到很多公司依旧求贤若渴,需求岗位也多,只是很难找到合适地人才。现实中应该是合适的候选人完全是供不应求的状态。

14、如果人工智能迎来下一个寒冬,你认为会是卡在什么问题上?

应该是AI技术的落地以及商业变现能力,深度学习性能确实好,引入大量资本进入这个领域,但经过了多年的产业化后,AI的落地以及商业变现能力低于甚至远低于资本预期。

15、如果重新选择大学专业,你会选择什么?

其实我还是蛮想选择烹饪相关专业的,像比赛获得成绩一样,创造美食也很令我有很大的成就感,我经常会享受做饭的感觉。

16、马上要春招了,给学弟学妹们有什么意见建议?

规划是非常重要的,确定好自己的方向,如nlp或cv,就对其理论和做过的相关项目进行整理。

我个人在实验室是没有机器学习或深度学习相关项目的,所以将比赛作为自己的项目,对做过的比赛进行梳理,比如自己尝试的方面、相关领域进展、前排大佬的方案等,做到捻熟于心。方向的选择依据自己的兴趣,或者实验室的方向来选择。

17、了解领域最新进展,您都有哪些途径?

一般会有一些网站会整理相关领域的最新进展,这里给大家安利一个网站 Papers With Code ,是由 Reddit 用户 rstoj 开发,旨在提供免费、开源的机器学习论文资源、代码和评估排行榜。目前该网站已经完成了代码与论文的自动化链接,正在研究自动提取论文中的评估数据。该网站将 ArXiv 上的最新机器学习论文与 GitHub 上的代码(TensorFlow/PyTorch/MXNet 等)对应起来。用户可以按标题关键词查询,或者按流行程度、GitHub 收藏数排列「热门研究」

18、能不能给我们分享一波祖传tricks?

祖传tricks是不存在的,不过,我一般会尝试寻找tricks,主要分为数据和模型两个方向。

数据可以围绕着自身分布(在train和test差异性)、特点和业务考虑,模型围绕模型选择、建模思路和模型融合等方面考虑。还有就是验证线上线下的一致性,特征的重要性分布和相关性等。

最后给大家推荐个有关竞赛tricks的文章《阿水总结的数据竞赛Tricks》https://zhuanlan.zhihu.com/p/82456047

另外这个公众号,大家也可以关注下,有很多竞赛信息和干货分享。

(Coggle数据科学)

欢迎推荐您身边的赛圈大佬给图灵君(微信ID:happy_liujing),推荐格式:大佬姓名或者赛圈ID+微信名片+推荐理由。

一旦推荐成功,我们将为您送上惊喜礼包!

视频点击预测大赛火热进行中

3万元奖金、证书、实习、就业机会已准备就位,快叫上小伙伴一起来组队参赛吧。

赛题:希望参赛者通过已有的用户信息、视频信息以及他们是否观看过某些视频,来预测我们推荐给这些用户的视频对方是否会观看。

个人、高等院校、科研单位、互联网企业、创业团队、学生社团等人员均可报名。

报名及组队时间:即日起至2020年2月1日

报名入口:

https://www.turingtopia.com/competitionnew/detail/e4880352b6ef4f9f8f28e8f98498dbc4/sketch

85%的人还喜欢以下相关话题

相关文章 (标签)

相关文章(同类)

最新文章