欢迎您!
主页 > 83156现场开奖 > 正文
683156【数据挖掘面经】腾讯+百度+华为(均拿到sp offer)
日期:2019-10-19 来源:本站原创 浏览次数:

  月份又先后去百度,腾讯实习,到现在秋招快结束,也将近一年的时间,最终拿到手的比较有分量的,下面就将过去一年的一些经验做一下小总结,不一定是最合适的方法,但是当毫无头绪的时候,可以参考参考。

  1.首先介绍企业对该岗位的一些能力需求,直接贴bat在该方向的相应岗位jd:

  数据挖掘=业务知识+自然语言处理技术(NLP)+计算机视觉技术(CV)+机器学习/深度学习(ML/DL)

  (1)其中业务知识具体指的是个性化推荐,计算广告,搜索,互联网金融等;NLP,CV分别是处理文本,图像视频数据的领域技术,可以理解为是将非结构化数据提取转换成结构化数据;最后的ml/dl技术则是属于模型学习理论;

  (2)在选择岗位时,各个公司都没有一套标准的称呼,但是所做的事情无非2个大方向,一种是主要钻研某个领域的技术,比如自然语言处理工程师,计算机视觉工程师,机器学习工程师等;一种是将各种领域技术应用到业务场景中去解决业务需求,比如数据挖掘工程师,推荐系统工程师等;具体的称呼不重要,重要的是平时的工作内容;

  PS:在互联网行业,数据挖掘相关技术应用比较成功的主要是推荐以及计算广告领域,而其中涉及到的数据主要也是文本,所以NLP技术相对来讲比较重要,至于CV技术主要还是在人工智能领域(无人车,人脸识别等)应用较多,本人了解有限,相关的描述会较少;

  3.根据之前的分析,也可以看到该岗位所需要的3种基本能力分别是业务经验,算法能力与工程能力;

  (1)编程基础:需要掌握一大一小两门语言,大的指C++或者JAVA,小的指python或者shell脚本;需要掌握基本的数据库语言;

  (3)数据结构与算法分析基础:掌握常见的数据结构以及操作(线性表,队,列,字符串,树,图等),掌握常见的计算机算法(排序算法,查找算法,动态规划,递归等);

  (4)海量数据处理平台:hadoop(mr计算模型,java开发)或者spark(rdd计算模型,scala开发),重点推荐后者;

  建议:这些是必须要了解的,即使没法做到基础扎实,起码也要掌握每门学科的理论体系,涉及到相应知识点时通过查阅资料可以做到无障碍理解;

  (2)机器学习/深度学习:掌握常见的机器学习模型(线性回归,逻辑回归,SVM,感知机;决策树,随机森林,GBDT,XGBoost;贝叶斯,KNN,K-means,EM等);掌握常见的机器学习理论(过拟合问题,交叉验证问题,模型选择问题,模型融合问题等);掌握常见的深度学习模型(CNN,RNN等);

  (3)自然语言处理:掌握常见的方法(tf-idf,word2vec,LDA);

  (2)通过参加数据挖掘竞赛熟悉相关业务场景,常见的比赛有Kaggle,阿里天池,datacastle等;

  PS:以上都是一些入门级别的介绍,在长期的学习中,应该多看顶会paper,多读开源代码,多学习优秀解决方案;

  (1)格式:个人信息(姓名,联系方式,教育背景,求职意向,照片可有可无)+竞赛经历+实习经历+项目经历+掌握技能+获奖情况;

  PS:牛逼的简历可以让你有更多的面试机会,更关键的是让面试官在面试时潜意识给你打高分,当然前提是简历要真实,所以平时得为了牛逼的简历多做准备工作;

  百度,腾讯,阿里,网易(互联网,游戏,有道),华为,今日头条,滴滴研究院,一点咨讯,360,美团等;

  (2)如果选择留在广东深圳发展,就业的机会比较少,比较好的主要就是百度深研,腾讯总部,华为深圳,京东好像在深圳也有个做数据挖掘的团队;(楼主倾向去深圳发展)

  (3)个人建议在3月份的时候可以通过实习生的身份进入相关企业,争取实习生留用;一般企业给应届生的hc分配比例大概是实习生留用:校招提前批:校招正式=4:3:3,实习生留用相对比较容易;

  (4)一般投递简历时,尽量联系公司内部的师兄师姐或者熟人,帮忙将简历直接给到团队leader手中,这样做的好处是可以同时面试同个公司的多个团队,前提是简历在公司校招系统未被锁定的前提下,具体情况多咨询公司内部熟人,在求职过程中,信息来源非常重要,一定要注意这点,不然会踩很多坑;

  (1)一般该岗位的面试起码都有3轮,2轮技术面,1面hr面,hr面主要看情商,这里不多说;2轮技术面的区别就是越到后面面试官的级别越高,所以面试的风格也可能越偏向于技术视野等一些吹水的线

  1)自我介绍:一般尽量简短,主要讲清楚自己的研究方向,所取得成就以及优势所在即可;

  2)项目介绍:简历上的项目一定要熟悉,介绍时候分三部曲:项目背景,公牛网90885cc阵风7~8级;,项目方案,项目成果;对项目中涉及到的一些技术点一定要很熟悉;

  3)算法提问:一般是问常见机器学习模型原理或者一些机器学习常见问题的解决方案(比如正负样本不平衡之类的),所以常见的机器学习模型一定要很清楚原理,必须会推公式,能知道工程实现的一些

  的话,那你就离sp不远了;4)数据结构提问:常见的数据结构一定要掌握,基础的代码一定要会手写(快排,冒泡,堆排,归并排序,二分查找,二叉树的遍历,二叉树增删查改);剑指

  gbdt原理时,这会你可以跟他说一般说起gbdt,我们都会跟rf以及xgboost一块讲,然后你就可以主动地向面试官输出你的知识;面试并不是死板地你问我答,而是一种沟通交流,所以尽可能地把面试转化成聊天式的对话,多输出自己一些有价值的观点而不是仅仅为了回答面试官的问题;(4

  面技术加一面经理面,技术面必写代码;2)阿里:内推可以电话面,主要是聊项目跟问一些基础的数据结构方面的知识,看看剑指

  ,香港跑狗图论坛888com。gbdt的区别;gbdt,xgboost的区别(烂大街的问题最好从底层原理去分析回答);3)决策树处理连续值的方法;

  与L2的区别以及如何解决L1求导困难;14)如何用尽可能少的样本训练模型同时又保证模型的性能;

  的文本,每行记录了访问ip的log,如何快速统计ip出现次数最高的10个ip;如果只用linux指令又该怎么解决;19)一个绳子烧完需要

  个小时,假设所有绳子的材质都不一样,也不均匀,怎么取出1小时加15分钟;20)假设有个

  的方格,从最左下方开始往最右上方走,每次只能往右或者往上,问有多少种走法,假设中间有若干个格子不能走,又有多少种走法;21)实现

  张牌,每次只能抽一张,抽过的牌会丢掉,怎么选出最大的牌;25)怎么预测降雨量;

  系统;PS:以上的面试题仅供参考,主要是提供一个方向,大概了解这个岗位的面试考核方向,具体还得多刷刷面经(牛客网);

刘伯温金牌六肖| 藏宝图| 创富网| 黄大仙救世网| 开奖记录| 白小姐传密| 开奖结果| 高手联盟心水论坛| 彩霸王| 九龙网站| 白姐图库| 报码室| 开奖记录| 彩霸王| 玄机图|