面試經驗分享之機器學習與大數據問題
本人的專業方向是機器學習、數據挖掘,就業意向是互聯網行業與本專業相關的工作崗位。各個企業對這類崗位的命名可能有所不同,比如數據挖掘/自然語言處理/機器學習算法工程師,或簡稱算法工程師,還有的稱為搜索/推薦算法工程師,甚至有的并入后臺工程師的范疇,視崗位具體要求而定。
機器學習、大數據相關崗位的職責
自己參與面試的.提供算法崗位的公司有 BAT、小米、360、飛維美地、宜信、猿題庫 等,根據業務的不同,崗位職責大概分為:
1、平臺搭建類數據計算平臺搭建,基礎算法實現,當然,要求支持大樣本量、高維度數據,所以可能還需要底層開發、并行計算、分布式計算等方面的知識;
2、算法研究類文本挖掘,如領域知識圖譜構建、垃圾短信過濾等;推薦,廣告推薦、APP 推薦、題目推薦、新聞推薦等;排序,搜索結果排序、廣告排序等;廣告投放效果分析;互聯網信用評價;圖像識別、理解。
3、數據挖掘類商業智能,如統計報表;用戶體驗分析,預測流失用戶。
以上是根據本人求職季有限的接觸所做的總結。有的應用方向比較成熟,業界有足夠的技術積累,比如搜索、推薦,也有的方向還有很多開放性問題等待探索,比如互聯網金融、互聯網教育。在面試的過程中,一方面要盡力向企業展現自己的能力,另一方面也是在增進對行業發展現狀與未來趨勢的理解,特別是可以從一些剛起步的企業和團隊那里,了解到一些有價值的一手問題。
以下首先介紹面試中遇到的一些真實問題,然后談一談答題和面試準備上的建議。
面試問題1、你在研究/項目/實習 經歷中主要用過哪些機器學習/數據挖掘的算法?2、你熟悉的機器學習/數據挖掘算法主要有哪些?3、你用過哪些機器學習/數據挖掘工具或框架?4、基礎知識
無監督和有監督算法的區別?SVM 的推導,特性?多分類怎么處理?LR 的推導,特性?決策樹的特性?SVM、LR、決策樹的對比?GBDT 和 決策森林 的區別?如何判斷函數凸或非凸?解釋對偶的概念。如何進行特征選擇?為什么會產生過擬合,有哪些方法可以預防或克服過擬合?介紹卷積神經網絡,和 DBN 有什么區別?采用 EM 算法求解的模型有哪些,為什么不用牛頓法或梯度下降法?用 EM 算法推導解釋 Kmeans。用過哪些聚類算法,解釋密度聚類算法。聚類算法中的距離度量有哪些?如何進行實體識別?解釋貝葉斯公式和樸素貝葉斯分類。寫一個 Hadoop 版本的 wordcount。
【面試經驗分享之機器學習與大數據問題】相關文章:
面試問題之經驗態度06-02
面試技巧與經驗的分享08-04
四大面試經驗分享01-15
分享面試經驗12-04
海馬汽車面試經驗與技巧分享12-08
MBA面試經驗交流與分享11-05
小升初面試七大經驗分享11-15
面試問題之5大“最”06-09
小升初面試經驗之六大技巧12-19