【職位描述】:*?能夠基于用戶在線行為數據建立多模型復合分析模型,從而實現behavioral?targeting,?look-alike?modeling,anomaly?detection,recommendation等在商業(yè)問題上運用*?協助工程師在大型集群上部署模型,協助實現模型的高效和并發(fā)【任職資格】:*?計算機科學、應用數學、統計學、經濟學、物理學、天文學、商業(yè)分析、信息系統、數據科學或相關本科或以上學歷*?良好的團隊合作精神與溝通能力*?具備很強的工程能力,執(zhí)行力強*?有很強的好奇心【技能要求】:必須要求:*?對常見機器學習模型,如有監(jiān)督模型k-NN,?Na?ve?Bayes,?Linear?Regression,?Logistic?Regression?(包含LASSO和RIDGE),?Regression/Decision?Tree,?GBDT,?Random?Forest,全連接神經網絡;無監(jiān)督模型如k-means,DBSCAN,?PCA有堅實的理論基礎,能熟練推導模型公式?(以上列出的算法為必考考點)*?熟練掌握機器學習的基本概念和方法:Type?I/II?error,?activation?function?(ReLU,?Sigmoid),?SGD,?VC?(Vapnik-Chervonenkis)?dimension,?information?entropy,?cross?entropy,?KL?(Kullback-Leibler)?divergence,?cross?validation,?boosting,?bagging,?L1/L2?regularization,?backward-propagation,?model?performance?benchmark?(AUC,?logloss,?K/S,?precision,?recall,?accuracy,?F-score以及什么情況下應該使用哪些)?(以上列出的概念為必考考點)*?熟練使用Python,Pandas,Sklearn,XGBoost(python?API),LightGBM(python?API)等編程語言和軟件包*?在項目或者課程中使用過常見的特征篩選(feature?selection)和特征降維(dimension?reduction)的方法*?熟悉不平衡樣本的處理方法*?在項目或者課程中,使用Shiny/ggplot,?Dash(python)/Seaborn/Plotly等數據可視化工具*?具備閱讀英文技術文檔和英文學術文獻的能力(筆試和內部考核考試為全英文)額外加分項:*?參加過Kaggle/天池等機器學習建模比賽,取得良好的成績,并屬于算法團隊核心成員的人優(yōu)先*?在項目或者課程中,使用過pyspark或者dask等分布式計算平臺者優(yōu)先*?在項目或者課程中,使用過TensorFlow等深度學習平臺者優(yōu)先*?具備征信/風控/計算廣告相關經驗,熟悉行業(yè)中特征工程方法者優(yōu)先