Awesome Open Source
Awesome Open Source
Sponsorship

数据科学竞赛经验谈

如何做数据分析?
如何做数据清洗?
如何做特征工程?(面向关系型数据的特征工程系统化分析方法)
如何做特征选择?
如何选择合适的机器学习模型?
如何调参?
如何做模型融合?
如何上分刷榜?

着重介绍数据分析、数据竞赛的方法论和各种反直觉的trick,教你在一周内成为机器学习与数据科学的高级玩家。

完整版PPT在百度云分享:

链接:https://pan.baidu.com/s/1deQv71L23L95L8fppCkReQ 密码:l1pu

有需要请自行下载学习,期待与各位老师同学进行线上线下的深入交流。

引用请注明。

P.S.1 有同学反映PDF部分内容缺少关键细节,我承认我没有把更多干货开放出来。如果想看到最全的版本或需要竞赛辅导者,请加入我的知识星球获取更多干货。

P.S.2 目前该分享的纯文字PDF版已经制作完成,已与PPT版一起上传至我的知识星球。想咨询竞赛经验、快速上分、争夺奖金的同学,欢迎到大卫的小屋与我交流:https://t.zsxq.com/IMfe2vB

联系方式

E-mail: [email protected]

知识星球:https://t.zsxq.com/IMfe2vB

附录

本人竞赛成绩总结

年份 竞赛平台 举办单位 竞赛名称 竞赛成绩 排名
2017 科赛网 中国平安 前海征信“好信杯”迁移学习算法大赛 第6名 6/600
2017 天池大数据众智平台 阿里云 第二届云安全算法挑战赛 第16名 16/959
2018 中国农业银行 中国农业银行软件开发中心 第一届“雅典娜杯”分析挖掘大赛 第2名 2/581
2018 马上金融AI竞赛平台 马上金融 AI全球挑战者大赛 — 违约风险识别赛 第4名 4/107
2018 天池大数据众智平台 阿里云 千里马大数据竞赛——风险识别算法赛 第5名 5/245
2018 蚂蚁金服金融科技平台 蚂蚁金服 蚂蚁开发者大赛 — 支付风险识别赛题 第9名 9/2986
2018 天池大数据众智平台 阿里巴巴 IJCAI2018 — 阿里妈妈国际广告算法大赛 前2%
2018 DataFountain 中国平安 产险数据建模大赛——驾驶行为预测驾驶风险 前2%
2018 kaggle Two Sigma Two Sigma Investment Financial Modeling Challenge 前3%
2019 天池大数据众智平台 天津市津南区政府 津南数字制造算法挑战赛 第2名 2/2682
2019 中国农业银行 中国农业银行软件开发中心 第二届“雅典娜杯”分析挖掘大赛 第4名 4/361

因时间冲突未获奖的竞赛

年份 竞赛平台 举办单位 竞赛名称 竞赛成绩
2016 滴滴AI竞赛平台 滴滴出行 首届全球DI-Tech算法大赛
2016 融360自建平台 融360 “天机”金融风控大数据竞赛
2017 DataCastle 融360 智慧中国杯——用户贷款风险预测 前10%
2017 Kaggle Sberbank Sberbank Russian Housing Market
2017 天池大数据众智平台 高德 KDD CUP Highway Tollgates Traffic Flow Prediction
2018 京东智汇平台 京东 JData全球运筹优化大赛

Get A Weekly Email With Trending Projects For These Topics
No Spam. Unsubscribe easily at any time.
python (47,787
deep-learning (3,457
machine-learning (3,168
data-science (763
sql (628
gan (289
automl (93
xgboost (54
hyperparameter-optimization (52
feature-engineering (42
lightgbm (31
kaggle-competition (31
feature-selection (23

Find Open Source By Browsing 7,000 Topics Across 59 Categories