一亩三分地

 找回密码 注册账号

扫描二维码登录本站

BBS
指尖新闻
Offer多多
Salarytics
Learn
Who's Hiring?
疫情动态
Instant
客户端
微信公众号
扫码关注公众号
留学申请公众号
扫码关注留学申请公众号
Youtube频道
留学博客
关于我们
查看: 9557|回复: 97
收起左侧

做机器学习真是太难了

    [复制链接] |试试Instant~ |机器学习
我的人缘0

分享帖子到朋友圈
szhhan | 显示全部楼层 |阅读模式
本楼: 👍   100% (39)
 
 
0% (0)   👎
全局: 👍   98% (2063)
 
 
1% (42)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
脑子涨有感而发... 曾经因为机缘巧合入了机器学习的坑,原以为会比sde轻松,没想到原来是地狱模式..

羡慕几年前的机器学习,搞搞清楚random forest, xgboost,各种回归,数学能推个svm,罗辑回归就能找到好工作的年代,自从进入深度学习时代之后每年新出来的东西层出不穷,面试直接进入了地狱难度,数学推导一个比一个变态,就光光是一个nlp方向,SGNS/cBoW、FastText、ELMo,bert等,DSSM、DecAtt、ESIM等,HAN、DPCNN等,BiDAF、DrQA、QANet等,Bi-LSTM-CRF等还有LDA等主题模型... 外加面试还会问到的深度学习各种基础:LSTM,GRU,损失函数,优化函数,调参技巧等等等等,再加上时不时会问的一堆机器学习的基础:逻辑回归、最大熵、决策树、朴素贝叶斯、SVM、Adaboost、EM、HMM、CRF的推导等等等等。。。

有时候真的很羡慕sde只要准备算法+系统设计+经验就可以进大厂,lc刷了快1000道现在真心觉得算法应该是机器学习面试里最简单的一环....

数据科学真是一门以调包侠著称把人引入的坑,入了坑之后才发现是深不见底的汪洋大海

评分

参与人数 20大米 +26 收起 理由
yussaaa + 1 给你点个赞!
243372140 + 1 赞一个
huyibodtc + 2 很有用的信息!
Sonia96 + 2 给你点个赞!
体心立方 + 1 给你点个赞!
慕容清 + 1 赞一个
mutd + 1 赞一个!
LesterRocks + 2 同感!
daydream1 + 2 很有用的信息!
yswang9024 + 2 给你点个赞!

查看全部评分

我的人缘0
starcroce 2020-6-30 13:17:44 | 显示全部楼层
本楼: 👍   98% (96)
 
 
1% (1)   👎
全局: 👍   97% (457)
 
 
2% (13)    👎
现实工作基本是在洗数据,修pipeline,修service,跑offline eval,跑各种奇奇怪怪的sql,写doc,跟pm撕逼,跟别的组撕逼
线上ab test基本是玄学,见过有的组做了一个新model,开aabb四个对照组四个不一样的结果
大部分吹出来的改进都是cherrypick metrics,事后硬凑一个story

评分

参与人数 6大米 +10 收起 理由
ahbbxx92 + 1 赞一个
xdog + 1 赞一个
QINGMO17 + 3 没错!太扎心了
MagicMaggie + 1 给entrylevel雄心壮志还被裁的我看哭了= =
duanmupeiyi + 3 扎心了
mimighost007 + 1 到位了

查看全部评分

回复

使用道具 举报

我的人缘0
本楼: 👍   100% (37)
 
 
0% (0)   👎
全局: 👍   98% (118)
 
 
1% (2)    👎
那你直接转sde啊...不是刷了一千道了吗
回复

使用道具 举报

我的人缘0
saulgoodman 2020-6-30 09:49:26 | 显示全部楼层
本楼: 👍   100% (27)
 
 
0% (0)   👎
全局: 👍   98% (131)
 
 
1% (2)    👎
严重怀疑ML从业者绝大多数也只是对个别模型有较深入的理解,不会闲到每个新出的概念都去做数学推导然后借此在面试中难为新人。。。
至于准备面试,难道不应该专注基本概念+自己的项目经验?只是希望LZ别走火入魔了LOL
回复

使用道具 举报

我的人缘0
 楼主| szhhan 2020-6-30 08:11:39 | 显示全部楼层
本楼: 👍   100% (21)
 
 
0% (0)   👎
全局: 👍   98% (2063)
 
 
1% (42)    👎
LL的申请季 发表于 2020-6-30 08:10
master的时候有一门课期末presentation,老师直接让在黑板手推back propagation😂

手推back propagation基本是跟手推svm一样最放水的了。。。
回复

使用道具 举报

我的人缘0
mimighost007 2020-6-30 16:12:03 | 显示全部楼层
本楼: 👍   100% (14)
 
 
0% (0)   👎
全局: 👍   95% (162)
 
 
4% (7)    👎
事实上modeling在整个ml的应用流程中是不打重要的一个环节

ml的东西,数据基本占80%的成功要素。如果数据从收集,到理清(洗数据,检查labeller之间的iaa)做到位了,在蠢的model都不会太差。剩下花点时间hpo,弄好报告就行。

你要上线新的模型,那么你至少要justify工程上相对目前已有的模型不会regress。这个得决定权不再modeling这边,而在engineering那里,他们有一票否决权到底要不要这个model。一般而言肯定是会favor已有的成熟的pipeline。
回复

使用道具 举报

我的人缘0
uuisafresh 2020-6-30 10:02:26 | 显示全部楼层
本楼: 👍   100% (14)
 
 
0% (0)   👎
全局: 👍   92% (904)
 
 
7% (75)    👎
当我学完机器学习贝叶斯方法,我就正式放弃了。很多方法算法都是有源头的,通过找源头可以看看他是怎么演化来,同时看看未来这个东西会怎么迭代。调包侠是没办法有时间去看这些的,看着看着往往就去维护服务,修修跑模型的pipeline去了,深究的话一下子就转到SDE去了,PHD也不一定能搞到这个上去,搞到了也不一定能有什么成绩。神经网络不是创新,硬件更新让神经网络计算更便利才是创新,数学模型好久没创新了,论文灌水越来越容易,引用大家都上去了,工作中简单的模型堆叠,面试也就是刻板的考察传统模型推到,感觉这样很快就会大浪淘沙了,但是这个大浪淘沙一直没来,感觉是短视频和电商这波把搜索推荐搞上来了,搜索推荐太适合这两个东西,而且短视频越来越火,短期内还会又一波上升

评分

参与人数 1大米 +1 收起 理由
snowquote + 1 赞一个

查看全部评分

回复

使用道具 举报

我的人缘0
Viscent 2020-6-30 14:03:27 | 显示全部楼层
本楼: 👍   100% (12)
 
 
0% (0)   👎
全局: 👍   99% (119)
 
 
0% (1)    👎
借用我manager一句话

神经网络其实是给了人们一个弯道超车的渠道 传统机器学习需要大量学术研究支持 然而现在nn只要一个黑盒子就能乱拳打死老师傅

评分

参与人数 1大米 +1 收起 理由
xdog + 1 赞一个

查看全部评分

回复

使用道具 举报

我的人缘1
bryanjhy 2020-6-30 11:01:25 | 显示全部楼层
本楼: 👍   100% (9)
 
 
0% (0)   👎
全局: 👍   98% (612)
 
 
1% (12)    👎
当年深度学习就是因为难以给出完备的数学证明才一直被打压,直到后来硬件算力提升,神经网络模型屠榜,才让其得以推广
回复

使用道具 举报

我的人缘0
BobbyBear 2020-6-30 22:27:25 | 显示全部楼层
本楼: 👍   100% (7)
 
 
0% (0)   👎
全局: 👍   95% (22)
 
 
4% (1)    👎
想要对每个模型都有深入了解是不可能的。我PhD的时候是研究clustering的,但是其实除了自己研究的那一小店东西,别的也只能是掌握些皮毛。正是像楼上说的,很多时候解决问题是关键,模型什么的说到底就是工具,要用的时候再仔细琢磨不迟。至于面试嘛,我感觉一个劲问这些问题的公司也不见得就真用。
回复

使用道具 举报

我的人缘0
myonlysunshine 2020-7-2 22:21:37 | 显示全部楼层
本楼: 👍   100% (5)
 
 
0% (0)   👎
全局: 👍   100% (16)
 
 
0% (0)    👎
楼主明显是以背题的方式在记忆模型   这种方法明显是不对的

模型之间是有联系的   很多都是一个个进化而来   关系树画出来 都是父母叔伯子侄关系    你一个一个独立去记忆  当然不行

当然 深刻理解模型   是需要实际项目经验的   得实际热爱才会乐在其中     光靠准备面试   只是一个调参员

评分

参与人数 2大米 +2 收起 理由
243372140 + 1 赞一个
tubaby + 1 赞一个

查看全部评分

回复

使用道具 举报

我的人缘0
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   93% (30)
 
 
6% (2)    👎
master的时候有一门课期末presentation,老师直接让在黑板手推back propagation😂
回复

使用道具 举报

我的人缘0
jackalex 2020-6-30 08:41:02 | 显示全部楼层
本楼: 👍   100% (5)
 
 
0% (0)   👎
全局: 👍   97% (623)
 
 
2% (19)    👎
LL的申请季 发表于 2020-6-30 08:10
master的时候有一门课期末presentation,老师直接让在黑板手推back propagation😂

手推back propagation已经很简单啦
听说过面试的时候让你手推back propagation,然后自己写代码实现两层fully connected网络的(从前往后和从后往前都要实现)要求40分钟内推导加白板代码实现
我自己面试的时候被要求白板用tensorflow写个sentiment analysis的model,然后当场计算每一层输入输出的shape和参数的数目(面试官是位普林斯顿毕业的phd~~)


补充内容 (2020-7-1 05:53):
补充一下,手工实现nn是要求不能用任何框架的,只能用numpy
用tf写的那个是我自己的经历,一共也就给了几分钟,关键是看你能不能记住那些api
回复

使用道具 举报

我的人缘0
sevenwonder 2020-6-30 09:12:18 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (44)
 
 
0% (0)    👎
同感字数字数
回复

使用道具 举报

我的人缘0
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   89% (361)
 
 
10% (43)    👎
同感,而且master不太好上岸,,,已经在做两手准备了
回复

使用道具 举报

我的人缘0
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   99% (423)
 
 
0% (4)    👎
同感,再过5年可能现在的知识又跟不上了,所以准备转码
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (144)
 
 
0% (0)    👎
同感,zszszs
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

GMT+8, 2020-7-11 02:25

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表