一亩三分地

 找回密码 注册账号

扫描二维码登录本站

BBS
Offer多多
Salarytics
交友
Learn
Who's Hiring?
Visa Tracker
疫情动态
指尖新闻
Instant
客户端
微信公众号
扫码关注公众号
留学申请公众号
扫码关注留学申请公众号
Youtube频道
留学博客
关于我们
楼主: hcchen
收起左侧

狗家swe在ml application组心得

    [复制链接] |只看干货 |机器学习
我的人缘0

升级   63%

本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   96% (504)
 
 
3% (17)    👎
greyman 发表于 2020-08-31 20:48:29
我们观点并无冲突:就是autoML适合传统小model。现在autoML在paper level也都是各种阉割版(非常有限的搜索空间)任务。至于未来,算力肯定提升,至于能不能指数级提升我也不知道了。C
H2O 已然可以distributed, 各种cloud也可以, 有资源随时run,没资源你人手run也一样run不了,就是我说的根本没有大model大幅度调参这种事,没人会大model大数据大幅度调参,像你说的cv,nlp,run一次一周,难道你就上面tune一个parameter tune四次你就真run一个月?  正常team都应该是先让你减到每次run半小时以内的数据集,大幅度调,调好了再加数据,run一天看看,不行再看看多出来的数据取样再run,一步一步加长时间的。 算我孤陋寡闻还真没听过直接在run一次一周的model上大幅度调参这种事。



另外说个无关的,我build的推荐系统engine最后是ALS+CNN+一堆business rule,解决各种你意想不到的问题,例如两个推荐窗口的截图不能看上去一样(实际产品不一样),什么宗教政治成人信息也得各种assign不同的weights,还得接驳其他crm的model, 直接lr就敢上的只能是paper了。。调参还是要调的。 其中试过retrieve以后再用tree based的精排,一样用小数据auto一下最后apply到全部,performance差不多,跟手调没什么太大差别,可能是我太菜了吧。。


回复

使用道具 举报

我的人缘0

升级   91%

omnimickey 2020-9-1 12:55:01 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   93% (175)
 
 
6% (13)    👎
greyman 发表于 2020-9-1 08:08
我不太信什么fancy的东西,ADAM autoML都是如此,他们能work肯定有前提条件,当假设不成立的时候,代价就 ...

G的autoML都是在几千块TPU的pods上跑的。。匿了
回复

使用道具 举报

我的人缘0

升级   34.29%

greyman 2020-9-1 12:58:33 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   90% (448)
 
 
9% (49)    👎
omnimickey 发表于 2020-9-1 12:55
G的autoML都是在几千块TPU的pods上跑的。。匿了

都有穷举的本事,还拿技术来碾压学生党。扎心了,同匿。
回复

使用道具 举报

我的人缘0

升级   67.5%

金小帅 2020-9-2 02:40:47 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   99% (220)
 
 
0% (1)    👎
请问楼主,在狗家career page找职位的时候,怎么看jd知道“swe在ml application”呢?
回复

使用道具 举报

我的人缘0

升级   3.71%

 楼主| hcchen 2020-9-2 03:58:06 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (430)
 
 
2% (10)    👎
greyman 发表于 2020-9-1 12:58
都有穷举的本事,还拿技术来碾压学生党。扎心了,同匿。

https://papers.nips.cc/paper/805 ... h-neural-automl.pdf
其实也不仅仅是穷举了,有很大一群人也在为了reduce computation cost努力
回复

使用道具 举报

我的人缘0

升级   3.71%

 楼主| hcchen 2020-9-2 03:59:00 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (430)
 
 
2% (10)    👎
金小帅 发表于 2020-9-2 02:40
请问楼主,在狗家career page找职位的时候,怎么看jd知道“swe在ml application”呢?

要和老板聊把, 我其实是team match时来到这个组的。 也是机缘巧合做了这一块内容,并非我本意。

评分

参与人数 1大米 +1 收起 理由
金小帅 + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   3.71%

 楼主| hcchen 2020-9-2 04:05:51 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (430)
 
 
2% (10)    👎
2ndcat 发表于 2020-9-1 11:27
所以贵司哪个组会Fancy Tuning呢? 你了解过广告组, Alexa, 亚麻推荐什么的算法么 ...
讲真,一听你就是业界人士
回复

使用道具 举报

我的人缘0

升级   3.71%

 楼主| hcchen 2020-9-2 04:13:31 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (430)
 
 
2% (10)    👎
2ndcat 发表于 2020-9-1 12:50
H2O 已然可以distributed, 各种cloud也可以, 有资源随时run,没资源你人手run也一样run不了,就是我说的 ...

“我build的推荐系统engine最后是ALS+CNN+一堆business rule” 对你这部分内容特别感兴趣, 有时间能写细点么
回复

使用道具 举报

我的人缘0

升级   6%

BusData 2020-9-2 05:27:50 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   95% (22)
 
 
4% (1)    👎
LZ说的大实话,不仅google,其他公司也是类似。传统业务转型需要ML能实际落地,反倒对那种效果提升不那么依赖,而且tabular的数据DL的空间也有限,问题的定义,数据的获取,清洗,商业上的evaluation等等太关键了。
回复

使用道具 举报

我的人缘0

升级   0.53%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   99% (118)
 
 
0% (1)    👎
2ndcat 发表于 2020-08-31 21:50:09
H2O 已然可以distributed, 各种cloud也可以, 有资源随时run,没资源你人手run也一样run不了,就是我说的根本没有大model大幅度调参这种事,没人会大model大数据大幅度调
默默顶一下,我们组就是用automl和cloud做nlp的,从小数据小model慢慢调到大model
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■拉群请前往同学同事飞友|拉群结伴版块,其他版块拉群,帖子会被自动删除
■论坛不能删帖,为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

Some icons made by Freepik from flaticon.com

快速回复 返回顶部 返回列表