中级农民
- 积分
- 216
- 大米
- 颗
- 鳄梨
- 个
- 水井
- 尺
- 蓝莓
- 颗
- 萝卜
- 根
- 小米
- 粒
- 学分
- 个
- 注册时间
- 2022-8-12
- 最后登录
- 1970-1-1
|
本楼: |
👍
100% (4)
|
|
0% (0)
👎
|
全局: |
👍 100% (7) |
|
0% (0) 👎 |
注册一亩三分地论坛,查看更多干货!
您需要 登录 才可以下载或查看附件。没有帐号?注册账号
x
参加了Women in Data Science Nordic,一共四个talk收获了不少新知识记录一下~ 如果有别的类似的会议也欢迎推荐嘿嘿!
.--
NLP领域:分享了2个industrial cases,比较感兴趣的是第一个如何从客户提供的120*20min videos里找到所需要的信息。视频里面有图像,音频,文本分析,所以是multi-model,使用了Valossa(对视频和文本进行分析得到features),Humantic(可以根据文本和语调对personality进行分析)的API生成了一些特征,最后得到了很好的准确率。. Χ
Feedback:演讲者的英语和时间把控有待提高,但是内容做的很好,主要是有cases所以更容易理解整个project的cycle。两个api很有趣,学到了新知识。
Game-based models:很像lecture,讲了游戏领域的一些milestone还有trust,比较有趣的一点是说到了详细的evaluation metrics,项目里面用了28个,在游戏model领域是很常见的情况,因为使用什么metrics完全取决于目的,比如win rate/ number of pieces 等等
Feedback:在领英上查了一下发现果然是一个讲师,怪不得这么像在上课hh。整体节奏有点快,东西很紧凑因为是一个很大的picture,但是很有趣,即使我不喜欢游戏也觉得有点东西
-baidu 1point3acres
Multilingual NLP models: 这个演讲者居然是我以前的邻居,讲的项目更偏向research方面,是一个大型的transformer model有7B parameters。针对的是nordic语言,还展示了language tree,而且指出了数据的量级是最重要的。这个model的使用场景非常多,可以分类,问答,翻译。听完这个研究我感觉也许我干两年会跑回去读博士。. From 1point 3acres bbs
Feedback:很有趣的研究,虽然落地business有一定的困难但是让我想到一个问题就是绝大多数ml project的提升都很依赖于数据质量和数量,所以我觉得data pipeline或者说engineering才是发展的方向。搭建一个高质量的数据收集pipeline能够显著提高现有模型的能力,但是背后的推动资本有什么理由去做这个呢?
Green projects:讲了CO2排放相关的项目经验,一般不需要复杂的model,比如last mile route optimization 就是用了一个Kmeans算法。减少排放主要用两个途径,一个是optimize现在的生产路径,还有一个是estimate生产量减少浪费。
Feedback:speaker最后说到这种项目最重要的一步就是意识到你的数据是有价值的,所以才会开始收集数据,才会开始做project,所以也许数据集成的推动力量就是数据的价值吧。因为在碳排放项目里面也是这样,减少的二氧化碳排放量就是客户节约的钱。
总结:相比于women in tech,这个conference的内容更加贴近DS,我也更加感兴趣一些,今年诺贝尔化学奖的得主也是一位女性,每次参加这种活动都会更有力量,也比较容易找到下一阶段的role model。一个tips就是多发言多提问,这样可以强迫自己更加engage会议,也能训练自己的批判思维。姐妹们快多多参与起来;) 求加米!! |
上一篇: 求Lesbians who tech队友下一篇: 药企面试SDE岗,dress code是啥样的
|