查看: 1080| 回复: 2
收起左侧

[经验感言] Women in Data Science参会记录

|只看干货
本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   100% (7)
 
 
0% (0)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
参加了Women in Data Science Nordic,一共四个talk收获了不少新知识记录一下~ 如果有别的类似的会议也欢迎推荐嘿嘿!
.--
NLP领域:分享了2个industrial cases,比较感兴趣的是第一个如何从客户提供的120*20min videos里找到所需要的信息。视频里面有图像,音频,文本分析,所以是multi-model,使用了Valossa(对视频和文本进行分析得到features),Humantic(可以根据文本和语调对personality进行分析)的API生成了一些特征,最后得到了很好的准确率。. Χ
Feedback:演讲者的英语和时间把控有待提高,但是内容做的很好,主要是有cases所以更容易理解整个project的cycle。两个api很有趣,学到了新知识。

Game-based models:很像lecture,讲了游戏领域的一些milestone还有trust,比较有趣的一点是说到了详细的evaluation metrics,项目里面用了28个,在游戏model领域是很常见的情况,因为使用什么metrics完全取决于目的,比如win rate/ number of pieces 等等
Feedback:在领英上查了一下发现果然是一个讲师,怪不得这么像在上课hh。整体节奏有点快,东西很紧凑因为是一个很大的picture,但是很有趣,即使我不喜欢游戏也觉得有点东西
-baidu 1point3acres
Multilingual NLP models: 这个演讲者居然是我以前的邻居,讲的项目更偏向research方面,是一个大型的transformer model有7B parameters。针对的是nordic语言,还展示了language tree,而且指出了数据的量级是最重要的。这个model的使用场景非常多,可以分类,问答,翻译。听完这个研究我感觉也许我干两年会跑回去读博士。. From 1point 3acres bbs
Feedback:很有趣的研究,虽然落地business有一定的困难但是让我想到一个问题就是绝大多数ml project的提升都很依赖于数据质量和数量,所以我觉得data pipeline或者说engineering才是发展的方向。搭建一个高质量的数据收集pipeline能够显著提高现有模型的能力,但是背后的推动资本有什么理由去做这个呢?

Green projects:讲了CO2排放相关的项目经验,一般不需要复杂的model,比如last mile route optimization 就是用了一个Kmeans算法。减少排放主要用两个途径,一个是optimize现在的生产路径,还有一个是estimate生产量减少浪费。
Feedback:speaker最后说到这种项目最重要的一步就是意识到你的数据是有价值的,所以才会开始收集数据,才会开始做project,所以也许数据集成的推动力量就是数据的价值吧。因为在碳排放项目里面也是这样,减少的二氧化碳排放量就是客户节约的钱。

总结:相比于women in tech,这个conference的内容更加贴近DS,我也更加感兴趣一些,今年诺贝尔化学奖的得主也是一位女性,每次参加这种活动都会更有力量,也比较容易找到下一阶段的role model。一个tips就是多发言多提问,这样可以强迫自己更加engage会议,也能训练自己的批判思维。姐妹们快多多参与起来;) 求加米!!

评分

参与人数 3大米 +3 收起 理由
rupeter + 1 赞一个
Seize_days + 1 给你点个赞!
wmh2i + 1 赞一个

查看全部评分


上一篇:求Lesbians who tech队友
下一篇:药企面试SDE岗,dress code是啥样的
Seize_days 2022-10-9 02:31:21 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   95% (22)
 
 
4% (1)    👎
博主能不能展开说一下last mile route optimization怎么用kmeans做优化啊,还挺有意思的。想不到呢,谢谢!
回复

使用道具 举报

 楼主| Agnes努力找ds 2022-10-10 03:28:58 来自APP | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (7)
 
 
0% (0)    👎
Seize_days 发表于 2022-10-08 11:31:21
博主能不能展开说一下last mile route optimization怎么用kmeans做优化啊,还挺有意思的。想不到呢,谢谢!
她没有详细讲算法~大致就是kmeans分类到哪个地方就去哪个类送快递嗷,不然以前乱送就会多很多排放
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表