📣 VIP通行证夏日特惠 限时立减$68
查看: 17524| 回复: 87
跳转到指定楼层
上一主题 下一主题
收起左侧

前端转DS打卡贴

全局:

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
本帖最后由 yuanjing_sky 于 2018-5-2 16:40 编辑 . From 1point 3acres bbs
. 1point3acres.com
某国企前端妹子一枚,过完春节回来谋划着回来转DS,无奈兜兜转转两个月,学习效率偏低,自信心也有些受挫,现在每天学不完的焦虑很严重,所以打算来一亩三分地拥抱组织,接受大家的监督和建议,也希望能和大家多多探讨交流                                                                                            . From 1point 3acres bbs
先简单介绍一下我的基础和目前的学习进展,虽然本科和研究生都是计算机相关专业,但是由于一直走的是偏学术写论文路线,所以编程能力一直. .и
停留在能用python和matlat跑仿真的水平,现在python也忘得差不多了,数据结构这门课虽然本科的时候学过,但是现在几乎也忘得差不多了,需要
全部重新来过。数学基础还不错,线性代数和高数基础都很扎实,但是数理统计的东西忘得几乎差不多了。前两个月买了李航的统计学习方法和ESL.1point3acres
结合着在啃,白天上班,晚上去图书馆啃书,感觉ESL确实很难啃,现在才大概啃完前四章,李航的书大概翻了一半。对机器学习和统计学习有了
一个大概的认知,但是离能用来处理数据感觉还是很遥远,刚啃完线性logistic 回归,去做kaggle的titanic,感觉还是很懵逼,不知道如何处理missing
data。. Χ
----------------------------------------------------------------------------分割线--------------------------------------------------------------------------------------------
看完K姐的帖子以及之前在极客时间上订阅了洪亮劼的AI内参专栏(顺便在这里推荐一下,这个专栏内容真的很不错,涵盖的范围很广,干货也很多,
适合上下班路上看看,然后对感兴趣的东西的有参考论文可以自己下来深入了解),目前学习计划主要分为以下三个方面:
1. 基础统计知识和机器学习
    先打算花半个月把K姐推荐的这个课 http://onlinestatbook.com/2/index.html学完,把基础的统计概念捡回来,打算这周末去买一本二手的国内概率和数理统计教材,对应着看。
    补完基础,打算学习也是K姐推荐的下面这门课程,配合着教材一起学,编写ESL教材的那一批教授写的,感觉应该会不错,李航的统计学习方法可以对照着继续看。
   stanford Statistical Learning (Tibshrani & Hastie)
2. 编程基础和数据结构和算法   基础:打算先花一个星期把python基础过一遍,如果有时间再学学java(虽然内心只想学python,但是看地里帖子,好像还是编译语言需要学一门)      
   先快速过完基础,打算跟着下面这个python课程学 ..
   Udemy:Complete Python Bootcamp: Go from zero to hero in Python 3
   数据结构和算法    数据结构:python: Problem Solving with Algorithms and Data Structures)
                             Java:  Berkeley 61B http://www.cs.berkeley.edu/~jrs/61b/
    算法:Java Coursera Algo I&II (Princeton),如果对这个话题有兴趣,. 1point 3acres 璁哄潧
. 1point3acres.com                   不限语言 Stanford Algo I&II也很好,两者不可相互代替。(原文粘贴K姐的帖子)
    教材是Head First Java & Data Structures and Algorithms in Java。
    SQL (a week) http://www.w3schools.com/sql/ (一周,先大概了解一下)-baidu 1point3acres
这里计划的是优先保证python的学习,java可以稍微滞后,因为时间有限,有时候想得很美好,但是实施起来很残酷

3. kaggle项目练手和相关论文阅读
    由于我偏向于找机器学习或者算法工程师这类职位,目前主要兴趣在搜索和推荐系统,所以希望以后纵向发展,计划在统计方面有比较深入的了解,
同时动手能力需要加强。计划每天早上到公司半个小时的班车时间,用来阅读相关会议比如KDD, WSDM等会议的论文,前期打算从综述开始,
了解一下目前主要的进展。然后开始阅读近几年的这两个会议的优秀论文。半个月开始在班车上读材料,发现效率还比较高,一天能读完一两页,
所以决定以后坚持下来。
    另一方面就是希望把学到的理论知识运用到具体的场景中,感觉做kaggle项目是个很好的方法,之前做titannic的时候,顺便就去又仔细看了logistic
回归,感觉比单纯看书理解更深入了一点,当然目前做的效果还是很不好,打算学习一段时间回来再做做看有没有提升,如果有兴趣的小伙伴,
可以一起组队啊.1point3acres

初步计划是1和2可以先同步进行一个月或者两个月,然后开始3,在kaggle上找小项目练手,或者找两个队友一起参加一些比赛
以上只是一个初步的计划,有可能不是很合理,后期会慢慢调整,欢迎大家多多提意见,大家一起进步哇。. Waral dи,
打卡今天就开始吧,计划每天晚上十一点左右打卡,希望能坚持下来



. 1point3acres.com








.--



评分

参与人数 3大米 +23 收起 理由
bigpopeye + 3 给你点个赞!
DL + 10 给你点个赞!
慎独 + 10 给你点个赞!

查看全部评分


上一篇:弱鸡想好好学习
下一篇:找一起跳槽DA or DS 的小伙伴
推荐
 楼主| yuanjing_sky 2018-9-24 23:47:33 | 只看该作者
全局:
嗯,感觉好久没有来打卡了,快两周啦。之前有段时间特别迷茫,感觉自己刚刚入门,不知道接下来的学习如何进行下去。再加上中途家里又是请假了几天,加上中秋,就给自己放了好长一段时间的假。放假这段时间,真的好像每天晚上都没有学习,回去就是看新闻,看剧,发呆,久而久之感觉也挺无聊的,后来朋友结婚,去了青海,奔波劳累,心里更加焦虑。回来上班的前一天,自驾去了贵得和龙羊峡,看到了广阔的草原和巍峨的雪山,心态一下子就放松了下来,已经好久没有这么放松了,虽然知道这是短暂的,但是这种状态真的很好。感觉自己应该适当调整一下心态,不要向之前那样把自己逼得太紧,沉浸在做事情和解决问题中,享受这个过程,说不定效果会更好。这只是我的想法,实际实施起来可能并不容易,磨练心性本来就不是一件容易的事吧。之前有说过在极客时间订阅过AI技术内参这个专栏,我是这个软件的一个普通用户,并不是刻意做广告,只是觉得这个专栏内容很好,所以这里推荐一下。在我最近特别迷茫的时期,遇到了它最近推的一期内容,说对于很多人工智能的初学者而言,各种眼花缭乱的模型往往让人觉得不知所措,感觉真的说出了我的心声,关注的公众号每天都在推新文章新模型,让我确实很焦虑。他说这个时候与其一头扎入各式各样层出不穷的新模型中,还不如扎扎实实学懂吃透少数几个模型。这里说吃透,就是说能理解这些模型最基本的原理,从数学的角度来理解这些模型的数学推导,还要理解这些模型的模型本身和优化算法的区别,以及各种优化算法的好坏,最后最好能动手自己动手写一写这些模型的基本实现。更进一步可以思考这些模型有什么特点,在什么场景下比价适用。嗯,对比这个标准,可以说我学的还远远不够踏实,对基础模型还远没有达到吃透。以后还是应该要更加踏实才行。
制定一下这周的学习计划吧:
1.目前即使所有的学习中断,刷题还是保持着一定的节奏,每天三道,当然要继续坚持下去,目前刷到一百五十多道,medium开始会做一些题目,不像刚开始那样毫无头绪,但是我刷题的进度算比较慢的,而且周末没刷,总之现在觉得慢慢保持节奏比较好,打持久战吧。cs61b前天专门去图书馆把project1b也完成啦,平时抽空把讨论的题目也做了,自此前四周学习完毕,基础打好。现在进度拉下不少,现在磨刀霍霍打算开始第五周的内容,这周就是把第五周的内容学完,把第五周的作业做完。
2. ESL从现在开始温习最基础的算法,先从线性模型开始,之前基本的原理了解过了,这一遍就争取更深入理解,对比上面说的标准,逐条击破。
3. 最近kaggle上有一个比较感兴趣的比赛:Google Analytics Customer Revenue Prediction,这次一定要跟着比赛进度跟下来坚持做完,之前的人脸识别项目,由于一些原因,先暂时搁置一下。发现自己就是一个容易放弃的人,特别一上来就做了一个比较有挑战的项目,这次千万不要轻易放弃呀,加油。我感觉下周需要稍微详细地介绍一下自己做的进度,每周有进步,才不会不了了之。
回复

使用道具 举报

推荐
 楼主| yuanjing_sky 2018-7-17 22:24:35 | 只看该作者
全局:
拖到今天来写总结和计划,实在有点不像话了,虽然是因为生病,但是也不应该,检讨一下自己。
总结一下上周的学习情况和这周的学习计划:
1. 上周本来计划每天刷一道easy和一道medium,后来刷的时候,发现easy也并不简单,嗯,所以还是老老实实先把easy刷到一定的量,刷到一百道以后,再easy和medium一起刷吧。也是每天只刷了两道。本来说要开始学cs61B,结果也没学起来,惭愧惭愧。这周的计划还是要开始把cs61B学起来,每周学一个week的量,然后刷题还是每天刷两道吧,计划下周开始每天刷三道,不然进度太慢了。
2. 上周补了一下CNN和RNN,只是大概看了一下网络框架,结合GitHub上的bossSensor的代码看的,这个代码是我目前看到的写得最简洁的最容易看懂的,其他几个项目比如facenet和Mask_RCNN,代码太多了,我感觉我根本看不懂,感觉CNN和RNN就是两个框架,里面有非常多的具体算法,学起来还是需要耗费时间和精力的,后面边用边学。上周也看了一下EM算法和隐马尔可夫模型,隐马尔可夫模型还没看完,隐马尔可夫模型里面用到了EM算法,所以这两个看起来相互促进,这部分一直看的李航的书,这周计划把隐马尔可夫模型看完,下周再看ESL巩固一下这两周看的成果,一半ESL的书的讨论会高一个level,所以还是非常有必要看的。.--
3. tensorflow上周发布了新版本,文档也更新了,好像新的文档看起来要容易一点。上周因为开始着手做我自己的小项目,所以在GitHub上对人脸认别相关的项目大概看了两三个,包括boss_sensor, facenet,face_recognition和大名鼎鼎的Mask_RCNN, 其中除了face_recognition之外,其他的几个项目都用了tensorflow,所以虽然face_recognition在GitHub上的点赞最多,我还是决定选个给予tensorflow的facenet, 这周打算先用训练好的模型跑跑自己的照片看看效果。当然,肯定是要学会自己训练模型,调整参数的,但是目前对我来说似乎是个大工程,所以决定先用起来再说,再慢慢学会自己训练模型,再慢慢了解模型的原理。感觉自己真的很菜,很多人估计研究研究,就会自己搭模型训练模型,只能说自己工程能力确实有点弱。
4. 上周因为刷题和生病消耗太多时间,也没有对onlinestatbook进行及时的复习,这周已经是周二了,感觉时间也不是很充裕,先不复习了,下周把test means的这一章复习掉。
回复

使用道具 举报

🔗
 楼主| yuanjing_sky 2018-5-2 23:48:04 | 只看该作者
全局:
第一天,今天学习了onlinestatbook的第一章的前半部分,最大的收获莫过于,  重温一遍统计的意义,坚定了一下.
坚持学习的动力。还有就是听了Stanford statistic learning的ch 1, 比较印象深刻的一点是,当我们拿到一个数据集准备分析
的时候,第一件事不是把它扔进一个算法,不是作图,而是数据探索。感觉我之前对数据的重要性认识不够,
觉得最重要的是算法,现在觉得这个想法是错误的。发现视频里面好多例子都和ESL重合,让我对这门课好感倍增
今天太水了,假期回来太困了,先休息明天再战。
回复

使用道具 举报

🔗
linbaobei001 2018-5-3 02:49:15 | 只看该作者
全局:
我跟你节奏差不多, 统计基础 和 概率论 大概过了一遍,昨天还把N年前从国内带来的 微积分 翻了一下,,, 然后python 水平比你弱,,, 模型刚福希望linear regresssion下面该开始看tree 了,, 求组队!  691290857  一起做kaggle
回复

使用道具 举报

🔗
 楼主| yuanjing_sky 2018-5-3 18:34:56 | 只看该作者
全局:
linbaobei001 发表于 2018-5-3 02:49
我跟你节奏差不多, 统计基础 和 概率论 大概过了一遍,昨天还把N年前从国内带来的 微积分 翻了一下,,,  ...

已发送好友请求,不过感觉时差有点厉害,哈哈
回复

使用道具 举报

🔗
linbaobei001 2018-5-3 23:11:28 | 只看该作者
全局:
yuanjing_sky 发表于 2018-5-3 18:34
已发送好友请求,不过感觉时差有点厉害,哈哈

没收到你的好友呢,,,
回复

使用道具 举报

🔗
 楼主| yuanjing_sky 2018-5-3 23:12:49 | 只看该作者
全局:
Day2
1. Finished chapter 1 of stanford statistic learning
2. Finished chapter 1 and chapter 2 on Udemy Complete Python Bootcamp: course overview & python setup. There is nothing new, but I quickly go through it for further study. It's on tomorrow to really get started with python..google  и
3. Onlinestatbook: Variables & Percentiles & Levels of Measurement & Measurement Demonstration & Distributions. This is a really great book. Every concept is accompanied by
rich examples and ideas behind it. Moreover, It seems that I underrated the time needed to finish it before. There is lot more content than I imagined.
回复

使用道具 举报

🔗
 楼主| yuanjing_sky 2018-5-3 23:13:16 | 只看该作者
全局:
linbaobei001 发表于 2018-5-3 23:11
没收到你的好友呢,,,

是微信还是QQ呢
回复

使用道具 举报

🔗
linbaobei001 2018-5-3 23:13:45 | 只看该作者
全局:

微信啊     
回复

使用道具 举报

🔗
cloudseer 2018-5-4 00:24:51 | 只看该作者
全局:
同前端,也在大量刷公开课!一起加油楼主
回复

使用道具 举报

🔗
 楼主| yuanjing_sky 2018-5-5 00:33:39 | 只看该作者
全局:
第三天
SQL (a week) http://www.w3schools.com/sql/ (完成基础部分). .и
onlinestatbook: 完成第一章introduction和和第二章stem and leaf display & histograms & frequency polygons & box plots
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表