在国外一跟老外吵架口语立刻就不够用了

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
E轮2.5亿美元融资
K12教育独角兽一起作业
北京-诚聘人工智能/教育/大数据岗
坐标湾区
Games Startup
招聘游戏开发工程师
游戏初创公司招聘工程师、UIUX Designer和游戏策划
码农求职神器Triplebyte:
不用海投
内推多家公司面试
把贵司招聘信息放这里
查看: 1555|回复: 4
收起左侧

[找工就业] 如何从海量数据中获取有效信息?

[复制链接] |试试Instant~ |关注本帖
wendydai 发表于 2015-4-12 16:07:46 | 显示全部楼层 |阅读模式

2015(4-6月)-[15]Stat/Biostat本科+<3个月短暂实习/全职 - 网上海投| 分析|数据科学类实习@湾区某生物科技公司fresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
大家来说说,如何从海量数据中获得有效信息,完成分析+数据可视化呈献给客户?用到的软件和技术?工作内容是1.从文档和网页等等抓取数据 2.分析产品不断记录的大量数据。
有点伸手党,不好意思。。。刚刚申请完应用统计的研究生,所以在市场需求层面上能夸夸其谈一番,也拿了几个analytics的on-site。可是真的要解决具体问题我就完全不懂技术细节。。。请大家指点!


. Waral 博客有更多文章,


surah 发表于 2015-4-13 13:24:18 | 显示全部楼层
1. Data extraction: SQL if they have structured database. For more complicated ones, considering ETL. if for massive dataset, considering Hadoop (MapReduce or Spark).
2. Analysis: depending on your goal and sophisticated level. Statistics software or even programming language if you want to build your algorithm from scratch.. from: 1point3acres
3. Visualization: Considering Tableau. visit 1point3acres for more.

For document and website, google "how to extract data by API".
For massive product records, SQL or Hadoop, depending how large it can be.

评分

1

查看全部评分

回复 支持 1 反对 0

使用道具 举报

378543248 发表于 2015-8-4 06:42:05 | 显示全部楼层
Python script ?
回复 支持 反对

使用道具 举报

calalia 发表于 2015-8-7 09:03:05 | 显示全部楼层
刚申请完硕士的同时就拿到好几个on-site么 楼楼是海本咩

其实 不同公司会有不同的偏好的啦
你去问你老板╭(╯^╰)╮
回复 支持 反对

使用道具 举报

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2018-5-23 06:11

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表