一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 965|回复: 4
收起左侧

[找工就业] 如何从海量数据中获取有效信息?

[复制链接] |试试Instant~ |关注本帖
wendydai 发表于 2015-4-12 16:07:46 | 显示全部楼层 |阅读模式

2015(4-6月)-[15]Stat/Biostat本科+<3个月短暂实习/全职 - 网上海投| 分析|数据科学类实习@湾区某生物科技公司fresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
大家来说说,如何从海量数据中获得有效信息,完成分析+数据可视化呈献给客户?用到的软件和技术?工作内容是1.从文档和网页等等抓取数据 2.分析产品不断记录的大量数据。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
有点伸手党,不好意思。。。刚刚申请完应用统计的研究生,所以在市场需求层面上能夸夸其谈一番,也拿了几个analytics的on-site。可是真的要解决具体问题我就完全不懂技术细节。。。请大家指点!

.1point3acres缃



surah 发表于 2015-4-13 13:24:18 | 显示全部楼层
1. Data extraction: SQL if they have structured database. For more complicated ones, considering ETL. if for massive dataset, considering Hadoop (MapReduce or Spark).. 鍥磋鎴戜滑@1point 3 acres
2. Analysis: depending on your goal and sophisticated level. Statistics software or even programming language if you want to build your algorithm from scratch.
3. Visualization: Considering Tableau

For document and website, google "how to extract data by API".
For massive product records, SQL or Hadoop, depending how large it can be.

评分

1

查看全部评分

回复 支持 1 反对 0

使用道具 举报

378543248 发表于 2015-8-4 06:42:05 | 显示全部楼层
Python script ?
回复 支持 反对

使用道具 举报

calalia 发表于 2015-8-7 09:03:05 | 显示全部楼层
刚申请完硕士的同时就拿到好几个on-site么 楼楼是海本咩
. more info on 1point3acres.com
其实 不同公司会有不同的偏好的啦
你去问你老板╭(╯^╰)╮
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-8 16:11

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表