查看: 6212| 回复: 25
跳转到指定楼层
上一主题 下一主题
收起左侧

推荐一本书 Python_for_Data_Analysis

全局:

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
本帖最后由 anonym 于 2014-5-26 18:23 编辑

之前一直用R做数据分析, python写算法,但是发现需要同时用两者时,遇到了许多困难。在R和python之间来回转换数据格式,语言很麻烦,以下提供几种思路:
1,use rpy2 package in python to call R (配置起来有点麻烦)
2,  use bash file to call python and R in windows
3,  apply data analysis in python (recommend)
maybe more
.--
这本书介绍numpy, panda, matplotlib等,下面是pdf下载链接:
http://bin.sc/Readings/Programmi ... r_Data_Analysis.pdf.--

. .и

评分

参与人数 9大米 +49 收起 理由
davisfan + 3 很有用的信息!
sophieaQ + 3 感谢分享!
诺亚 + 3 正需要,谢谢
perlin + 6 感谢分享!
dalejace + 1 感谢分享!

查看全部评分


上一篇:本科经济编程**申请analytics和data science的可能
下一篇:版里有没有2014 Fall去GWU BA的同学?
415044809 2014-7-5 15:31:48 | 只看该作者
全局:
Python入门书,据说是MIT的,我就是照它学的,讲的很好,而且讲的是Python3.x:
Python Programming: An Introduction to Computer Science. Waral dи,
John M. Zelle, Ph.D.
Preliminary Second Edition
Fall 2009
据说现在又有更新版本了。. Waral dи,
下载地址:http://pan.baidu.com/s/1hq88AXI


评分

参与人数 1大米 +15 收起 理由
anonym + 15 感谢分享!

查看全部评分

回复

使用道具 举报

推荐
 楼主| wesley 2014-7-7 04:24:32 | 只看该作者
全局:
415044809 发表于 2014-7-5 15:31
Python入门书,据说是MIT的,我就是照它学的,讲的很好,而且讲的是Python3.x:
Python Programming: An In ...

谢谢补充 推荐使用python 2.*系列的  这些版本更加成熟  现在很多package都支持python 2.*  有一些还没有支持python3.*  并不是说3不好 只是目前2更成熟拥有更多库 在日常开发编程 有很多帮助
回复

使用道具 举报

全局:
对了你们有用py fit logistic regression的吗?
categorical variable的处理要需要手工设置dummy variables, 仍然感觉略蛋疼。
想做interaction terms也不太简单
这比R还是差老远了。。。
简单linear reg, diagnostic plots etc也差挺多的
. .и
如果只是fit一次,一个简单模型,看一下结果,那是可以的。
回复

使用道具 举报

🔗
victor2100 2014-5-27 06:51:24 | 只看该作者
全局:
vote for this good book!
回复

使用道具 举报

🔗
parachutemd 2014-5-27 11:11:10 | 只看该作者
全局:
跟R做的话最好还是分开,rpy2我用过,不是很好用,非常浪费时间。我觉得除了画图,似乎python可以做所有事。尤其是ipython,reporting起来非常handy。但是据说某些package结果会有出入,最好拿matlab跟R也算算。
回复

使用道具 举报

🔗
camio 2014-5-27 11:14:11 | 只看该作者
全局:
好东西!感谢。
回复

使用道具 举报

🔗
nibuxing 2014-5-27 20:51:47 | 只看该作者
全局:
感觉python更好,现在除了画图用用R的ggplot,其他更喜欢python。
感谢分享,这本书的确是好书。
回复

使用道具 举报

🔗
 楼主| wesley 2014-5-28 11:15:15 | 只看该作者
全局:
nibuxing 发表于 2014-5-27 20:51
感觉python更好,现在除了画图用用R的ggplot,其他更喜欢python。
感谢分享,这本书的确是好书。

ggplot2 每次第一个导入的 画的图很好看 基本上不用调了
回复

使用道具 举报

🔗
 楼主| wesley 2014-5-28 11:15:50 | 只看该作者
全局:
parachutemd 发表于 2014-5-27 11:11
跟R做的话最好还是分开,rpy2我用过,不是很好用,非常浪费时间。我觉得除了画图,似乎python可以做所有事 ...

谢谢补充!
回复

使用道具 举报

🔗
modifiedname 2014-5-28 11:30:51 | 只看该作者
全局:
take a look at beaker, it's aiming at integrating a few diff languages.
still in beta but looks very promising.

now ggplot is supported in py too, though not completely
回复

使用道具 举报

🔗
 楼主| wesley 2014-5-28 23:02:12 | 只看该作者
全局:
小K 发表于 2014-5-28 11:32
对了你们有用py fit logistic regression的吗?
categorical variable的处理要需要手工设置dummy variable ...
.1point3acres
没用py做过 这个确实听蛋疼的
我现在直接把系数和predicotors导出来用的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表