一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 2162|回复: 24
收起左侧

[统计--软件] 有学R语言的老司机吗,带我上开车

[复制链接] |试试Instant~ |关注本帖
weijin 发表于 2016-3-10 21:25:43 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
R语言新手,这个语言国内好像不怎么火,老司机带带我,不是伸手党。QQ或者QQ群交流讨论
RARARAAAAA 发表于 2016-3-12 20:26:40 | 显示全部楼层
专注用R30年的表示千万别入坑,python比它强10倍。

评分

1

查看全部评分

回复 支持 0 反对 2

使用道具 举报

bostong 发表于 2016-3-21 02:10:54 | 显示全部楼层
比较哪个语言好和差根本没有意义

从data scientist的角度来说,最重要的是把问题抽象话,然后用哪个语言实现都一样。纠结于哪个语言或者看重一个语言看扁一个语言就是无知的表现

每个语言都有优缺点,混合起来用才能使工作最有效率。我一般python和R都用,有的的确python好用些,比如pyspark,有的则用R方便太多,比如dplyr
回复 支持 1 反对 1

使用道具 举报

songyipeng 发表于 2016-3-20 04:04:27 | 显示全部楼层
我觉得应该搞清楚题主的要求。R在统计中常用。常见的统计计算中哪来的那么大的计算量啦。而且,在学术中使用了R中的package,有相应的reference。Python在machine learning中常用。看自己需求啦。再说,我觉得两者皆学业完全没有问题呀。重要的是背后的算法而不是语言。
回复 支持 1 反对 0

使用道具 举报

hyw_5 发表于 2016-3-11 14:33:21 | 显示全部楼层
可以用 RStudio 这个集成界面来上手练习。在 Help 窗口可以直接搜索 R 的 documentation 来确认语法,用起来很方便~

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

 楼主| weijin 发表于 2016-3-11 17:58:53 | 显示全部楼层
hyw_5 发表于 2016-3-11 14:33
可以用 RStudio 这个集成界面来上手练习。在 Help 窗口可以直接搜索 R 的 documentation 来确认语法,用起 ...

有在看视频和看书,初学很多东西还没学到,但是现在有项目要用上,网上又搜索不到答,要疯。慢慢,发帖涨知识中。
回复 支持 反对

使用道具 举报

NeilZhao 发表于 2016-3-12 10:35:57 | 显示全部楼层
这个语言美国很火么

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

lha_1313 发表于 2016-3-12 10:39:54 | 显示全部楼层
Intro to statistical learning in R

也有公开课

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

lukeutd 发表于 2016-3-12 13:58:57 | 显示全部楼层
The art of R programming  
Advance R
如果真把R当统计软件来学 学习梯度很大的(因为不熟悉数据结构)
把第一本看完对R有个基本的认识 然后再分方向看书或者教程吧

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

hyw_5 发表于 2016-3-12 14:51:26 | 显示全部楼层
本帖最后由 hyw_5 于 2016-3-12 14:57 编辑
weijin 发表于 2016-3-11 17:58
有在看视频和看书,初学很多东西还没学到,但是现在有项目要用上,网上又搜索不到答, ...

恩,别急,R应该还算好上手的。有机会找几个别人写过的带注释的长script看看,分段运行运行,会觉得容易起来的~

还有,多利用那些开源的package,也会省不少事。
回复 支持 反对

使用道具 举报

hyw_5 发表于 2016-3-12 14:53:39 | 显示全部楼层
NeilZhao 发表于 2016-3-12 10:35
这个语言美国很火么
. more info on 1point3acres.com
好像也就是在学界特别流行吧
回复 支持 反对

使用道具 举报

NeilZhao 发表于 2016-3-12 20:51:43 | 显示全部楼层
RARARAAAAA 发表于 2016-3-12 20:26
专注用R30年的表示千万别入坑,python比它强10倍。

一不小心从python转了r......
回复 支持 反对

使用道具 举报

calalia 发表于 2016-3-13 12:20:02 | 显示全部楼层
RARARAAAAA 发表于 2016-3-12 06:26
专注用R30年的表示千万别入坑,python比它强10倍。
. more info on 1point3acres.com
我也觉得Python好多了
R也就统计课上用

总不能写白板考算法的时候用R. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
多诡异
回复 支持 反对

使用道具 举报

joycevernon 发表于 2016-3-13 13:34:22 | 显示全部楼层
入坑Python吧。。R处理的数据量大就有点吃力了呢

虽然我还是很喜欢R,但是Python更好用

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

RARARAAAAA 发表于 2016-3-13 18:53:16 | 显示全部楼层

RE: 有学R语言的老司机吗,带我上

RARARAAAAA 发表于 2016-3-12 20:26. 1point 3acres 璁哄潧
专注用R30年的表示千万别入坑,python比它强10倍。
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
我来补充说明一下,R就是太慢,ML算法大多数都比python慢个200,300倍(好吧这是我口胡的,反正大部分时候R的运算时间是无限大,因为你绝对不会等到让它跑完的),感觉放同样的数据,你用R一棵树都没做出来,python说不定就做出一片森林了。曾经用80K*200的数据,跑GBM用了12个小时。rf和gb还行,因为和和R里有h2o的interface,还算是比较快的,但是其他的方法就没有了,比如说常用的extra randomized trees,R简直是慢得要死,反正我一次都没有让他跑玩过。 还有深度学习感觉在R里面已经死了,R的深度学习library简直是五花八门,真正可以用的一个也没有,不是太慢就是太渣。之前用过一个好像叫mommlp的,效果还不错但是在数据不是很多的情况下仅仅做了5-10-5的一个模型就花了4个多小时,里面唯一支持gpu的只有mxxnet,但是我更本不知道这家伙在做什么,效果很差,能用的optimizer非常有限,而且中间层不能dropout。python的keras或者nolearn+ lasagne nn比R不知道要强多少倍。还有大件很熟悉但从来不用的SVM,虽然R和python都很慢,我还是相信python比R快10倍,在python里曾经用10,000*400的数据量在不输出概率的情况下做了一个SVC用了5分钟,R(不论是e1071和kernlab的svm)从来就没有成功过,睡前啥样,一觉起来还是啥样。
其次,觉得python很方便,算法也写得比较好,python的pandas,sklearn, numpy这三个library可以顶R里面100个library。用起来也毫不像反锁,也很快。不像R,比若说做one hot encode的时候,或者nlp做tonkenize的时候或者做data reshape的时候,python一点问题都没有的情况下,R常常会内存爆炸(我是8G的内存)而且又慢,写code又多,function用得也多。还比如说新手不会用data.table或者readr,读个数据到R里面估计都得花半条命。. 1point 3acres 璁哄潧
还有有目共睹的一点:R能做的python全都能做,python能做的R很多不能做。
.1point3acres缃我都安利了这么久了,不知道lz能否听得进去。

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

demonhunter 发表于 2016-3-20 23:44:44 | 显示全部楼层
本帖最后由 demonhunter 于 2016-3-21 00:30 编辑

建议用Python,各种常用的ML算法都手动实现一遍。。。。我现在就在慢慢做这件事情。
作为一个断断续续用R用了7年的人,个人觉得R还是比较适合发统计学paper和应付统计课的作业和project。
回复 支持 反对

使用道具 举报

DreamBoy 发表于 2016-3-21 01:35:15 | 显示全部楼层
RARARAAAAA 发表于 2016-3-13 18:53
我来补充说明一下,R就是太慢,ML算法大多数都比python慢个200,300倍(好吧这是我口胡的,反正大部分时候 ...

你知道optimization的时候为啥python特慢被matlab都完爆么?其他都赞同哈 我也是用了R好多年然后做research就开始用python了
回复 支持 反对

使用道具 举报

lha_1313 发表于 2016-3-21 03:06:46 | 显示全部楼层
bostong 发表于 2016-3-21 02:10
比较哪个语言好和差根本没有意义. 1point3acres.com/bbs
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
从data scientist的角度来说,最重要的是把问题抽象话,然后用哪个语言 ...
.鐣欏璁哄潧-涓浜-涓夊垎鍦
手动点赞
回复 支持 反对

使用道具 举报

calalia 发表于 2016-3-21 03:06:52 | 显示全部楼层
DreamBoy 发表于 2016-3-20 11:35
你知道optimization的时候为啥python特慢被matlab都完爆么?其他都赞同哈 我也是用了R好多年然后做resear ...

OPT都矩阵啊
MATLAB矩阵大法好
回复 支持 反对

使用道具 举报

RARARAAAAA 发表于 2016-3-21 08:40:31 | 显示全部楼层
DreamBoy 发表于 2016-3-21 01:35. 鍥磋鎴戜滑@1point 3 acres
你知道optimization的时候为啥python特慢被matlab都完爆么?其他都赞同哈 我也是用了R好多年然后做resear ...

matlab从来都不用的,毕竟价格摆在那里,穷人只用免费的。这么贵,如果还没点优势谁会去用啊
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-8 05:10

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表