一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1322|回复: 9
收起左侧

[统计--软件] 给R语言做个广告。

[复制链接] |试试Instant~ |关注本帖
我寄愁心与明月 发表于 2014-11-11 00:49:56 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
看到地里有人讨论各类统计工具的应用,我来给R做个广告。
本人是CS出身,说的不妥当的地方,还要各位多多指教。

做统计/计算的,无非使用的是各类编程语言(C++/Java/Python),或者集成平台(Matlab,R),或者应用软件(SAS, EView,Stata等等)

编程能力需求:编程语言>集成平台>应用软件。
编程语言,即便有强大的软件包API支持,很多时候也要从头写起。
集成平台,本身就是软件包,需要编程,但是不需要对于计算机深入理解,比如不用考虑指针,不用考虑面向对象设计,不用考虑内存,不用考虑多线程。
应用软件,虽然有时候也需要编程,大多数时候软件自带功能就够了,鼠标点点就行,傻瓜操作,但是结果出得更快,常用应用软件的人,应该对结果的关注大于模型本身。
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
执行效率比较:编程语言>集成平台>应用软件。
毫无疑问,编程语言执行效率高,虽然编译器的发展让执行效率变得不那么重要了。比如大型矩阵运算。用Matlab就比R快,C++更快但是你得重新写矩阵类。统计软件估计得跑成鳖爬。。但一般人也不会搞什么大型矩阵对不对???

. Waral 鍗氬鏈夋洿澶氭枃绔,既然是给R做广告,我就说说R的两个优点。
1. 开源,第三方软件包特别多,而且成指数型增长,很多文章发表的同时发表一个软件包。
2. Reproducible research, 可重复研究,这个题目很大,我就说一个简单的例子。
很多同学再读文章,或者尝试新模型的时候,都要实现别人的算法,这往往是很蛋碎的一件事情,文章里描述的不清楚,源代码要不来,即便能要来,万一人家使用的语言你不会,读起来很头疼,而且花时间。

那我是怎么实现Reproducible research的呢?这么说吧,R中的knitr,markdown功能的集成使得R可以一体化写出报告。我交一份R文件,教授一运行,文件自动生成latex文档,代码自动嵌入,图表自动生成。而且制作十分精美。还可以自动生成网页(HTML给教授看)。


教授说,以前的同学交报告,代码另外交,教授先去看报告,再把代码复制过来运行,弄得很蛋碎。现在我交的东西,代码,图表,文字都在一个文件里面,可读性非常高,教授也不担心我的结果是有问题的。
. 鍥磋鎴戜滑@1point 3 acres

有兴趣的同学,可以试试Reproducible Research,很有意思。哄得教授天天开心。
. 1point3acres.com/bbs
.鏈枃鍘熷垱鑷1point3acres璁哄潧
. Waral 鍗氬鏈夋洿澶氭枃绔,

评分

2

查看全部评分

sy10017667 发表于 2014-11-11 00:53:53 | 显示全部楼层
R简单粗暴
回复 支持 反对

使用道具 举报

EroicaCMCS 发表于 2014-11-11 00:54:41 | 显示全部楼层
R生态系统挺好的,就是太慢了。
回复 支持 反对

使用道具 举报

 楼主| 我寄愁心与明月 发表于 2014-11-11 00:59:06 | 显示全部楼层
EroicaCMCS 发表于 2014-11-11 00:54
R生态系统挺好的,就是太慢了。
. Waral 鍗氬鏈夋洿澶氭枃绔,
是太慢了,但哄教授,或者在工作中给甲方看结果,R真的很好用。
回复 支持 反对

使用道具 举报

小K 发表于 2014-11-11 11:03:59 | 显示全部楼层
ipy notebook is also reproducible, but i agree, knitr rocks
from a traditional pdf presentation to a web version

try rcharts - interactive viz...
or even prototype a data product in shiny
-google 1point3acres
i dono if R is really that good for production stuff (at least not the plain R), but it's fast enough for exploration.
tons of work has to go into engineering if you really want to make R do production work. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

py 跑什么分析比R要快很多吗?
我从前用pandas,现在用data.table(R),快了太多,数据分析完全不想用Py了-google 1point3acres
ggplot in R is also way better than the ggplot in Py
只有做需要处理string, http requests之类的东西比较习惯用Py,R也不是不能,不过因为是Py学的,就一直没改。
Py做prototype的选择比R就厉害太多了,不可比。
回复 支持 反对

使用道具 举报

 楼主| 我寄愁心与明月 发表于 2014-11-12 08:36:43 | 显示全部楼层
小K 发表于 2014-11-11 11:03. from: 1point3acres.com/bbs
ipy notebook is also reproducible, but i agree, knitr rocks
from a traditional pdf presentation to  ...
. more info on 1point3acres.com
恩,py可以写应用,R说到底,还是只能做分析。打算做平台用python, 打算出图出数据用R.
回复 支持 反对

使用道具 举报

y5yeyey 发表于 2014-11-12 10:15:46 | 显示全部楼层
我之前一直用 R Studio 的 Rnw,但发现编译速度神慢,而且 bug 尤其的多。例子可见 R Markdown 里的 Tufts template。
. From 1point 3acres bbs
个人感觉做 report 最好用 lyx + knitr,脱离 R Studio,编译速度比在 R Studio 里快上一个数量级。当然算法模型什么的都在 R Studio 里搭建好,再放进 lyx 里生成报告。
回复 支持 反对

使用道具 举报

小K 发表于 2014-11-13 01:32:58 | 显示全部楼层
如果有条件自己搭建server可以试试opencpu
非常好用,把计算留在R当中(略慢,但是也还好),前端完全可以使用正常的前端(JS)
现在在做这些方面的工作,觉得很喜欢。
回复 支持 反对

使用道具 举报

 楼主| 我寄愁心与明月 发表于 2014-11-13 04:23:10 | 显示全部楼层
y5yeyey 发表于 2014-11-12 10:15
我之前一直用 R Studio 的 Rnw,但发现编译速度神慢,而且 bug 尤其的多。例子可见 R Markdown 里的 Tufts  ...

握手,我也是lyx 加Rstudio
回复 支持 反对

使用道具 举报

victorsterling 发表于 2015-9-27 10:26:42 | 显示全部楼层
但我觉得R跟Python一比,好多语法都还是好蠢······

不过我毕竟也是R的新手哈
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-6 23:26

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表