查看: 6279| 回复: 31
跳转到指定楼层
上一主题 下一主题
收起左侧

转载个大数据的段子

全局:

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it. (原作者没找到。简单搜索了,段子初始版本或许出自John Cook的博客评论,时间是2011年)
所以说大数据这种东西到底靠不靠谱啊

上一篇:统计数据挖掘在企业中的应用前景—论坛上资深的大哥大姐和刚入门的小朋友们一起讨论呀
下一篇:上次是谁跟我讨论CART来着 -- 正好看见关于missing data的部分
推荐
rogerdai 2013-1-4 22:24:41 | 只看该作者
全局:
leth 发表于 2013-1-4 21:52 . 1point 3acres
关键是到底有多大的市场呢?

我想,挖掘大数据一定意义上等同于复杂模型。
当数据量小的时候,可以训练简单的模型。但是简单的模型却不足以对真实世界做出足够好的预测。. 1point3acres.com
当搜集的数据更多更大的时候,数据里表现的就是更复杂的行为了。
打个比方,就像读万卷书与行万里路的关系。
以前是读万卷书,然后YY一下~
现在可以行万里路了,虽然还走不快~
既然以前是尝试模拟出真实的数据,而现在是更多真实的数据at hand,更接近真实岂不是更有实践意义~?
嗯...我觉得这里还有很多空间可以做,现在在大数据上的挖掘能力还远远比不上传统的挖掘能力。
当然,有多大的需求,就有多大的市场。
你需要大数据吗?TA需要大数据吗?
我们想要从百Gb,Tb的数据中挖掘什么?
当这个东西不仅仅是被每个人都围观,而是每个人都involve进去的时候,市场就显而易见了。
如果这个东西被束之高阁,仅仅少数人知道,那么倒不一定是件好事了...
一点点个人浅见,抛砖引玉。。。。。

评分

参与人数 1大米 +10 收起 理由
leth + 10 长姿势了,我也觉得市场是需要推动的

查看全部评分

回复

使用道具 举报

推荐
rogerdai 2013-1-4 20:55:50 | 只看该作者
全局:
哈哈哈哈..捶地大笑...
俺所在实习的部门就叫“大数据”的飘过...
这些东西炒得太多了大家觉得有点腻了呗~
我相信大数据是有价值的,但是很集中,就集中在那些公司,大多数是互联网公司...国内也数的上来的..
但是其他的可能更多的就是炒作了...先得有销售,有市场,有钱赚,才有数据咯~
市场越大,钱赚得越多的公司,才是真的在having sex咯~
回复

使用道具 举报

推荐
 楼主| leth 2013-1-5 10:50:14 | 只看该作者
全局:
fermaigh 发表于 2013-1-5 00:04
其实big data中有意思的是那84%的dark data, where 蕴含着巨大的潜力,怎么来发现他,还是一个问号。
big ...

嗯嗯,big data除了统计和数据挖掘外,还需要想象力和其他很多相关的知识,各行业不能一概而论。感觉这个楼正在往学术的方向发展……
回复

使用道具 举报

🔗
 楼主| leth 2013-1-4 21:52:50 | 只看该作者
全局:
rogerdai 发表于 2013-1-4 20:55
哈哈哈哈..捶地大笑...
俺所在实习的部门就叫“大数据”的飘过...
这些东西炒得太多了大家觉得有 ...

关键是到底有多大的市场呢?
回复

使用道具 举报

无效楼层,该帖已经被删除
🔗
modifiedname 2013-1-5 12:11:11 | 只看该作者
全局:
传统行业BI用analytics现在很多,但是未必是大数据
point of sale数据跟互联网数据量不是一个级别的. 1point 3acres
一天恨不得一个T数据,想想就知道,几家能有啊。。。。

但是量稍小的公司就遍地都是了。。。。
回复

使用道具 举报

🔗
kevinhan4089 2013-1-5 12:50:35 | 只看该作者
全局:
big data 现在很火,我个人理解的是,获得的可用数据少的地方(比如学术界)做出来的model都是不能很好的反映实际的趋势,只能在理论上做做创新,大的互联网公司往往能做出来东西(比如你点一个赞或者你去一次亚马逊点击一个产品,相应都会有数据tag,长期以来就会形成一种趋势),我个人觉得这东西往往是由市场和实际工程所驱动,学术上分析的基本都是做N多优化和假设,可能学点基础理论还可以,真正做东西,还得去好点的公司,记得W大过去写过这个方向未来可能会需要很多人,因为有市场嘛,市场驱动,有利益存在所以有价值,现在大家整天都在提这个big data,往往机器学习数据挖掘被人看来都是很火的方向,但是我觉得如果你想以后找SDE或者CS相关的工作,你的基础只要扎实,这些东西都是去公司可以在学的吧,现在只要把算法,操作系统,机器学习等基础理论学好就OK了,以后具体的东西还是会变化的么,基础打好了,以后很多东西其实都是可以一通百通的,呵呵

评分

参与人数 2大米 +30 收起 理由
leth + 10 给一通百通
woaibai + 20

查看全部评分

回复

使用道具 举报

🔗
 楼主| leth 2013-1-5 13:14:04 | 只看该作者
全局:
kevinhan4089 发表于 2013-1-5 12:50
big data 现在很火,我个人理解的是,获得的可用数据少的地方(比如学术界)做出来的model都是不能很好的反 ...

也对,大数据基本都在大公司,我记得某个数据库顶级会议在讨论学术界要何去何从。一通百通我喜欢
回复

使用道具 举报

🔗
 楼主| leth 2013-1-5 13:20:01 | 只看该作者
全局:
小K 发表于 2013-1-5 12:11
传统行业BI用analytics现在很多,但是未必是大数据
point of sale数据跟互联网数据量不是一个级别的
一天 ...

我在想其实小公司也是可以利用微薄,fb和电商的数据的。大数据会不会是量变引起质变呢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表