楼主: gnijuohz
跳转到指定楼层
上一主题 下一主题
收起左侧

Introduction to Data Science Week 3 讨论加分贴

🔗
modifiedname 2013-5-25 00:04:51 | 只看该作者
全局:
楼上的你们第六题都怎么做的,hard code进去矩阵维度么??
回复

使用道具 举报

🔗
Ssmile 2013-5-25 02:15:36 | 只看该作者
全局:
小K 发表于 2013-5-25 00:04
楼上的你们第六题都怎么做的,hard code进去矩阵维度么??

我直接用了矩阵的维度。

TA发的一个帖子(Problem 6 Matrix Dimensions):
”For problem 6, it is okay if you hardcode the input matrix dimensions into your solution. The autograder also uses the same data that is provided to you in the datasci_course_materials repository, so it is safe to use the dimensions of the provided data.“
回复

使用道具 举报

🔗
modifiedname 2013-5-25 10:06:54 | 只看该作者
全局:
it is of course ok to pass the grader this way, but does this look like a satisfactory answer to you?

i am really unhappy with this problem

running MR twice should be the way to go, and it is so not a good idea to test the code on exactly the same set of input/output they already give out
回复

使用道具 举报

🔗
Ssmile 2013-5-26 03:21:56 | 只看该作者
全局:
小K 发表于 2013-5-25 10:06
it is of course ok to pass the grader this way, but does this look like a satisfactory answer to you ...

K妈说得对,

我资质尚浅,直接走了捷径,惭愧啊……
有的题目能做出来就不错了,没有细想是不是最好的答案。
回复

使用道具 举报

🔗
仰泳青蛙 2013-5-26 19:10:17 | 只看该作者
全局:
PO作业+吐槽。。
这次lecture的例子挺不错的,不过感觉还是缺了点什么,可能就是K妈说的老师没把整个动态过程讲清楚吧。我自己本身对MapReduce的认识其实也不深,后面还需要多找这方面的资料来认真专研。

然后这次的作业又坑爹了。。
做quizz的时候,选part4的python完全跑不动,整天报错。最后是硬着头皮选part2的Java来做的,幸好quizz的代码还是很简单的,如果不是我这个Java盲估计就做不完quizz了。

然后做assignment的时候,1到5很快就扫完了,就是想吐槽下第四题,那个(person,friend)和(friend,person)根本不应该同时出现吧。我做的时候,是按只输出(person,friend)做的,然后发现要输出两个后懒得改,直接在输出(person,friend)的后面马上输出(friend,person)了。。

做到第6题,刚开始按1-5题的思路做,发现明显差了一步,基本就是只mutiply,但不能把各个element加起来算出最后的AB。
为了交作业,我刚开始是很霸气的在map的时候设置一个key =all 把整个矩阵A和B直接输出到Reduce,然后就是一般的矩阵乘法了(就是在MapReduce的框架下,把Map, Shuffle和Reduce三个部分的作用基本都废了

后面也试了直接hard code的方法,还是觉得不爽,就去尝试做两次MapReduce的解法。刚开始的时候,是想直接在一个py文件里面完成两次MapReduce, 但自己水平不够,基本想不出该怎么下手。
纠结了好久以后,想到一个折中的方法,用两个py文件分别做两次MapReduce。就是先用一个Mutiply.py输入A B的数据,通过MapReduce的方法输出对应元素相乘的结果,存储在名为elements的文件里。 然后再用一个Sum.py输入elements的数据,再次通过MapReduce把对应的元素加起来最终得到AB的所有元素。不过想到这个方法后,发现自己对.json的处理一窍不通,估计要实现也要debug很久,最近时间又很紧张,只能把这个想法放一边,等后面有时间再回来实现了

DS_HW3.png (51.04 KB, 下载次数: 0)

DS_HW3.png
回复

使用道具 举报

🔗
blanklin 2013-5-27 05:48:43 | 只看该作者
全局:
#po作业#



同意楼上,3我做的时候也只输出了(person, friend),感觉这样更合常理。 看了grader 又输了一遍(friend,person) ==
回复

使用道具 举报

🔗
yp0072004 2013-5-28 09:31:51 | 只看该作者
全局:
本帖最后由 yp0072004 于 2013-5-28 09:33 编辑

#Po作业#

第六题我用python 的list 相乘做的,在论坛上有人说到,用了感觉挺方便的
la = [1,2,3,4]
lb= [2,3,4,5]
c = [a*b for a,b in zip(la,lb)]
所以c就会是
[2,6,12,20]
回复

使用道具 举报

🔗
asterid 2013-5-28 13:24:29 | 只看该作者
全局:
#po#作业

s.jpg (148.34 KB, 下载次数: 0)

s.jpg
回复

使用道具 举报

🔗
 楼主| gnijuohz 2013-5-28 16:46:47 | 只看该作者
全局:
额。。。消耗了一天拖延时间=-=
感觉1,5两题简单爆了,第六题又难爆了。
还得hardcode。这样的话思路不难,就是过程有点烦躁。

回复

使用道具 举报

🔗
 楼主| gnijuohz 2013-5-28 16:48:39 | 只看该作者
全局:
小K 发表于 2013-5-22 13:27
quiz 有人做么
我按这个的做法:https://class.coursera.org/datasci-001/forum/thread?thread_id=2707&po ...

quiz好dt啊,我还出现
Server error executing Python Kernel() function。。。
kernel我都没改的。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表