楼主: gnijuohz
跳转到指定楼层
上一主题 下一主题
收起左侧

UW Introduction to Data Science Week1讨论加号召报名帖

🔗
modifiedname 2013-5-17 03:42:51 | 只看该作者
全局:
想不通怎么git

1. 头次使用,git 指向远程,取下全部内容

2 在他建立好的folder里面修改他的文件,做作业1。commit

3 打算做作业2了,他说要去pull ,问题来了,不管用pull or fetch,目的是一个:本地只能同时出现一个版本,要么是我自己的,要么是远程给的,当然我需要作业1保留我自己的,作业2用远程的新内容。结果只能一个一个文件去手工解决作业1 里面的conflict,每次指定保留本地内容。

4 下次作业的时候再次出现同一个问题,再次需要一个个手工把作业1&作业2设置成保留本地内容。
。。。。

那作业n的时候岂不是要手工解决所有作业1 to (n-1)的所有文件?

我的workflow必然错了啊?
回复

使用道具 举报

🔗
modifiedname 2013-5-17 05:22:26 | 只看该作者
全局:
查了coursera的论坛,根本也没有人回答完这个问题啊
每次都是说要手工resolve conflict but this is stupid....

另外也很不理解branch
是每次作业基于空白template, branch out一次,还是每次都基于上次的基础branch out?
if 前者,那么如果我作业3的时候想看1和2里面写了什么,岂不是要check out老的branch,那这时候要么看不到老作业,要么看不到新作业,不能同时啊?
if 后者。。。又回到前文说的手工解决冲突问题了。。。

整个大folder弄成一个git repo是否不合理?难道不应该每次作业一个repo?

点评

不是一次作业开一个branch,是总共两个branch:一个是master,一个是你自己的.  发表于 2013-5-17 21:25
回复

使用道具 举报

🔗
sunny1988 2013-5-17 07:11:45 | 只看该作者
全局:
我真心没看懂assignment1的problem3神马意思。。。是说通过论文里的公式算出整个tweet的sentiment,然后再把这个sentiment的值赋给tweet里的还没有定义sentiment的term嘛? 那像神马“it is a good day”, 如果只有good知道,算出来结果是positive,然后 it is a day这些term都变成positive了? 这不科学啊。。。
回复

使用道具 举报

🔗
modifiedname 2013-5-17 07:33:27 | 只看该作者
全局:
sunny1988 发表于 2013-5-16 18:11
我真心没看懂assignment1的problem3神马意思。。。是说通过论文里的公式算出整个tweet的sentiment,然后再把 ...

that's what they meant
回复

使用道具 举报

🔗
 楼主| gnijuohz 2013-5-17 07:57:07 | 只看该作者
全局:
sunny1988 发表于 2013-5-17 07:11
我真心没看懂assignment1的problem3神马意思。。。是说通过论文里的公式算出整个tweet的sentiment,然后再把 ...

我觉得要用统计学的观点来看这个问题还是有点道理的。
因为有成千上万个tweet综合起来得到结果。
回复

使用道具 举报

🔗
sunny1988 2013-5-17 08:07:43 | 只看该作者
全局:
gnijuohz 发表于 2013-5-17 07:57
我觉得要用统计学的观点来看这个问题还是有点道理的。
因为有成千上万个tweet综合起来得到结果。

论文里也说了false positive的情况也是非常厉害的,特别是一些常用词,论文里举例是“will”,我觉得像“is”,“was” 之类的出现概率非常高的常用词都要排除,后面还说用一个“more comprehensive lexicon with dis-
tributional similarity techniques” 来提高perfoemance。。。
forum里有人说用个stop list来做也是有道理的。不过在这个作业里恐怕肯定是没时间做了。。。
回复

使用道具 举报

🔗
 楼主| gnijuohz 2013-5-17 08:26:12 | 只看该作者
全局:
小K 发表于 2013-5-17 03:42
想不通怎么git

1. 头次使用,git 指向远程,取下全部内容

感觉还不如每次重新下一个然后写。。。
回复

使用道具 举报

🔗
 楼主| gnijuohz 2013-5-17 08:29:44 | 只看该作者
全局:
sunny1988 发表于 2013-5-17 08:07
论文里也说了false positive的情况也是非常厉害的,特别是一些常用词,论文里举例是“will”,我觉得像“ ...

这个是最简版本的做法,肯定是有问题的。
is感觉不需要吧。虽然我们知道它是偏中性,但大量综合起来它可能也是中性的(未验证),will和它未必是同一个case的。
回复

使用道具 举报

🔗
barcadong 2013-5-17 13:29:22 | 只看该作者
全局:
感觉有点坑,好多地方都没讲清楚

QQ截图20130516232728.png (31.85 KB, 下载次数: 3)

QQ截图20130516232728.png

评分

参与人数 1学分 +1 收起 理由
gnijuohz + 1 good

查看全部评分

回复

使用道具 举报

🔗
rogerdai 2013-5-17 15:20:26 | 只看该作者
全局:
本帖最后由 rogerdai 于 2013-5-17 15:27 编辑
小K 发表于 2013-5-17 07:33
that's what they meant

噢..我想我明白你的问题了。
你在clone下来以后先开一个branch,比如叫“k”:
  1. git branch k master
复制代码
然后checkout到k分支上:
  1. git checkout k
复制代码
(“git branch -b k master”这条命令好像在一些版本上不能用,因为参数b没有)
然后自己就在k这个branch上做,在这个branch上commit。
git pull的时候就pull下来master就可以了:
  1. git pull -u origin master
复制代码
当有新的作业的时候,会有新的一个文件夹,比如"assignment4",这时候先切换回k分支,然后执行:
  1. git checkout master assignment4
复制代码
这样你就得到了新的作业文件夹,而不会遇到合并冲突的问题。

至于你想看之前的版本的话,一个方法是checkout,checkout回到master去看UW的版本:
  1. git checkout master
复制代码
还有一种方法是打上tag,为了方便切换回来看,可以给k分支上的某个commit打上tag:
  1. git tag -a mapreduce
复制代码
然后在不同tag间切换就可以了。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表