查看: 10628|回复: 22
收起左侧

[H1B] 用过去两年的数据来估算:今年H1b里到底有多少烂票+今年海底捞概率

    |只看干货
wpwp | 显示全部楼层 |阅读模式
本楼: 👍   98% (49)
 
 
2% (1)   👎
全局: 👍   96% (406)
 
 
3% (13)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
楼主19年底毕业,经历了OPT 3次全部没抽中后非常难过,但同时又十分好奇这个pool里到底有多少abuser的票。于是用过去两年的数据,基于一些假设算了一下今年的48万大军中到底有多少烂票以及今年会不会有海底捞?如果有的话概率多少?

先声明一下,因为只有两年的数据(样本量太少),还有假设并没有事实/数据支撑,所以有些算出来的数会不太准确。欢迎大家积极评论我来修改计算结果。

首先来分析下FY2021,也就是2020年的抽签数据:

total registration: 275000; reg registration: 148500; adv registration 126500
第一轮抽了106100. 按照6.5 : 2来假设 “reg/adv混合抽” 和 “adv单独补抽”的人数比,约等于81135和24965。所以计算出reg 实际中了81135*(148500/275000)= 43812人,中签率约为29.5%;adv实际中了81135*(126500/275000)+24965=62287人,中签率约为49.2%。

第一次海底捞(2020.08)大概捞了18315人,为了计算到底有多少abuser,我先做一个假设:所有的abuser都是用reg cap ,adv cap中没有abuser(后面会再详细讨论这一假设的影响以及合理性)。.1point3acres
所以reg中abuse率=18315/43812=41.8%。一共有148500*41.8%=62078张废票(reg实际的票数是86422张)。
此时pool中还有275000-106100=168900张票,海底捞抽中概率=18315/168900=10.8%。

再来看FY2022:
total registration: 308613; reg registration: 160479; adv registration 148134
第一轮抽了87500,按照和去年一样的假设:reg实际中了34800人,中签率21.7%;adv实际中了~52700人,中签率35.6%。
第一次海底捞捞了27717人,还是和去年一样的假设:reg abuse率=27717/34800=79.6%。一共有127830张废票(reg实际的票数是32649张)。
此时pool中还有308613-87500=221113张票,海底捞抽中概率=27717/221113=12.5%。
这一轮海底捞抽完,pool里还有193396张票。按照上面的概率,应该还剩109909张reg(其中87487张废票,22422张真票),83488张adv。所有票中的废票率为87487/193396=45.2%。我们假设捞起来的27717人中废票率也是45.2%,下一轮海底捞应该会有12528。
然而实际是,第二次海底捞捞了16753人。多了这~4k人,我不觉得是因为上面的废票率算低了导致的,我猜的主要原因是:第一次海底捞时已经是8月了,那个时候有部分人因为三抽不中/对抽签系统失望已经离开美国了。所以又多了4k人给了第二次海底捞。但这第二次海底捞的人数,我想可以部分证明我之前推算的废票率应该还算准确。
. ----
最后来看激动人心的FY2023
total registration: 483927; reg registration: 333910; adv registration 150017。
相比去年,adv人数基本没变。我想这也可以某种程度上证明之前的假设:所有abuse都来自reg。
第一轮抽了127600,按照和之前一样的假设:reg实际中了~67300人,中签率20.1%;adv实际中了~60300人,中签率40.1%。
今年的reg里有多少废票呢?显然在海底捞数据出来前我没法算。但如果我们能假设出今年reg里真实票的人数,应该就可以估算出废票数和海底捞的数据了。
不妨假设今年reg里真实的票数=前两年reg真实票数的平均数:(86422+32649)/2=59535. 那么今年的pool里一共有274375!!!!张abuse的票!!!!!
所以reg中有82.2%的废票。基于这个数据,预测今年会有67300*82.2%=55300张签无法被file。那么实际只会file127600-55300=72300张。
如果还是85k的cap,今年海底捞应该会捞12700左右,海底捞概率~3.56%。
如果ucsic良心大发:把去年第二次海底捞浪费的票(假设有10k)也给今年,那么今年海底捞应该会捞22700左右,概率6.37%。
如果ucsic没有良心:不管去年第二次海底捞浪费的票,也不care今年差的这12700。那么很遗憾,今年没海底捞了。

补充1:
假设所有的abuse都在reg:
如果有部分abuse在adv的话,因为adv有更高的中签率所以abuse的总人数会比以上计算的偏少。但是别忘了,我没有减去抽中的人中abuse的人。如果不是电子抽签,绝大部分abuser是没机会参与到lottery里的。如果加上这部分abuser,应该可以抵消掉“假设所有的abuse都在reg”这个假设所带来的偏少量。所以我在所有计算中都用了这个假设。

补充2:
大家可以等今年海底捞消息出来以后再回来验证我的数据。欢迎插眼。 ..

补充3:
码字不易,真诚求米。谢谢。. ----

评分

参与人数 51大米 +81 收起 理由
bluefish1991 + 1 很有用的信息!
快乐的月亮 + 1 给你点个赞!
Atlantis67 + 1 很有用的信息!
ritatower + 1 赞一个
Karl26 + 1 楼主/层主请继续!
RainbowV + 1 赞一个
wsc1995 + 1 给你点个赞!
xtdong1001 + 1 赞一个

查看全部评分


上一篇:总共6年的H1B怎么计算
下一篇:关于FY2023第一轮抽签概率更准确一些的估算
lusu8892 2022-4-18 04:21:02 来自APP | 显示全部楼层
本楼: 👍   95% (20)
 
 
4% (1)   👎
全局: 👍   94% (224)
 
 
5% (12)    👎
写的挺好,但是咱能研究研究如何把烙印干到吗
回复

使用道具 举报

 楼主| wpwp 2022-4-18 00:48:03 | 显示全部楼层
本楼: 👍   100% (8)
 
 
0% (0)   👎
全局: 👍   96% (406)
 
 
3% (13)    👎
780082768 发表于 2022-4-17 06:35
2022财年
30.8 万份申请. 1point 3acres
总抽取13.2万申请 以选出8.5万人

谢谢回复,这样算也有道理。按照我的假设今年有~27万的废票,真人~21万,和你说的19.8差不多,咱就算20万真人吧,差别出在:

1. 今年第一轮抽了67.3k reg, 60.3k adv. 因为我假设的adv里没有废票(60.3k adv全生效),所以我算出第一轮会有72.3k生效票 >> 12.7/(48.3/20)=5.25万 (你说的算法)。其实5.25算的也太理想了,它假设adv reg真票浓度一样。但事实一定是adv里真票浓度高,因为主要的abuse还是来自印度直接搬运,这些人只能抽reg,另外adv去年和今年总人数基本没变,也可以证明abuse主要发生在reg。当然adv里确实真票浓度也不是100%。

问题转化为,adv里的真票浓度估计成多少才合适?先看去年的数据。total30万,大概是15万reg 15万adv。因为去年abuse已经开始了。我假设10万假票中7万是reg,3万是adv。那么adv有12万真人。

再说到今年,暴增的18万reg肯定都是废票无疑。我们算adv还是3万废票。adv中真人浓度为0.8,reg中真人浓度为(33-18-7)/33=0.24.那么第一轮实际生效6.73*0.24+6.03*0.8=6.45万张。这个介于5.25万(reg adv废票浓度一样)和7.23万(adv废票浓度0)之间。真实的废票分布没人知道,但adv真票浓度越高,第一轮生效数越多,留给海底捞的机会越少。你可以假设一个你的adv真票浓度,算算第一轮到底生效了多少

如果第一轮生效了6.45万的话,第一轮海底捞会补2万左右,第一轮海底捞概率2/35.64=5.6%。即使reg adv废票浓度一样(我觉得绝不可能),第一轮海底捞也只有3.25/35.64=9.11%

2. 你说的算法其实假设有无限轮海底捞,然后等比数列求和了。我只算了第一轮海底捞,没算后面的。对我(很多其他三抽不中的人)来说,应该只有第一轮海底捞是有意义的。如果按照去年,第二轮海底捞发生在11月,那个时候我可能已经L1transfer走了。还有一个事实是应该很难有超过2轮海底捞,所以你也可以假设一个你认为的海底捞轮数,再重新算下总的海底捞概率。

评分

参与人数 4大米 +5 收起 理由
Karl26 + 1 很有用的信息!
Myron2017 + 2 很有用的信息!
zjpjhf + 1 楼主/层主请继续!
Jack2020u + 1 给你点个赞!

查看全部评分

回复

使用道具 举报

 楼主| wpwp 2022-4-18 03:27:13 来自APP | 显示全部楼层
本楼: 👍   100% (5)
 
 
0% (0)   👎
全局: 👍   96% (406)
 
 
3% (13)    👎
wbxzhr123 发表于 2022-04-17 11:30:21
看到数学就头痛
大数据的百分比只能看看
轮到个人头上就是50%
对呀 到了个人就是100%。我自己三年四抽不中 也是很无语了…
回复

使用道具 举报

LuccaQuinn 2022-4-17 17:28:52 来自APP | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   100% (10)
 
 
0% (0)    👎
辛苦楼主计算,祝您今年海底捞好运👍🙏🙏🙏🙏
回复

使用道具 举报

run93 2022-4-17 18:02:54 来自APP | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   97% (142)
 
 
2% (3)    👎
所以今年的海底捞到概率这么低啊。。。好吧。
回复

使用道具 举报

780082768 2022-4-17 21:35:37 | 显示全部楼层
本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   100% (41)
 
 
0% (0)    👎
2022财年. Χ
30.8 万份申请. .и
总抽取13.2万申请 以选出8.5万人
估算大约19.8万人 (=30.8/(13.2/8.5)). ----
2023财年
48.4万份申请 如果还是19.8万人
需要抽20.7万(=48.4/(19.8/8.5)) 才能选出8.5万人
一轮已抽12.76万
所以今年海底捞预计7.9万左右. ----
海底捞抽中概率 :7.9/(48.4-12.76=35.64) = 22%. .и

另一个楼主发的  不应该是这样吗。。。
回复

使用道具 举报

wbxzhr123 2022-4-18 02:30:21 | 显示全部楼层
本楼: 👍   16% (1)
 
 
83% (5)   👎
全局: 👍   96% (1450)
 
 
3% (51)    👎
看到数学就头痛
大数据的百分比只能看看
轮到个人头上就是50%
难受啊~
回复

使用道具 举报

09817167d 2022-4-18 03:44:55 来自APP | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   91% (609)
 
 
8% (57)    👎
没抽中的人观摩大佬的计算过程。虽然完全看不懂,但是顶礼膜拜
回复

使用道具 举报

09817167d 2022-4-18 03:46:33 来自APP | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   91% (609)
 
 
8% (57)    👎
火钳刘明……
回复

使用道具 举报

goohoo123 2022-4-18 04:12:49 来自APP | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   97% (954)
 
 
2% (28)    👎
780082768 发表于 2022-04-17 06:35:37
2022财年. Waral dи,
30.8 万份申请
总抽取13.2万申请 以选出8.5万人
这个应该不对,海底捞应该是每一次单独计算一次概率,他把多次海底捞的总票加起来除以了余票。正确的应该是多次海底捞分别除以余票,所以两次海底捞的概率大概每次都在10%上下,而不是两次加起来的20%. 1point 3 acres
. 1point3acres
补充内容 (2022-04-18 04:14 +08:00):
所以楼主的这个计算更为合理
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

绿卡排期 >
EB-1 Current 前进0天
EB-2 2019-03-01 前进0天
EB-3 2018-03-22 前进0天
EB-4 Current 前进0天
EB-5 Unreserved 2015-11-22 前进-2352天
EB-5 Set Aside: Rural Current 前进0天
EB-5 Set Aside: High Unemployment Current 前进0天
EB-5 Set Aside: Infrastructure Current 前进0天
>
快速回复 返回顶部 返回列表