📣 独立日限时特惠: VIP通行证立减$68
12
返回列表 发新帖
楼主: M4A1
跳转到指定楼层
上一主题 下一主题
收起左侧

[H1B] 2026年“H-1B按工资水平加权抽签改革新规”:一些解读和中签率的计算

   
🔗
HenryJCWJ 2026-1-11 12:11:11 | 只看该作者
全局:
非常實用!
回复

使用道具 举报

🔗
 楼主| M4A1 2026-1-11 14:32:36 | 只看该作者
全局:
本帖最后由 M4A1 于 2026-1-11 00:36 编辑
tom9089 发表于 2026-1-10 20:13. 1point3acres.com
抱歉,您的意思是不是说,如果是一个有着master/phd的Level 3参加抽签,这个人的实际中签率应该是您所说的B ...

表格不是在给概率分布,而是条件概率,不同行变化的是条件事件,所以不需要 sum 到 100% (注意到硕博生四个wage level的概率sum不为100%, 而本科生的四个wage level的概率sum也不为100%),本科生的概率和硕博生的概率也不能直接加。
.google  и
Annual Win Rate这一列每个cell的定义是 P(win this year | degree, WL) -- 给定degree和wage level下的中签率,而其补集为不中签P(not win this year | degree, WL)  ,两个事件的并集才是全集,概率为100%。当degree为硕博生时,其年度中签概率是第一轮中签的概率+第一轮不中签的概率*第二轮中签的概率。三年中签率是1-(1-年度中签率)^3.

Interpretation: 拿Annual Win Rate这个column举例, Masters/PhD WL3这一行的51.08% 应解读为: conditional on你是一个硕博生 and你的wage level是3,那么你的年度中签率是51.08%。

具体细节见我GitHub的Python代码和readme file. 我那个web app有GitHub的链接。

另外我建议你学习一下概率论与数理统计,任意本科级别的教材就行,重点理解事件的独立性和条件概率这两个概念,非常基础但很实用,学有余力可以再看看大数定律/中心极限定理及之后的东西。
回复

使用道具 举报

🔗
tom9089 2026-1-12 12:02:25 | 只看该作者
全局:
本帖最后由 tom9089 于 2026-1-11 20:16 编辑 . From 1point 3acres bbs
M4A1 发表于 2026-1-10 22:32
表格不是在给概率分布,而是条件概率,不同行变化的是条件事件,所以不需要 sum 到 100% (注意到硕博生四 ...

抱歉,我觉得咱们互相似乎都有点误解对方的意思。我也觉得我说的这么基本的错误你应该不会犯,所以我觉得可能是我这边理解错您的意思了。我没有把本科生和硕士生的中签率直接相加,我算的是加权平均。我最开始的质疑是是,如果身为一个WL3工资级别的本科生的中签率是 A, 身为一个硕士生的中签率是B,而硕士生占这个级别工资的比例为X,那么WL3这个级别的平均中签率应该为 A*(1-X) + B*X,就是个简单的加权平均而已 。不论有没有工资加权,这条式子应该都是成立的。我对你的质疑不涉及条件概率或者独立事件,讲的就是annual rate那里。如果在WL3的级别上本科生的中签率是27%,硕士生是51%, 且硕士生是少部分,那最终的平均中签率应该偏向本科生而不是硕士生。但很明显45%更偏向硕士生的中签率。这就是我不明白的地方。听完您这里的“解释”我还是没明白,我还是去看看你的code吧。
回复

使用道具 举报

🔗
tom9089 2026-1-12 12:09:45 | 只看该作者
全局:
就拿WL4来说,官方给出的Bachelor 和 Master/PhD混合的中签率是 61.16%,而你算出来的Master 和 PhD的annual win rate,也就是一年抽签的中签率,是61.45%。如果不是WL4里面全部都是Master/PhD,我想不到有啥别的解释能解释这俩数字 61.16% vs 61.45%。根据你假设Master/PhD占到每个级别大约30%的设定,这怎么看都不对吧?
回复

使用道具 举报

🔗
tom9089 2026-1-12 13:23:37 | 只看该作者
全局:
看完你的code了,我才注意到你的code里面是用的independent draw的假设,而实际上的抽签不是Bernoulli的。现实中一个人的签被抽到了它的其他签都会被消掉,后续抽签概率结构会变化。你的code里面用了Bernoulli的概率:
def per_candidate_prob(p_ticket, m, method="independent"):
    ...
    elif method == "independent":
        return 1.0 - (1.0 - p_ticket) ** m
. 1point3acres.com
你在description里也说了是基于independent,我没太注意,问的问题给你添了不少麻烦。不过基于independent的假设这么做的结果就是使得中签率被低估了,所以按照现实中的加权平均根本得不到DHS给出来的45%和61%的平均概率。如果现实中抽的话,不论是Bachelor还是Master在WL3和WL4的概率都会比你表格里面给出来的大不少。
回复

使用道具 举报

🔗
 楼主| M4A1 2026-1-13 14:16:14 | 只看该作者
全局:
本帖最后由 M4A1 于 2026-1-13 00:35 编辑
tom9089 发表于 2026-1-11 23:23.1point3acres
看完你的code了,我才注意到你的code里面是用的independent draw的假设,而实际上的抽签不是Bernoulli的。 ...
. From 1point 3acres bbs
我现在理解你想把我表里的结果和 Table 13 对齐比较的思路,get到了你质疑的点。在此梳理一下:我这里放的表中WL4硕博两轮抽签的年度中签率(假设本科生v.s. 硕博生的占比与Table 13一样)虽然是大于Table 13的WL4,但差值只有0.3%,似乎太小了些。你对结果的质疑是有道理的,但我认为你之前“加权平均”的计算方式和理解还是有问题的,在此就不继续讨论了。你也找到了华点--关键是我app里的Probability method的设定。这个设定涉及到是从per ticket probability到per candidate probability这一步的计算,我现在的两个方法是其实都是简化的approximation。

首先考虑准确的计算应该是怎样的。就像你说的“一个人的签被抽到了它的其他签都会被消掉”。准确的计算是一个复杂的不放回的抽签,但很麻烦。就考虑本科生和硕博生pool在一起的第一轮抽签,DHS一张一张的抽直到把65000个人头名额抽完(不是一口气抽取65000张票),那么你至少需要分65000步来算,每一步都要把中签的人的所有签去掉,而这又要分四个WL对应的不同票数,然后你还要把本科生和硕博生比例纳入进来分别算,概率会随过程动态变化。 这就很难写一个closed form solution,也许可以用代码写loop从数值上来解,但需要优化latency,我还没时间研究这个路线。
.1point3acres
所以我考虑的事件是一个人在这个wage level有这么多签,那么我至少有一张中签的概率是多少,忽略掉同一个人名下多张票之间的相关性。在抽取比例较小的情况下,这个近似应该是ok的。但对硕博WL3-4 这种权重高的组,误差会更大。回头有空我再研究一下更准确的计算方式,然后更新一下app。
回复

使用道具 举报

🔗
greatmaskino 2026-2-21 23:35:49 | 只看该作者
全局:
本帖最后由 greatmaskino 于 2026-2-21 23:37 编辑
tom9089 发表于 2026-1-12 12:02
抱歉,我觉得咱们互相似乎都有点误解对方的意思。我也觉得我说的这么基本的错误你应该不会犯,所以我觉得 ...

硕博的Annual Win Rate和DHS的平均年度中签率的定义可能并不相同,这应该是为什么你的等式不成立。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表