🎁 黑五活动已开始: VIP通行证1年立减$55 蓝莓最高减$25 🎁
查看: 399|回复: 0
收起左侧

万卡算力,免费申请,助力酣畅科研

|只看干货
Ning410 | 显示全部楼层 |阅读模式
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   100% (2)
 
 
0% (0)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
AI 拓展了我们的能力边界,激发了我们的想象力和创造力。像电力革命、信息革命一样,AI 技术被视为新一代技术革命的载体。经过几十年的沉淀和发展,如今 AI 正在向更高难度的任务发起挑战,同时也越来越依赖庞大的算力。

我们能看见科研学者们对于研究课题的热情,同时我们也能看见算力资源匮乏的困顿。我们自己也曾经历过好的点子因为缺算力而“卡脖子”无法测试验证的窘境。于是3年时间,我们的一群顶尖工程师、设计师造出了幻方 AI 智能超算集群。集群配备 1 万张英伟达高性能的 A100 计算卡,总体峰值计算速度可达每秒 156 亿亿次(TF32 精度),现已服务近百家高校/科研机构和企业(自动驾驶,AI制药等),每天执行约 32000 多个 AI  训练作业。


深知强大的算力对于科研学者们至关重要,我们将继续对高校和科研机构的研究者们开放免费算力申请,让天才的想法落地,一起去探索对人类有价值的事情。

点击申请免费算力

欢迎使用幻方萤火超算集群

1 高性能|比快更快一点


在实现训练提速的路上,幻方一直在飞奔。

团队持续对常用 AI 模型的核心算子进行优化;针对集群的硬件特性,定制了深度学习训练框架、通信方式等, 当前已整合发布出了如下工具:

hfreduce 多机多卡通信同步

hfai nn 高性能深度学习算子

ffrecord 数据样本格式

无感提速模型训练,将效率提升 30%~6 倍。

除此之外,幻方AI 正在持续推进前沿模型的落地,不断丰富数据集仓库和模型仓库,方便 AI 研究者和开发者们迅捷调用。目前两大“仓库”正在持续建设中,敬请期待 hfai 的版本更新!

2 高可用|打通本地与集群间的任督二脉

为了实现本地环境和幻方萤火超算环境的联调统一,一切代码的调试以及环境配置,都在本地主场完成,只需调用 hfai venv 和 hfai workspace 套件即可一键同步到幻方萤火集群上,坐等训练结果。

hfai venv 虚拟环境管理,方便任务定制私有的环境

hfai workspace 工作区管理,方便本地项目工程同步远程萤火集群

通过以上套件,整个超算机房就像配在您本地电脑上一样,您可以流畅丝滑地体验幻方萤火的科研加速。

3 高效率|打破算力墙,弹性伸缩直达万卡

幻方萤火平台采用任务级分时调度的底层设计,给每个任务分配集群运行时间片(类似操作系统的时间片调度)。

与传统的用户独占方案相比,分时调度大幅提高了集群使用率,有效降低了单位GPU时的使用成本;同时,分时调度较为弹性的资源占用方式,可以根据任务需求实时增减节点配额,从一台机器到万卡算力,瞬时响应,某种意义上说,“人人都能享受万卡算力”。

END

幻方AI以智能超算集群闲置的算力资源,为符合条件的科研团队提供公益性算力支持。我们希望让更多“想象力”和“创造力”生长。期待与各方科学家及开发者们一同共建AI时代。

上一篇:寻找 MLE mock interview 资源
下一篇:求问machine learning engineer 搜广推必备技能
您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表