特斯拉Dojo计算平台有哪些值得关注的?
特斯拉Dojo计算平台有哪些值得关注的?
特斯拉Dojo计算平台有哪些值得关注的?,办公聊天软件,单片机软件开发,番号搜索软件在昨天的特斯拉AI Day发布会,Dojo这个特斯拉自己定制超级计算平台,它的出现是从头开始构建,用于自动驾驶视频数据进行视频训练。主要两个目的:其一是比市售云计算更便宜;其二是比市售云计算更强大——从某种意义上,特斯拉和Jeff Bezos 是不对付的,所以特斯拉是希望与亚马逊 AWS 相提并论,使用在线提供的服务,可以用更少的钱、更快地训练模型。
特斯拉已有是基于 NVIDIA GPU 的大型超级计算机,新的 Dojo 定制计算机,是在设计层面做有效的突破。
从设计之初,硬件层面要为深度的神经网络训练做考虑,从芯片到机组再到机房的传输带宽都是非常扩展,将Occupancy网络应用于Dojo系统之中,实现了AI硬件与AI软件的更佳匹配,最后在降低延迟和性能损失上取得的效果十分惊人。
在技术部分,好的计算模块需要非常特制的电源设计,在这里电压调节模块可以传输1000A电流,具有超高密度,利用多层垂直电源管理材料过渡。这个设计具有高性能、高密度(0.86A/mm2)、复杂集成性,未来的目标是减少54%的CTE,提升3倍性能。在这里提高功率密度是提升系统性能的核心和基石,有趣的是特斯拉在24个月内设计更新了14个版本。在这个电源设计中,充分考虑了电容、时钟和振动特性。
对应32GB高传输频宽存储、每秒900TB资料传输量,以及每秒可对应50GB资料传输量的网路传输频宽的Dojo接口处理器
单一的加速器到前向和后向通道、优化器、多个加速器上运行多个副本的流程。更大激活度的模型想运行前向通道时会遇到适合单个加速器的批量大小往往小于批量规范面的问题;多个加速器上设置同步批量规范模式。
高密度集成是为了加速模型的计算约束和延迟约束部分;Dojo网格的一个片断可以被分割出来运行模型(只要分片足够大);统一的低延迟中的细粒度同步原语加速跨集成边界的并行性;Tensors是以RAM的形式存储Chardon,并在各层执行时及时复制;张量复制的另一个数据传输与计算重叠,编译器也可重新计算层。
编译器以模型并行的方式映射,通信阶段从节点计算本地平均值和标准偏差开始;协调后继续并行。从编译器中提取通信树;真实硬件的时间节点,中间辐射减少的值由硬件加速;这个操作在25个Dojo编译器上只需要5微秒,同样的操作在24个GPU上需要150微秒。这是对GPU的一个数量级的改进。
测试结果:多模系统上对GPU和Dojo进行的测量显示已经可以超越任何100个使用当前硬件运行的老一代PRMS的性能;A100的吞吐量翻了一番;关键的编译器优化达到M100的3倍以上的性能。
目前来看,一个Dojo可以取代6个GPU盒子上的ML计算机,而成本比一个GPU盒子还低,目前一个多月时间来训练的网络现在只需要不到一个星期
相关文章
- 武汉哪里可以做亲子鉴定(武汉亲子鉴定中心信息一览)
- 手机在线看片播放器APP「Lutube」海量高清资源软件免费下载
- 中国智慧旅游服务平台——低音号APP发布上线
- Bentley软件携手北京华维国芯成立创新企业
- 亚马逊推Mac软件下载商店 提供近250款软件
- 体验了一把960克惠普星13 Air后 终于对超轻笔记本路转粉
- 2021防范非法证券期货宣传月丨非法场外配资案例(四)
- 不知道文件名怎么搜索?这款搜索神器值得收藏
- 股票入门基础知识 汇盈软件智能选股绝技-中 教育
- 手机看PDF用什么软件好?安卓手机为你实测!最后答案很明显
- 全美霸榜的匿名社交软件凭什么这么火?
- iphone14pro和13pro对比有什么区别 苹果实体店什么时候有样机?
- 2022年中国自动车牌识别系统市场最新进展及潜力分析
- 最近4K视频制作火了但想提高效率还得靠它
- MRO第一股怡合达: 数字化整合「五金店」生意能否成为中国版米思米?
- 旅行行程规划app有哪些 旅行行程规划app推荐
- 宽城区院检察业务数据质量校验管家上线啦! 检察文书和业务数据质量督导宽城案管这样做
- 3D感知将引领工业领域未来发展
- 360手机助手第五期:春运必备“手机抢票神器”
- mvapp推荐_mv软件哪个好用_mv音乐播放器大全_游吧乐下载