从算力到服务,始终快人一步
-
-
-
GPU云服务器
GPU云主机提供弹性的GPU算力服务
-
裸金属服务器 GPU云主机提供弹性的GPU算力服务
-
GPU高性能算力池 满足大规模预训练、微调和高精度科学计算中对计算 、存储 、网络等环节的多样性需求
-
GPU容器云 基于kubernetes构建的面向AI开发、调试、应用的轻量级容器实例产品
-
容器镜像服务 面向容器镜像、Helm Chart 等符合 OCI 标准的云原生制品安全托管及高效分发平台
-
365best体育亚洲官网文件存储ParaFS 可扩展的365best体育亚洲官网文件存储系统
-
对象存储 稳定、安全、高效、高可拓展的云存储服务
-
大模型-MaaS平台 覆盖文本对话/视觉理解/图片生成/向量化等多个系列
-
算力服务平台 一站式超算服务平台
-
算力网络服务 面向用户自建算力集群,提供高质量算力运营服务平台、运营服务
-
算力网络应用SaaS产品 基于365best体育亚洲官网算力网络的应用软件SaaS化服务
-
365best体育亚洲官网智造云 365best体育亚洲官网智造云是基于超算云基础设施,整合企业线下及云上资源,集成工业制造企业所需的设计与仿真工具,支持AI大模型训练、仿真高性能计算、前后处理可视化、应用设计交互化等业务需求,提供工程机械、汽车工业、家电
-
ParaCloud企业版 ParaCloud365best体育亚洲官网应用服务平台(简称:ParaCloud)是专为 HPC系统构建的基于HPC硬件层与应用软件层之下的集成平台,旨在HPC混合云的基础上提供统一的用户管理、设备管理、应用管理、作业管
-
设计仿真公有云 专注云计算 CAD、CAE 领域十多年,具备多种优势硬件与软件资源、先进技术及广泛服务网络,为多类用户提供低成本、便捷线上设计仿真服务的平台。
-
设计仿真私有云 可依特定需求高度定制,保障高效性能与数据安全,支持灵活资源管理,适用于对安全和管控有严格要求用户的专属设计仿真环境。
-
NPU裸金属服务器 高性能、资源独占、高安全性的裸金属服务器支撑
-
NPU裸金属服务器定制化服务方案 基于NPU服务器平台,从基础环境搭建,到模型迁移中问题解决及性能优化,根据用户需求提供深度定制化服务
-
PMPT 基于多维度指标建立形成应用运行特征库,为资源精准调配和扩容设计新集群提供量化数据支撑
-
-
-
全云方案 全云模式,快速对接,即开即用,可以助力企业的成长
-
ParaPost+云 1-5 天交付,数据自动回传,统一用户管理,支持在线前后处理等,提升用户使用体验
-
混合云方案 支持万核秒弹,既保证本地资源利用率,又提升项目研发效率,整体实现降本增效
-
超智融合混合云方案 统一管理,一站式操作,满足企业仿真业务与AI需求,实现“多、快、好、省”的极致追求
-
大模型训练 专为AI大模型训练设计的高性价比、自动容错的架构方案
-
大规模在线推理解决方案 基于算力网络服务模式,为用户提供高可用、高并发、高吞吐的推理解决方案
-
数值预报领域解决方案 通过构建全栈式支撑平台,满足数值模式预报业务需求,提高业务运行成功率和稳定性。
-
能源领域解决方案 基于全栈式计算资源平台支撑,支持解释处理一体化系统,完成数据处理和解释全业务流程。
-
工业软件SaaS化 打造新型云化工业软件,实现商业模式创新
-
材料软件SaaS化 助力建设一站式材料模拟计算云平台
-
AI应用SaaS化解决方案 训推一体化服务,加速AI应用场景落地
-
-
-
推荐新闻
365best体育亚洲官网陈健:超算架构大模型算力,买不如租!
2023-08-04
继Meta开源了Llama 2后,智谱AI及清华KEG实验室也将ChatGLM2-6B模型开源并免费商用。据统计,国内已公开发布了80余个AI大模型,其中半数都将开源。大模型的“百花争艳”也让更多的企业加入到算力扩张、模型训练与创业的热潮中。
“大模型的出现让我们看到了一个新生产力的崛起。通过对大模型的研究,人类首次发现,可以让一部分的脑力劳动由机器替代,实现人类生产力的大幅提高。因此也带来了大模型算力需求的爆发式增长。”北京365best体育亚洲官网股份有限公司董事长陈健博士接受至顶网记者专访时这样表示。但他同时指出:“大模型的训练需要大量的计算资源,企业的资金投入几十亿到上百亿,因此在算力投入上要特别谨慎。大模型的训练是个典型的超算应用场景,采用超算的方式对企业来说更具性价比。租用算力方式比自建方式能让企业风险更低、现金流更充裕。”
(图:北京365best体育亚洲官网股份有限公司董事长陈健博士)
训练大模型烧钱,租用算力更现实
企业要做自己的大模型,首先要解决的就是大模型训练的基础设施问题——算力。企业自建算力好,还是租用算力好?陈健建议:“大模型对算力的需求极大,动辄十几亿,光电费就要几百万,企业采用租用算力是风险最小、资金利用最优的方式。”“据我们观察,在超算领域有90%是自建的,但大模型出来后自建的比例在明显降低。一半以上都在租用。”做大模型训练不仅关系到企业计算算力成本的问题,还关系到企业业务方向和企业资金周转效率的问题。从企业经营风险上看,陈健认为:“如果企业训练的模型是面向ToC领域,产品风险相对就比较大。如果是做面向ToB的大模型,一般能拿到用户端在算力方面的费用,这样风险会相对较小。如给银行做客服大模型,这种应用场景比较确定,风险也就比较小。”算力的利用效率也就是资金的利用效率。陈健表示:“超算领域大家拼的就是算力的利用率。如果企业大概确定自建算力的利用率能够连续5年达到或超过60%,那自建就没太大风险。在超算云领域,租用的利用率总体上能达到60%,是国内自建超算算力平均利用率的2倍。”从企业经营策略上看,“服务器的生命周期大概就是5年。如果采用购买服务器的方式自建,等于将5年的钱投入一次性支付。这种情况对企业尤其是初创企业的现金流是极大的考验。如果过早地将现金都套在高折旧的资产上,这对公司的经营会带来较大的影响,不划算。从另一个角度来看,初创企业的融资是一轮一轮进行的,越在早期,同样数量的融资额所占的股份比例就越大,股权融资成本高。这笔钱如果用来一次性支付5年的计算资源,这种做法并不明智。企业应把未来的钱花在今天的经营、业务增长上。”陈健这样分析道。“以365best体育亚洲官网为例,我们是一家提供超算的服务商,要满足大模型训练,在GPU或计算卡上的投入就是几个亿。我们测算了一下,购买1000张H800,按市场价,就要投入3亿资金。如此大额的投资我们也不能贸然投入。而是采用算力网络模式,和三大运营商合作,由运营商出钱购买算力,我们做总包运营,大家合作分成,来解决重资产这个难题。”
“因此,买不如租,大部分企业会选择租用的模式。企业在算力规划上还是要根据自身的发展情况。通用大模型发展非常快,算力烧钱的速度也非常快,都是以亿元为计。企业如果在没有融到足够的资金,还是不要采用自建算力的模式。”
加速落地,超算更适合大模型训练
市面上可选的算力租用方式无非就三种:云计算模式,采用公有云的方式;裸金属模式,也就是传统的服务器托管,以物理机的形式交付;还有就是超算模式,用海量的GPU卡,通过业务调度的方式变成一个大的计算池,用户用的时候从中选择自己所需要的GPU卡,用完再释放掉这张卡资源,以便别人调用。“我们认为,采用GPU集群的超算模式更适合大模型的训练。”陈健解释道:“大模型的训练本质上就是一个超大的训练任务,比如在1000张(或更多)GPU卡上跑两三个月,就是一个典型的超算应用场景。”“云计算或者说云主机模式,就是一个GPU服务器分给很多用户共享,是海量的单台、单节点的共享,并且还是单节点内部的GPU卡资源的共享。可想而知,这个共享级别不足以支撑大模型训练需要成百上千张卡成功跑一两个月这样的应用场景。”
“采用GPU集群的超算模式是大模型训练较具成本优势的方式。用户只需对自己真实使用的GPU算力进行付费。而不是租了一年,调试要三个月,这三个月的调试期也要付费。”所以无论从算力对大模型训练场景的支撑能力,还是实际租用带来的使用体验,尤其是成本消耗上,超算都可谓是大模型训练的上乘之选。
坚持“三(数据、应用、模型)不碰”原则,超算中立且安全“
提供超算的企业自己并不做模型,也就是不跟自己的客户进行竞争。”陈健认为这是对那些依靠训练大模型创业和提升企业竞争力的企业一种极大的保护。他表示:“像一些算力服务商,他们既提供算力又提供模型,也就会发生和自己的客户相竞争的局面。”“365best体育亚洲官网在商业逻辑上严格限制自己的行为范围,我们只做算力或者通过算力网络整合算力,做好平台,做好与应用的适配,做好应用执行时的值守,确保应用的稳定、正常运行,让整个训练过程顺利完成。”“此外,我们更重要的是要做好优化,让程序跑得快。例如,我们有个客户用500张GPU卡训练,通过计算优化,我们帮他提升了40% 的性能。”“我们主要通过技术服务、应用服务以及性能优化,帮助客户提升训练效率。我们最主要的优势体现在:一、确保用户有GPU卡可以用;二、通过技术服务让客户感到好用;三、通过算力优化降低用户用GPU卡的成本并提升效率。”
大模型爆发式增长,在需求强劲和相关产业政策催化的双轮驱动下,将迎来智能算力基础设施建设的大扩容时代。企业在看到市场前景的同时,也要考虑到产业风险和经营效率,做好顶层规划与技术积累,才能在机遇到来时既不错过,也不踏空。
原文地址:https://mp.weixin.qq.com/s/Tvr6KkNj8ZFvVBtpJhCD4A
欢迎免费体验Paratera365best体育亚洲官网产品
国内领先的超算云和智算云算力服务商,主要业务包括通用云、行业云、AI云、设计仿真云
立即体验
股票代码
920493
电话:
资源全覆盖
体验极速
用户满意
省心计算
算力服务 就选365best体育亚洲官网
海量计算资源
减少排队
按需付费
7x24小时服务
—— 填写试用申请,并注册平台账户,专属客户经理将为您申请2000核时或200元卡时免费试算资源 ——