文件列表:
华安证券:通信行业周报:AI主线去伪存真,关注一季报预期纠偏.pdf |
下载文档 |
资源简介
>
主要观点:科技观点每周荟(通信)微软开源DeepSpeedChat,大模型微调使用成本下降。微软开源发布了DeepSpeed-Chat,一款部署在Azure云上的用于大模型RLHF的AI框架平台。与其他RLHF系统相比,DeepSpeed-HE比现有系统训练时间更快、多节点多GPU系统上扩展型更好,并实现了RLHF训练的普及化。我们认为DeepSpeed降低了大型语言模型的微调训练门槛和成本,有助于MaaS云服务市场的快速发展,并有助于大模型向消费级边缘侧部署下沉,但不代表DeepSpeed的发布降低了AI算力需求,我们认为微调训练工具的使用首先要基于预训练大模型,即类ChatGPT大模型的开发是基础,并仍然具有很高门槛。阿里宣布打造大模型应用“全家桶”,AI智能算力成为阿里云未来主要战略方向。在上周的阿里云峰会上,阿里正式开放自研的通义千问大模型,并宣布所有产品未来将接入通义千问进行全面改造。阿里云全栈AI能力包括IaaS层、PaaS层、MaaS层,我们看到基础设施层面阿里云智能未来将支持最大十万卡GPU单集群规模,并为万卡AI集群提供五拥塞自研RDMA网络,其数据中心智算基础设施投
加载中...
已阅读到文档的结尾了