加速替代CUDA!摩尔线程开源vLLM
时间:2024-12-26 08:50:53 来源:尺二秀才网 作者:焦点 阅读:539次
11月5日消息,加速近日,替代摩尔线程上线了大语言模型高速推理框架开源项目vLLM的线程MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的开源范例。
摩尔线程表示,加速正努力围绕自主研发的替代统一系统架构GPU、MUSA软件平台,线程构建完善好用的开源MUSA应用生态。
vLLM是加速一个高效且易用的大模型推理和服务框架,支持创新的替代PagedAttention内存管理、连续批处理请求、线程CUDA/HIP图的开源快速模型执行、CUDA核心优化、加速分布式推理支持等,替代可显著提高大语言模型(LLM)的线程推理性能。
目前,vLLM已在各种大语言模型中得到广泛应用,成为业界常用的开源大模型推理框架。
摩尔线程基于vLLM v0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。
值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。
同时,CUDA相关库的调用,也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。
摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期,还提供MUSIFY自动代码移植工具等一系列实用工具和脚本。
摩尔线程vLLM-MUSA开源地址:
https://github.com/MooreThreads/vLLM_musa
(责任编辑:百科)
最新内容
- ·掉粉130万!网红羊毛月抖音账号被禁止关注:因嘲讽00后找不到工作塌房
- ·九号公司因标错产品价格引发热议 媒体评论:有错就改、主动承担才是大企业格局
- ·哈兰德现场观战马尔默的瑞典超比赛,不参加金球奖颁奖典礼
- ·简单秀一下!库里赛前热身助跑接球,轻松完成双手暴扣
- ·[流言板]全靠你!杰伦
- ·[流言板]公务繁忙!艾弗森场边观战76人,镜头给到其一直在打电话
- ·记者:拜仁考虑外租特尔&不莱梅等队有意,但球员暂时不想外租
- ·超级马里奥!意甲官方社媒晒海报,欢迎巴洛特利回归亚平宁
- ·百步穿杨!梅里尔三分11中6贡献20分4助3断 第三节14分
- ·美媒预测赛季6大奖:文班DPOY,周志豪最佳新秀,约基奇无缘MVP?
热点内容
- ·马威:我们必须打得更坚韧&更努力 我们必须要展现出一些自豪感
- ·腾讯ima.copilot上线Windows版本 个人知识库越用越懂你
- ·金球奖第20名:30岁恰尔汗奥卢,生涯首次提名
- ·[流言板]目前03届、05届、10届均只剩1人在联盟,09届还剩7人
- ·网易2024最后一款大作!《燕云十六声》PC客户端今日预下载
- ·真互联网顶流!雷军参观乐道展台:场面堪比追星现场
- ·西媒:金球奖主办方认为皇马不出席的决定很荒谬
- ·统一拖拽、AI朗读、一键分享 在纯血鸿蒙上松弛阅读的方法get了
- ·埃菲尔铁塔发生火灾:12000名游客被紧急疏散 火势已得到控制
- ·[流言板]谁人能比?约基奇打出生涯第5次30+15+15超级大号三双