首页
AI圈子
HOT
AI快讯
专题
问答
AI工具导航
文章
文章
快讯
AI圈子
AI工具大全
{{userData.name}}
已认证
文章
评论
关注
粉丝
¥
{{role.user_data.money}}
{{role.user_data.credit}}
您已完成今天任务的
私信列表
所有往来私信
财富管理
星球币、积分管理
任务中心
每日任务
NEW
认证服务
申请认证
NEW
我的设置
编辑个人资料
进入后台管理
登录
快速注册
行业动态
实战分享
开源项目
AI工具
AI日报
AI百科
AI情报
AI测评
skills资源
活动讲座
投稿
全部标签
AI Infra
AI Infra入门干货总结:大模型是如何高效推理的
作者:binnnliu 看了很多的文章和视频,我以为我理解大模型的工作原理了,直到看了vLLM的代码,我发现很多地方理解的太过表面。因此花了大概2个月的业余时间,深入阅读了vLLM的源码,本文算是对于学习代码的一个总结。另外由于当前主流LLM都是 Decoder-Only 架构,本文会聚焦LLM,不会像网络上其他介绍Transformers的文章从原始论文的 Encoder-Decoder架构讲起…
实战分享
1.8k
0
发布文章
发布快讯
创建AI圈子
发表话题
发布供求
发布问答
发布AI工具大全
提交工单