Skip to content

InfiniTensor/InfiniCore-Infer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

35 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

InfiniCore-Infer

本项目是基于 InfiniCore 的推理引擎。

使用方式

  • 编译并安装 InfiniCore 。注意根据提示设置好 INFINI_ROOT 环境变量(默认为 $HOME/.infini)。

  • 编译并安装 InfiniCore-Infer

xmake && xmake install
  • 运行模型推理测试
python jiuge.py [--cpu | --nvidia | --cambricon | --ascend | --metax | --moore] <path/to/model_dir> [n_device]
  • 部署模型推理服务
launch_server.py [-h] [--dev {cpu,nvidia,cambricon,ascend,metax,moore}]
                        [--model-path MODEL_PATH] [--ndev NDEV] [--max-batch MAX_BATCH]
                        [--max-tokens MAX_TOKENS]