Python API
LLM 类
描述
LLM 类用于加载模型并生成输出。它继承自 cmnnllm.LLM。
方法
load(model_dir: str)
描述: 从指定路径加载模型。
参数:
model_dir:模型路径(分割)或模型名称(单一)。
返回:
None示例:
>>> llm.load('../qwen-1.8b-in4/config.json')
generate(input_ids: list)
描述: 根据输入 token ID 生成输出。
参数:
input_ids:输入 token ID 列表(整型)。
返回: 输出 token ID 列表(整型)。
示例:
>>> input_ids = [151644, 872, 198, 108386, 151645, 198, 151644, 77091] >>> output_ids = qwen.generate(input_ids)
response(prompt: str, stream: bool = False)
描述: 根据输入提示生成响应。
参数:
prompt:输入提示字符串。stream:是否生成字符串流,默认为False。
返回: 输出字符串。
示例:
>>> res = qwen.response('Hello', True)
create 函数
描述
创建 LLM 实例。
参数
config_path : 配置文件路径或模型路径。
返回
llm :
LLM实例。
示例
>>> qwen = mnnllm.create('./qwen-1.8b-int4/config.json')