Python API

LLM 类

描述

LLM 类用于加载模型并生成输出。它继承自 cmnnllm.LLM

方法

load(model_dir: str)

  • 描述: 从指定路径加载模型。

  • 参数:

    • model_dir:模型路径(分割)或模型名称(单一)。

  • 返回: None

  • 示例:

    >>> llm.load('../qwen-1.8b-in4/config.json')
    

generate(input_ids: list)

  • 描述: 根据输入 token ID 生成输出。

  • 参数:

    • input_ids:输入 token ID 列表(整型)。

  • 返回: 输出 token ID 列表(整型)。

  • 示例:

    >>> input_ids = [151644, 872, 198, 108386, 151645, 198, 151644, 77091]
    >>> output_ids = qwen.generate(input_ids)
    

response(prompt: str, stream: bool = False)

  • 描述: 根据输入提示生成响应。

  • 参数:

    • prompt:输入提示字符串。

    • stream:是否生成字符串流,默认为 False

  • 返回: 输出字符串。

  • 示例:

    >>> res = qwen.response('Hello', True)
    

create 函数

描述

创建 LLM 实例。

参数

  • config_path : 配置文件路径或模型路径。

返回

  • llm : LLM 实例。

示例

>>> qwen = mnnllm.create('./qwen-1.8b-int4/config.json')