taolib.harness.pipelines.templates#
Pipeline 模板集合 - 预置可复用的 Flow 结构模板与工厂方法。
通过 FlowTemplate 枚举对外暴露内置模板的标识,并提供
create_from_template() 作为统一的工厂入口。
示例:
from taolib.harness.pipelines.templates import FlowTemplate, create_from_template
flow = create_from_template(
FlowTemplate.EVAL,
config={"name": "rag-eval", "version": "0.1.0"},
)
results = flow.run({"dataset": [...]})
新模板可通过 register_template() 注入到全局表中。
Classes#
ETL 数据处理 Flow 模板。 |
|
预置 Flow 模板枚举。 |
|
模型训练 Flow 模板。 |
Functions#
|
根据模板枚举构造 Flow 实例。 |
|
注册一个新的 Flow 模板(或覆盖已有模板)。 |
Package Contents#
- class taolib.harness.pipelines.templates.ETLFlow(config: FlowConfig | collections.abc.Mapping[str, Any], *, registry: taolib.harness.core.registry.FlowRegistry | None = None, auto_register: bool = True)#
Bases:
taolib.harness.pipelines.flow_base.HarnessFlowETL 数据处理 Flow 模板。
标准骨架:
extract → transform → load → end,子类按需重写各 Step。构造 Flow。
- 参数:
config --
FlowConfig实例或可被其校验的字典。registry -- 自定义 Flow 注册表;缺省使用全局默认注册表。
auto_register -- 是否在构造时自动注册到
registry。
- steps() list[tuple[str, taolib.harness.pipelines.flow_base.StepFn]]#
返回 Flow 的有序 Step 列表,子类必须重写。
- class taolib.harness.pipelines.templates.FlowTemplate#
Bases:
enum.StrEnum预置 Flow 模板枚举。
Initialize self. See help(type(self)) for accurate signature.
- ETL = 'etl'#
- EVAL = 'eval'#
- TRAINING = 'training'#
- class taolib.harness.pipelines.templates.TrainingFlow(config: FlowConfig | collections.abc.Mapping[str, Any], *, registry: taolib.harness.core.registry.FlowRegistry | None = None, auto_register: bool = True)#
Bases:
taolib.harness.pipelines.flow_base.HarnessFlow模型训练 Flow 模板。
标准骨架:
prepare → train → evaluate → checkpoint → end。构造 Flow。
- 参数:
config --
FlowConfig实例或可被其校验的字典。registry -- 自定义 Flow 注册表;缺省使用全局默认注册表。
auto_register -- 是否在构造时自动注册到
registry。
- steps() list[tuple[str, taolib.harness.pipelines.flow_base.StepFn]]#
返回 Flow 的有序 Step 列表,子类必须重写。
- taolib.harness.pipelines.templates.create_from_template(template: FlowTemplate | str, config: taolib.harness.pipelines.flow_base.FlowConfig | collections.abc.Mapping[str, Any], /, **kwargs: Any) taolib.harness.pipelines.flow_base.HarnessFlow#
根据模板枚举构造 Flow 实例。
- 参数:
template -- 模板枚举或其字符串值。
config -- Flow 配置(
FlowConfig或可被其校验的字典)。**kwargs -- 透传给具体 Flow 构造函数的额外参数(如
registry、auto_register等)。
- 抛出:
KeyError -- 当模板未注册时抛出。
- taolib.harness.pipelines.templates.register_template(template: FlowTemplate | str, flow_cls: type[taolib.harness.pipelines.flow_base.HarnessFlow]) None#
注册一个新的 Flow 模板(或覆盖已有模板)。