MXNET 前端模型#
本文以 MXNet 前端为例介绍如何编译深度学习模型。
导入 Python 包
import set_env
import mxnet as mx
import tvm
from tvm import relay
import numpy as np
从 mxnet gluon 模型动物园下载模型#
在本节中,下载预训练好的 imagenet 模型并对图像进行分类。
from tvm.contrib.download import download_testdata
from PIL import Image
from matplotlib import pyplot as plt
img_url = "https://github.com/dmlc/mxnet.js/blob/main/data/cat.png?raw=true"
img_name = "cat.png"
synset_url = "".join(
[
"https://gist.githubusercontent.com/zhreshold/",
"4d0b62f3d01426887599d4f7ede23ee5/raw/",
"596b27d23537e5a1b5751d2b0481ef172f58b539/",
"imagenet1000_clsid_to_human.txt",
]
)
synset_name = "imagenet1000_clsid_to_human.txt"
img_path = download_testdata(img_url, "cat.png", module="data")
synset_path = download_testdata(synset_url, synset_name, module="data")
with open(synset_path) as f:
synset = eval(f.read())
with Image.open(img_path) as im:
image = im.resize((224, 224))
plt.imshow(image)
plt.show()
def transform_image(image):
image = np.array(image) - np.array([123.0, 117.0, 104.0])
image /= np.array([58.395, 57.12, 57.375])
image = image.transpose((2, 0, 1))
image = image[np.newaxis, :]
return image
x = transform_image(image)
print("x", x.shape)
x (1, 3, 224, 224)
编译 Graph#
想要将 Gluon 模型移植到便携式计算图上,仅仅需要几行代码。
支持 MXNet static graph(symbol) 和 mxnet.gluon 中的 HybridBlock:
from mxnet.gluon.model_zoo.vision import get_model
shape_dict = {"data": x.shape}
block = get_model("resnet18_v1", pretrained=True)
mod, params = relay.frontend.from_mxnet(block, shape_dict)
## 需要获取概率,所以添加 softmax 算子
func = mod["main"]
func = relay.Function(func.params,
relay.nn.softmax(func.body),
None,
func.type_params, func.attrs)
mod["main"] = func
Downloading /home/ai/.mxnet/models/resnet18_v1-a0666292.zip907cadf9-be02-432c-8f45-af65048f8c97 from https://apache-mxnet.s3-accelerate.dualstack.amazonaws.com/gluon/models/resnet18_v1-a0666292.zip...
编译 Graph:
target = "llvm"
with tvm.transform.PassContext(opt_level=3):
lib = relay.build(mod, target, params=params)
在 TVM 上执行可移植 Graph#
现在,想使用 TVM 重新进行相同的 forward 计算。
from tvm.contrib import graph_executor
# tvm.cuda(0)
dev = tvm.device(dev_type=target, dev_id=0)
dtype = "float32"
m = graph_executor.GraphModule(lib["default"](dev))
# set inputs
m.set_input("data", tvm.nd.array(x.astype(dtype)))
# execute
m.run()
# get outputs
tvm_output = m.get_output(0)
top1 = np.argmax(tvm_output.numpy()[0])
print("TVM prediction top-1:", top1, synset[top1])
TVM prediction top-1: 282 tiger cat
使用带有预训练权重的 MXNet Symbol#
MXNet 经常使用 arg_params 和 aux_params 来分别存储网络参数,这里将展示如何在现有的 API 中使用这些权重。
def block2symbol(block):
data = mx.sym.Variable("data")
sym = block(data)
args = {}
auxs = {}
for k, v in block.collect_params().items():
args[k] = mx.nd.array(v.data().asnumpy())
return sym, args, auxs
mx_sym, args, auxs = block2symbol(block)
# 通常我们会保存/加载它作为检查点
mx.model.save_checkpoint("resnet18_v1", 0, mx_sym, args, auxs)
在磁盘上生成 ‘resnet18_v1-0000.params’ 和 ‘resnet18_v1-symbol.json’。
对于普通的 mxnet 模型,从这里开始:
mx_sym, args, auxs = mx.model.load_checkpoint("resnet18_v1", 0)
# 现在我们使用相同的 API 来获得 Relay 计算图
mod, relay_params = relay.frontend.from_mxnet(mx_sym,
shape_dict,
arg_params=args,
aux_params=auxs)
# 重复相同的步骤来使用 TVM 运行这个模型