淘宝能赌球么,防古棋牌桌两用,澳门AG百家乐规例(中国)·官方网站

通常，模型的輸入是預(yù)處理過的NCHW 格式的張量，但有時(shí)我們可能希望直接將原始圖像輸入模型。在這種情況下，我們需要將預(yù)處理操作作為模型的一部分。我們目前支持這些類型的圖像輸入，它們對應(yīng)不同的像素和通道格式。其中一些是專門針對 CV 系列芯片的，所以這部分我們暫且先不深入探討。

對于預(yù)處理類型，我們目前可以做一些典型的預(yù)處理操作，包括中心裁剪、轉(zhuǎn)置、像素格式變換和歸一化,更多類型的操作會在未來完成。

那么，我們怎樣才能得到一個(gè)包含預(yù)處理操作的bmodel呢？

首先，我們像往常一樣進(jìn)行 model_transform 以獲得Top層的mlir 文件。但是在 model_deploy 步驟中，我們需要指定 fuse-preprocess 參數(shù)。一旦指定了這個(gè)參數(shù)，test_input 應(yīng)該是一個(gè)圖像而不是 numpy 數(shù)組。對于自定義格式，如果不指定，它會被默認(rèn)設(shè)置為和preprocesse infor一致。

在我們將它提供給模型之前，我們?nèi)匀恍枰獙D像數(shù)據(jù)做一些工作，包括：

調(diào)整圖像到指定尺寸。

將數(shù)據(jù)擴(kuò)展為4維。

并轉(zhuǎn)換為ui8 numpy 數(shù)組。這里數(shù)據(jù)格式是 unsinged int8，因?yàn)橄袼刂捣秶?到255的整數(shù)值。

通過運(yùn)行帶有 fuse-preprocess 參數(shù)的 model_deploy 接口，TPU-MLIR 將從 inputOp 收集所有必要的預(yù)處理和校準(zhǔn)信息，然后將它們保存在 InputOp 之后的 preprocessOp 中。

如果沒有提供校準(zhǔn)表，這意味著我們得到一個(gè)不需要任何校準(zhǔn)信息的純浮點(diǎn)型bmodel，在這種情況下我們實(shí)際上也不需要任何校準(zhǔn)信息。

接下來，我們會對InputOp進(jìn)行修改，特別是Type，由于模型的輸入是unsigned INT8張量，所以我們需要將其設(shè)置為ui8的均勻量化類型。您會發(fā)現(xiàn)量化參數(shù)只是單純設(shè)置為 1，因?yàn)槲覀儗⒄鎸?shí)的校準(zhǔn)信息保存在preprocessOp中了。接著，func type也要修改，以保證其和inputOp的Type一致。完成所有這些工作后，該模型的輸入現(xiàn)在已修改為圖像。

這里我們便可以開始lower到 Tpu Dialect。

在這個(gè)階段，如果我們處于F32等浮點(diǎn)量化模式，在 InputOp 之后會插入一個(gè) CastOp，將數(shù)據(jù)從整數(shù)轉(zhuǎn)換為浮點(diǎn)數(shù)，以確保類型的一致性。由于 inputOp 的量化參數(shù)已經(jīng)被設(shè)置為 1。對于 f32，我們就相當(dāng)于只是單純進(jìn)行類型轉(zhuǎn)換。

接下來，我們將開始插入算子，首先在模型中設(shè)置插入點(diǎn)，然后在輸入圖像為NHWC格式時(shí)插入permuteOp。當(dāng)resize_dim與模型輸入形狀不同時(shí)，SliceOp 會被用來進(jìn)行裁剪的工作。

之后我們會在CastOp后設(shè)置一個(gè)新的插入點(diǎn)，ScaleOp在這里會被用來完成歸一化操作。然后，我們還將添加 swapChannelOp 以進(jìn)行 RGB 和 BGR之間的轉(zhuǎn)換。完成所有算子插入工作后，我們將刪除 preprocessOp，它就像一個(gè)占位符一樣，利用完后就該跟它說再見了。

但是預(yù)處理融合工作還沒有完成，這里我們還可以做一些優(yōu)化。

如果模型原本的第一個(gè)算子是Conv2d，那么其filter的輸入通道一定是3，對應(yīng)輸入圖像數(shù)據(jù)的3個(gè)顏色通道。

所以我們可以通過簡單地轉(zhuǎn)換filter的輸入通道來替換swapChannelOp。至此，預(yù)處理工作結(jié)束。

在INT8 量化模式下，情況就有點(diǎn)不同了，

首先，因?yàn)樗胁僮鞫际莍nt8類型，所以不會有CastOp被插入。

其次，因?yàn)槲覀兿雽nt8數(shù)據(jù)進(jìn)行歸一化操作，并且結(jié)果仍然是 int8，所以我們將插入 scalelutOp 而不是 scaleOp。

ScaleLutOp 就像我們在用查找表的方式進(jìn)行均勻量化，也就是說我們預(yù)先計(jì)算出所有 256 個(gè)可能的量化結(jié)果并保存在表中，然后我們可以在推理時(shí)直接從表中得到結(jié)果。
但是由于我們有 3 對mean和scale，所以我們必須創(chuàng)建3個(gè)表來對每個(gè)通道的元素分別進(jìn)行量化。

需要注意的一點(diǎn)是，當(dāng)所有均值為零時(shí)，我們假設(shè)它是unsigned int8量化，否則我們就做signed int8量化。

當(dāng)然，有時(shí)候我們會遇到所有scales_new都等于1，所有means都為0的情況。在這種情況下，ScalelutOp 實(shí)際上對輸入數(shù)據(jù)什么都不做，所以我們將跳過這個(gè)插入部分。

另外，在TPU-MLIR中我們也可能會使用mix precision模式，比如在int8量化模式下對原始的首個(gè)OP做浮點(diǎn)運(yùn)算或者在FP量化模式下對原始的首個(gè)OP做INT8運(yùn)算。

在前者中，將在 preprocessOp 和原始第一個(gè) op 之間插入一個(gè) CastOp，以將 INT8 數(shù)據(jù)轉(zhuǎn)換為FP，對于這種情況，fuse preprocess步驟將與 int8 量化模式下相同。

但是對于后者，我們可以看到兩個(gè)CastOp的作用其實(shí)相互抵消了，所以我們可以將它們刪除并再次像 int8量化模式一樣進(jìn)行fuse preprocess操作。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴