位置：首页-资讯-后端开发

BEVFormer转onnx，并优化

2023-08-31 16:43

短信预约 -IT技能 免费直播动态提醒

以下记录均是在bevformer_tiny版本上进行的实验，且不考虑时序输入

参考了https://github.com/DerryHub/BEVFormer_tensorrt，但是这个是为了部署在tensorRT上的，自己定义了一些特殊的算子，并不是我需要的，所以自己尝试重新转onnx。

一、配置环境

直接在bevformer官方推荐的环境上进行转onnx操作：https://github.com/fundamentalvision/BEVFormer/blob/master/docs/install.md

二、准备工作

在路径：mmdetection3d/BEVFormer/projects/mmdet3d_plugin/bevformer/apis/test.py中添加一个函数：

def custom_multi_gpu_test_onnx(model, data_loader,tmpdir=None, gpu_collect=False):    """Test model with multiple gpus.    This method tests model with multiple gpus and collects the results    under two different modes: gpu and cpu modes. By setting 'gpu_collect=True'    it encodes results to gpu tensors and use gpu communication for results    collection. On cpu mode it saves the results on different gpus to 'tmpdir'    and collects them by the rank 0 worker.    Args:        model (nn.Module): Model to be tested.        data_loader (nn.Dataloader): Pytorch data loader.        tmpdir (str): Path of directory to save the temporary results from            different gpus under cpu mode.        gpu_collect (bool): Option to use either gpu or cpu to collect results.    Returns:        list: The prediction results.    """    model.eval()    bbox_results = []    mask_results = []    dataset = data_loader.dataset    rank, world_size = get_dist_info()    if rank == 0:        prog_bar = mmcv.ProgressBar(len(dataset))    time.sleep(2)  # This line can prevent deadlock problem in some cases.    have_mask = False        repetitions = 100    for i, data in enumerate(data_loader):                with torch.no_grad():            inputs = {}            inputs['img'] = data['img'][0].data[0].float().unsqueeze(0) #torch.randn(6,3,736,1280)#.cuda()            #inputs['return_loss'] = False            inputs['img_metas'] = [1]            inputs['img_metas'][0] = [1]            inputs['img_metas'][0][0] = {}            inputs['img_metas'][0][0]['can_bus'] = torch.from_numpy(data['img_metas'][0].data[0][0]['can_bus']).float()#torch.randn(18)#.cuda()            inputs['img_metas'][0][0]['lidar2img'] = torch.from_numpy(np.array(data['img_metas'][0].data[0][0]['lidar2img'])).float().unsqueeze(0)#torch.randn(1,6,4,4)#.cuda()            inputs['img_metas'][0][0]['scene_token'] = 'fcbccedd61424f1b85dcbf8f897f9754'            inputs['img_metas'][0][0]['img_shape'] = torch.Tensor([[480,800]])             output_file = '/×××/BEVformer/mmdetection3d/BEVFormer/J5/bevformer_tiny.onnx'            torch.onnx.export(                model,                inputs,                output_file,                export_params=True,                keep_initializers_as_inputs=True,                do_constant_folding=False,                verbose=False,                opset_version=11,            )            print(f"ONNX file has been saved in {output_file}")            return {0:'1'}

然后使用mmdetection3d/BEVFormer/tools/test.py这个用来测试的脚本进行转onnx操作，把233行的custom_multi_gpu_test改成上面定义的函数custom_multi_gpu_test_onnx，我是在cpu上操作的，所以把上面分布式操作去掉了，如图所示

按照如下图修改配置信息，方便调试

三、开始排错

报错1：KeyError：‘RANK'

解决方法：点进dist_utils.py里面，修改内容，如下所示

def _init_dist_pytorch(backend, **kwargs):    # TODO: use local_rank instead of rank % num_gpus    os.environ['RANK'] = '0'    os.environ['MASTER_ADDR'] = 'localhost'    os.environ['MASTER_PORT'] = '5678'    rank = int(os.environ['RANK'])    num_gpus = torch.cuda.device_count()    torch.cuda.set_device(rank % num_gpus)    dist.init_process_group(backend=backend, world_size=int(1),**kwargs)

报错2：AttributeError: 'NoneType' object has no attribute 'size'

原因是bevformer的模型的forward输入比较特殊，不是单纯的字典或者列表，为了方便转onnx，进行一些改写，如下：

（1）将mmdetection3d/BEVFormer/projects/mmdet3d_plugin/bevformer/detectors/bevformer.py中143行的forward函数改成：

    def forward(self, input):  #return_loss=True,        """Calls either forward_train or forward_test depending on whether        return_loss=True.        Note this setting will change the expected inputs. When        `return_loss=True`, img and img_metas are single-nested (i.e.        torch.Tensor and list[dict]), and when `resturn_loss=False`, img and        img_metas should be double nested (i.e.  list[torch.Tensor],        list[list[dict]]), with the outer list indicating test time        augmentations.        """        #return_loss = input['return_loss']        #if return_loss:            #return self.forward_train(**kwargs)        #else:        #input['rescale']=True        # return_loss=False, rescale=True,         return self.forward_test(input['img_metas'], input['img'])

（2）forward_test函数定义去掉**kwargs, self.simple_test()函数输入也去掉**kwargs

报错3：ValueError: only one element tensors can be converted to Python scalars

原因 bevformer本来是以numpy形式输入'can_bus’参数的，但是转模型的时候应该所有变量都是tensor的形式，我们在初始化数据输入的时候是用torch.randn()生成输入，所以做如下修改：

将bevformer/modules/transformer.py的get_bev_feature函数改为：

def get_bev_features(            self,            mlvl_feats,            bev_queries,            bev_h,            bev_w,            grid_length=[0.512, 0.512],            bev_pos=None,            prev_bev=None,            **kwargs):        """        obtain bev features.        """        bs = mlvl_feats[0].size(0)        bev_queries = bev_queries.unsqueeze(1).repeat(1, bs, 1)        bev_pos = bev_pos.flatten(2).permute(2, 0, 1)        # obtain rotation angle and shift with ego motion        delta_x = np.array([each['can_bus'][0].cpu().numpy()                           for each in kwargs['img_metas']])        delta_x = torch.from_numpy(delta_x)        delta_y = np.array([each['can_bus'][1].cpu().numpy()                           for each in kwargs['img_metas']])        delta_y = torch.from_numpy(delta_y)        ego_angle = np.array(            [each['can_bus'][-2] / np.pi * 180 for each in kwargs['img_metas']])        ego_angle = torch.from_numpy(ego_angle.astype(np.float32))        grid_length_y = grid_length[0]        grid_length_x = grid_length[1]        translation_length = torch.sqrt(delta_x ** 2 + delta_y ** 2)        translation_angle = (            (                torch.atan(delta_y / (delta_x + 1e-8))                + ((1 - torch.sign(delta_x)) / 2) * torch.sign(delta_y) * np.pi            )            / np.pi            * 180        )        bev_angle = ego_angle - translation_angle        shift_y = translation_length * \            torch.cos(bev_angle / 180 * np.pi) / grid_length_y / bev_h        shift_x = translation_length * \            torch.sin(bev_angle / 180 * np.pi) / grid_length_x / bev_w        shift_y = shift_y * int(self.use_shift)        shift_x = shift_x * int(self.use_shift)        shift = torch.stack([shift_x, shift_y]).permute(1, 0)        #shift = 0        if prev_bev is not None:            if prev_bev.shape[1] == bev_h * bev_w:                prev_bev = prev_bev.permute(1, 0, 2)            if self.rotate_prev_bev:                for i in range(bs):                    # num_prev_bev = prev_bev.size(1)                    rotation_angle = kwargs['img_metas'][i]['can_bus'][-1]                    tmp_prev_bev = prev_bev[:, i].reshape(                        bev_h, bev_w, -1).permute(2, 0, 1)                    tmp_prev_bev = rotate(tmp_prev_bev, rotation_angle,              center=self.rotate_center)                    tmp_prev_bev = tmp_prev_bev.permute(1, 2, 0).reshape(                        bev_h * bev_w, 1, -1)                    prev_bev[:, i] = tmp_prev_bev[:, 0]        # add can bus signals        can_bus = bev_queries.new_tensor(            [each['can_bus'].cpu().numpy() for each in kwargs['img_metas']])  # [:, :]        can_bus = self.can_bus_mlp(can_bus)[None, :, :]        bev_queries = bev_queries + can_bus * int(self.use_can_bus)        feat_flatten = []        spatial_shapes = []        for lvl, feat in enumerate(mlvl_feats):            bs, num_cam, c, h, w = feat.shape            spatial_shape = (h, w)            feat = feat.flatten(3).permute(1, 0, 3, 2)            if self.use_cams_embeds:                feat = feat + self.cams_embeds[:, None, None, :].to(feat.dtype)            feat = feat + self.level_embeds[None,                None, lvl:lvl + 1, :].to(feat.dtype)            spatial_shapes.append(spatial_shape)            feat_flatten.append(feat)        feat_flatten = torch.cat(feat_flatten, 2)        spatial_shapes = torch.as_tensor(            spatial_shapes, dtype=torch.long, device=bev_pos.device)        level_start_index = torch.cat((spatial_shapes.new_zeros(            (1,)), spatial_shapes.prod(1).cumsum(0)[:-1]))        feat_flatten = feat_flatten.permute(            0, 2, 1, 3)  # (num_cam, H*W, bs, embed_dims)        bev_embed = self.encoder(            bev_queries,            feat_flatten,            feat_flatten,            bev_h=bev_h,            bev_w=bev_w,            bev_pos=bev_pos,            spatial_shapes=spatial_shapes,            level_start_index=level_start_index,            prev_bev=prev_bev,            shift=shift,            **kwargs        )        return bev_embed

报错4：ValueError: only one element tensors can be converted to Python scalars

在encoder.py的point_sampling函数里面也有这个问题，直接注释掉95~99行，改为

lidar2img = img_metas[0]['lidar2img']

报错5：KeyError: 'box_type_3d'

这里是bevformer模型输入比较特殊的地方，这个变量是一个类名，不是数据，大概的作用是对模型输出进行包装后处理的，我们在这里可以直接注释掉这一行

报错6：RuntimeError: Exporting the operator linspace to ONNX opset version 11 is not supported.

如果必须要用opset 11版本的torch.onnx转模型，这个地方会提示torch.linspace算子不支持，定位到算子在bevformer/modules/encoder.py的 BEVFormerEncoder.get_reference_points函数中

可以选择使用torch.range()和torch.arrange()算子进行替换，这里我用torch.arange()，替换如下：

    def get_reference_points(H, W, Z=8, num_points_in_pillar=4, dim='3d', bs=1, device='cuda', dtype=torch.float):        """Get the reference points used in SCA and TSA.        Args:            H, W: spatial shape of bev.            Z: hight of pillar.            D: sample D points uniformly from each pillar.            device (obj:`device`): The device where                reference_points should be.        Returns:            Tensor: reference points used in decoder, has \                shape (bs, num_keys, num_levels, 2).        """        # reference points in 3D space, used in spatial cross-attention (SCA)        if dim == '3d':            zs = torch.cat((torch.arange(0.5,Z-0.5,(Z-1)/(num_points_in_pillar-1)), torch.Tensor([Z-0.5])),dim=0).view(-1, 1, 1).expand(num_points_in_pillar, H, W) / Z            xs = torch.cat((torch.arange(0.5, W-0.5, (W-1)/(W-1)), torch.Tensor([W-0.5])),dim=0).view(1, 1, W).expand(num_points_in_pillar, H, W) / W            ys = torch.cat((torch.arange(0.5, H-0.5, (H-1)/(H-1)), torch.Tensor([H-0.5])),dim=0).view(1, H, 1).expand(num_points_in_pillar, H, W) / H            ref_3d = torch.stack((xs, ys, zs), -1)            ref_3d = ref_3d.permute(0, 3, 1, 2).flatten(2).permute(0, 2, 1)            ref_3d = ref_3d[None].repeat(bs, 1, 1, 1)            return ref_3d        # reference points on 2D bev plane, used in temporal self-attention (TSA).        elif dim == '2d':            ref_y, ref_x = torch.meshgrid(                torch.cat((torch.arange(0.5, H-0.5, (H-1)/(H-1)), torch.Tensor([H-0.5])),dim=0),                torch.cat((torch.arange(0.5, W-0.5, (W-1)/(W-1)), torch.Tensor([W-0.5])),dim=0)                    )            ref_y = ref_y.reshape(-1)[None] / H            ref_x = ref_x.reshape(-1)[None] / W            ref_2d = torch.stack((ref_x, ref_y), -1)            ref_2d = ref_2d.repeat(bs, 1, 1).unsqueeze(2)            return ref_2d

报错7：RuntimeError: Exporting the operator maximum to ONNX opset version 11 is not supported

提示maximum算子不支持，定位到算子位于evformer/modules/encoder.py的 BEVFormerEncoder.point_sampling函数中，直接将torch.maximum()改为torch.max()效果是一样的。

报错8：RuntimeError: Exporting the operator nan_to_num to ONNX opset version 11 is not supported.

就在报错7的位置的下面一点点，有一个bev_mask=torch.nan_to_num(bev_mask)，这个地方在转onnx的时候可以直接去掉。

报错9：RuntimeError: Exporting the operator grid_sampler to ONNX opset version 11 is not supported

很经典的报错，定位算子，从这个函数点进去：

from mmcv.ops.multi_scale_deform_attn import multi_scale_deformable_attn_pytorch

先导入需要的函数：

from mmcv.ops.point_sample import bilinear_grid_sample

然后再multi_scale_deformable_attn_pytorch中将

        sampling_value_l_ = F.grid_sample(            value_l_,            sampling_grid_l_,            mode='bilinear',            padding_mode='zeros',            align_corners=False)

替换为：

sampling_value_l_ = bilinear_grid_sample(value_l_,sampling_grid_l_)

效果是一样的

并且将这个函数中的最后一行的reshape改为view

报错10：RuntimeError: view size is not compatible with input tensor's size and stride (at least one dimension spans across two contiguous subspaces).

直接点进报错信息中的/mmcv/ops/point_sample.py中，找到x = x.view(n,-1)，改为：

    x = x.contiguous().view(n, -1)    y = y.contiguous().view(n, -1)

报错11：RuntimeError: Exporting the operator atan2 to ONNX opset version 11 is not supported.

atan2算子不支持，定位到算子位置在mmdetection3d/BEVFormer/projects/mmdet3d_plugin/core/bbox/util.py的31行，替换为：

    rot = (            (                torch.atan((rot_sine / (rot_cosine + 1e-8)).sigmoid())                + ((1 - torch.sign(rot_cosine)) / 2) * torch.sign(rot_sine) * np.pi            )    )

报错12：TypeError: _all() takes 2 positional arguments but 4 were given
(Occurred when translating all).

这个报错属于是torch版本比较低的缘故，但是由于bevformer的环境指定了torch==1.9.1所以不好直接更新torch版本，参考https://blog.csdn.net/andrewchen1985/article/details/125197226

从

from torch.onnx import symbolic_opset9

点进symbolic_opset9这个文件里面，定位到2440行，将def _any(g,input)和def _all(g, input)这；两个函数改为：

def _any(g, *args):    # aten::any(Tensor self)    if len(args) == 1:        input = args[0]        dim, keepdim = None, 0    # aten::any(Tensor self, int dim, bool keepdim)    else:        input, dim, keepdim = args        dim = [_parse_arg(dim, "i")]        keepdim = _parse_arg(keepdim, "i")    input = _cast_Long(g, input, False)  # type: ignore[name-defined]    input_sum = sym_help._reducesum_helper(g, input,               axes_i=dim, keepdims_i=keepdim)    return gt(g, input_sum, g.op("Constant", value_t=torch.LongTensor([0]))) def _all(g, *args):    input = g.op("Not", args[0])    # aten::all(Tensor self)    if len(args) == 1:        return g.op("Not", _any(g, input))    # aten::all(Tensor self, int dim, bool keepdim)    else:        return g.op("Not", _any(g, input, args[1], args[2]))————————————————版权声明：本文为CSDN博主「andrewchen1985」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/andrewchen1985/article/details/125197226

报错13：RuntimeError: Exporting the operator __iand_ to ONNX opset version 11 is not supported.

算子不支持，这个算子找了好久，定位到mmdetection3d/BEVFormer/projects/mmdet3d_plugin/core/bbox/coders/nms_free_coder.py的80行，意思是mask &= ......相与操作‘&’有问题，替换为：

mask = (mask.float()*((final_box_preds[..., :3] <= self.post_center_range[3:]).all(1)).float()).bool()

OK，到这里onnx初步转好了：

四、优化onnx

虽然转好了onnx，但是可以看到输出很多警告信息，实际上这个onnx可能还是有点问题的，我们先用onnx simplifier包优化一下：

import onnximport onnxsimonnx_path = '/×××/mmdetection3d/BEVFormer/ckpts/bevformer_tiny.onnx'model_onnx = onnx.load(onnx_path)  # load onnx modelonnx.checker.check_model(model_onnx)  # check onnx modelprint(onnx.helper.printable_graph(model_onnx.graph))  # printsim_onnx_path = '/×××/mmdetection3d/BEVFormer/ckpts/bevformer_tiny_sim.onnx'print(f'simplifying with onnx-simplifier {onnxsim.__version__}...')model_onnx, check = onnxsim.simplify(model_onnx, check_n=3,skip_shape_inference=True)assert check, 'assert check failed'onnx.save(model_onnx, sim_onnx_path)

报错1：onnxruntime.capi.onnxruntime_pybind11_state.InvalidGraph: [ONNXRuntimeError] : 10 : INVALID_GRAPH : This is an invalid model. Type Error: Type 'tensor(int64)' of input parameter (8733) of operator (Clip) in node (Clip_7993) is invalid.

定位这个问题的过程比较繁琐，从mmcv.cnn.bricks.transformer.MultiheadAttention的self.attn中进入nn.MultiheadAttention，从nn.MultiheadAttention的forward中进入F.multi_head_attention_forward()，再从F.multi_head_attention_forward()中的_in_projection_packed()点进去

简单来说点进functional中

import torch.nn.functional

搜索_in_projection_packed，在第4729行将;

w_q, w_k, w_v = w.chunk(3)

改为：

w_q, w_k, w_v = w.split(int(w.shape[0]/3))

在第4734行将

b_q, b_k, b_v = b.chunk(3)

改为：

b_q, b_k, b_v = b.split(int(b.shape[0]/3))

另外，在SpatialCrossAttention的forward中的有一行 count = torch.clamp(count, min=1.0)

改为

count[count<1]=1

在decoder.py中的inverse_sigmoid函数由于存在torch.clamp函数，所以需要改写为

def inverse_sigmoid(x, eps=1e-5):    """Inverse function of sigmoid.    Args:        x (Tensor): The tensor to do the            inverse.        eps (float): EPS avoid numerical            overflow. Defaults 1e-5.    Returns:        Tensor: The x has passed the inverse            function of sigmoid, has same            shape with input.    """    #x = x.clamp(min=0, max=1)    x[x<0] = 0    x[x>1] = 1    #x1 = x#.clamp(min=eps)    x1 = x.clone()    x1[x1

 另外，也要把这个函数放到bevformer_head中，用来替换从mmdet.models.utils.transformer中导入的inverse_sigmoid
 报错2：onnxruntime.capi.onnxruntime_pybind11_state.InvalidArgument: [ONNXRuntimeError] : 2 : INVALID_ARGUMENT : Non-zero status code returned while running Expand node. Name:'Expand_1855' Status Message: invalid expand shape
 
 关于expand算子的问题， 
 虽然还没搞清楚原因是啥，但是我知道咋改。定位到mmdetection3d/BEVFormer/projects/mmdet3d_plugin/bevformer/modules/spatial_cross_attention.py的SpatialCrossAttention的forward的forward里面，将
 queries_rebatch[j, i, :len(index_query_per_img)] = query[j, index_query_per_img]
 改为：
 queries_rebatch[j, i, :len(index_query_per_img)] = query[j, np.array(index_query_per_img)]
 下面一行的
 reference_points_rebatch[j, i, :len(index_query_per_img)] = reference_points_per_img[j, index_query_per_img]
 改为：
 reference_points_rebatch[j, i, :len(index_query_per_img)] = reference_points_per_img[j, np.array(index_query_per_img)]
 再在下面的
 slots[j, index_query_per_img] += queries[j, i, :len(index_query_per_img)]
 前面加一行
 index_query_per_img = np.array(index_query_per_img)
 
 报错3：Tensor 18362 changes after optimization. The max diff is 2.288818359375e-05.
 
  提示优化结果有偏差，初步定位了一下位置，发现在后处理部分，也就是bevformer.py的self.pts_bbox_head.get_bboxes，暂且把这个去掉，让def simple_test_pts(self, x, img_metas, prev_bev=None, rescale=False):只输出outs，如下所示
     def simple_test_pts(self, x, img_metas, prev_bev=None, rescale=False):        """Test function"""        outs = self.pts_bbox_head(x, img_metas, prev_bev=prev_bev)        return outs
 然后重新生成onnx，并且优化
 
  至此，bevformer_tiny的onnx转换和优化工作初步完成！！！ 
 排错不易，点赞加收藏哦！！！
 来源地址：https://blog.csdn.net/Lizongming_/article/details/130065380

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python开发语言深度学习transformer

阅读原文内容投诉

BEVFormer转onnx，并优化
下载Word文档到电脑，方便收藏和打印～

下载Word文档

`相关文章`

`猜你喜欢`

BEVFormer转onnx，并优化

2023-08-31

如何优化和加速ONNX模型的推理过程

2024-04-02

MySQL的优化 (转)

2024-04-02

MySQL 高并发配置优化

2024-04-02

Matlab数据转化至python端,并因工作原因，一些获取的行业数据以已知的结构体存储在.mat文件中,现需要将其存储在数据库中并且能够灵活调用至python dataframe里进行操作 原数据的一个例子如下目标如上:然后是转化代码:import scipy.iodata =

2023-01-31

MySQL中怎么优化高并发

2024-04-02

SQL级别并发控制优化SQL级别的并发控制优化主要是通过锁机制和事务管理来实现。以下是一些优化方法：使用合适的锁粒度：在进行并发控制时，需要选择合适的锁粒度。通常情况下，粗粒度锁会降低并发性能，而细粒度锁会增加锁冲突的可能性。在进行设计时需要根据实际情况选择适当

2024-08-12

Golang函数性能优化之并行化技术在高并发系统中，函数性能优化可通过并行化技术提升。go语言提供goroutine用于并发执行，并可借助并行化库sync/atomic实现并行化，显著提升执行效率，示例中使用该库将执行时间减少了一个数量级，使用时需注意数据竞争和过度并行化的问

2024-04-16

lvs+并发的优化方法教程

2024-04-02

PHP 函数的并行处理优化php 的并行处理功能通过 process 类实现，可优化耗时任务，如图像处理、数据分析和文件转换。它将任务分配给多个处理器，减少完成时间，提高应用程序性能。PHP 函数的并行处理优化简介并行处理是一种将任务分配给多个处理器的技术，从而

2024-05-05

css背景图优化合并技巧

2024-04-02

C++实现并优化异常系统异常处理是C++的一项语言机制,用于在程序中处理异常事件,下面这篇文章主要给大家介绍了关于C++中异常的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下

2022-11-13

css如何优化并提高性能小编给大家分享一下css如何优化并提高性能，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！方法：1、压缩css，减少文件体积；2、使用link引入css文件；3、合理设计CSS布局，注意复用样式，减少渲染上花的时间；4、少用

2023-06-14

golang函数的并发优化技术go 函数优化并发性的技术包括：1. goroutine 池：预分配和管理一组 goroutine，减少创建和销毁开销；2. 通道容量：限制同时可进入通道的 goroutine 数量，避免过度竞争；3. 中断处理：及时释放被阻塞的系统资源，

2024-04-29

CSS背景图如何优化合并

2024-04-02

java将图片转化为pdf并输出

2023-09-28

优化 MySQL 并发控制锁的性能MySQL 锁的并发控制与性能优化，需要具体代码示例摘要：在MySQL数据库中，锁的并发控制是非常重要的，它能够确保数据的一致性和完整性。本文将详细介绍MySQL中锁的种类和使用场景，以及如何优化锁的性能。同时，还会提供一些实际的代码示例，

2023-12-21

PHP并发编程与高性能优化php 可并发编程以提升性能，可选用多线程（同时执行多个线程）、多进程（同时启动多个进程）或异步 i/o（非阻塞 i/o 操作）。此外，还可采取优化技巧，例如缓存、数据库优化、使用专门框架和代码分析工具来提升性能。PHP 并发编程与高性能优

2024-05-15

Java通过Fork/Join优化并行计算本文实例为大家分享了Java通过Fork/Join优化并行计算的具体代码，供大家参考，具体内容如下Java代码：package Threads;import java.util.concurrent.ForkJoinPool;import

2023-05-31

高并发下Nginx性能怎么优化本篇内容介绍了“高并发下Nginx性能怎么优化”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！Nginx同Apache一样都是一种WEB服务器

2023-06-25

`编程热搜`

Python 学习之路 - Python
一、安装Python34Windows在Python官网（https://www.python.org/downloads/）下载安装包并安装。Python的默认安装路径是：C:\Python34配置环境变量：【右键计算机】--》【属性】-
chatgpt的中文全称是什么
chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成一系列
C/C++中extern函数使用详解
C/C++可变参数的使用
可变参数的使用方法远远不止以下几种，不过在C,C++中使用可变参数时要小心，在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少，否则会产生访问越界，运气不好的话还会导致程序崩溃
css样式文件该放在哪里
php中数组下标必须是连续的吗
Python 3 教程
Python 3 教程 Python 的 3.0 版本，常被称为 Python 3000，或简称 Py3k。相对于 Python 的早期版本，这是一个较大的升级。为了不带入过多的累赘，Python 3.0 在设计的时候没有考虑向下兼容。 Python
Python pip包管理
一、前言在Python中，安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具： easy_install 和 pip ，目前官方推荐使用 pip。
ubuntu如何重新编译内核
改善Java代码之慎用java动态编译

查看更多

`编程资源站`

资料下载
历年试题

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

查看更多

BEVFormer转onnx，并优化

一、配置环境

二、准备工作

三、开始排错

报错1：KeyError：‘RANK'

报错2：AttributeError: 'NoneType' object has no attribute 'size'

报错3：ValueError: only one element tensors can be converted to Python scalars

报错4：ValueError: only one element tensors can be converted to Python scalars

报错5：KeyError: 'box_type_3d'

报错6：RuntimeError: Exporting the operator linspace to ONNX opset version 11 is not supported.

报错7：RuntimeError: Exporting the operator maximum to ONNX opset version 11 is not supported

报错8：RuntimeError: Exporting the operator nan_to_num to ONNX opset version 11 is not supported.

报错9：RuntimeError: Exporting the operator grid_sampler to ONNX opset version 11 is not supported

报错10：RuntimeError: view size is not compatible with input tensor's size and stride (at least one dimension spans across two contiguous subspaces).

报错11：RuntimeError: Exporting the operator atan2 to ONNX opset version 11 is not supported.

报错12：TypeError: _all() takes 2 positional arguments but 4 were given (Occurred when translating all).

报错13：RuntimeError: Exporting the operator __iand_ to ONNX opset version 11 is not supported.

四、优化onnx

报错1：onnxruntime.capi.onnxruntime_pybind11_state.InvalidGraph: [ONNXRuntimeError] : 10 : INVALID_GRAPH : This is an invalid model. Type Error: Type 'tensor(int64)' of input parameter (8733) of operator (Clip) in node (Clip_7993) is invalid.

报错2：onnxruntime.capi.onnxruntime_pybind11_state.InvalidArgument: [ONNXRuntimeError] : 2 : INVALID_ARGUMENT : Non-zero status code returned while running Expand node. Name:'Expand_1855' Status Message: invalid expand shape

报错3：Tensor 18362 changes after optimization. The max diff is 2.288818359375e-05.

BEVFormer转onnx，并优化

相关文章

猜你喜欢

BEVFormer转onnx，并优化

如何优化和加速ONNX模型的推理过程

MySQL的优化 (转)

MySQL 高并发配置优化

Matlab数据转化至python端,并

MySQL中怎么优化高并发

SQL级别并发控制优化

Golang函数性能优化之并行化技术

lvs+并发的优化方法教程

PHP 函数的并行处理优化

css背景图优化合并技巧

C++实现并优化异常系统

css如何优化并提高性能

golang函数的并发优化技术

CSS背景图如何优化合并

java将图片转化为pdf并输出

优化 MySQL 并发控制锁的性能

PHP并发编程与高性能优化

Java通过Fork/Join优化并行计算

高并发下Nginx性能怎么优化

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复

报错12：TypeError: _all() takes 2 positional arguments but 4 were given
(Occurred when translating all).

`相关文章`

`猜你喜欢`

`热门标签`

`编程热搜`

`编程资源站`

`目录`

`感谢您的提交，我们服务专员将在30分钟内给您回复`