使用 onnx 使得 embedding 生成速度提高 4 倍（和原生 sentence transformer 模型对比）

article2024/5/4 3:04:32/文章来源:https://blog.csdn.net/quoniammm/article/details/138009948

记录下使用 onnx 提高向量生成速度的过程。复现放在：amulil/vector_by_onnxmodel: accelerate generating vector by using onnx model (github.com)。

结果

OnnxModel Runtime gpu Inference time = 4.52 ms
Sentence Transformer gpu Inference time = 22.19 ms

参考

GitHub - yuanzhoulvpi2017/quick_sentence_transformers: sentence-transformers to onnx 让sbert模型推理效率更快

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mfbz.cn/a/560336.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

4.4 @ControllerAdvice全局数据处理

4.4 ControllerAdvice全局数据处理 1. 全局异常处理 ＠ExceptionHandler2. 添加全局数据 ModelAttribute3. 请求参数预处理 InitBinder 顾名思义，＠ControllerAdvice 就是＠Controller 增强版。＠ControllerAdvice 主要用来…

【LAMMPS学习】八、基础知识(3.8)计算扩散系数

8. 基础知识此部分描述了如何使用 LAMMPS 为用户和开发人员执行各种任务。术语表页面还列出了 MD 术语，以及相应 LAMMPS 手册页的链接。 LAMMPS 源代码分发的 examples 目录中包含的示例输入脚本以及示例脚本页面上突出显示的示例输入脚本还展示了如何设置和运行各…

esp32-通过wifi使用timelib库同步时间（三）

库的安装本文基于platformIO，安装较为简单如下图实例代码完整代码如下，如果时间获取超时请使用time1.aliyun.com获取时间。 /** Time_NTP.pde* Example showing time sync to NTP time source** This sketch uses the Ethernet library*/#include …

通过实例学C#之序列化与反序列化XmlSerializer类

简介可以将类序列化成xml文件，或者将xml文件反序列化成类对象，一般用于保存或加载项目参数。构造函数 XmlSerializer() 不使用函数创建一个xmlSerializer对象。 XmlSerializer(Type type) 使用type对象创建一个xmlSerializer对象，注意&…

Abaqus 中脚本运行 1. 命令区kernel Command Line Interface （KCLI） execfile(C:\\temp\second develop\chapter2\pyTest1.py)2. CAE-Run Script File->Run Script 3. Abaqus command Abaqus cae noGUIscript.py(前后处理都可)Abaqus Python scr…

牛x之路 - Day1

Day1 微积分之屠龙宝刀（武林秘籍） 之前的一些东西都在pdf上记得笔记， 没有在这个上面展示一遍，只好学到相关内容的时候再提叙啦；所以其实再写这个小记的时候，我已经看了一半的书，但是不要紧&am…

【结构型模式】组合模式

一、组合模式概述组合模式的定义与意图：将对象组合成树形结构来表现“整体/部分”层次结构。组合能让客户以一致的方式处理个别对象以及对象组合。（对象结构型） 组合模式分析： 1.当容器对象的某一个方法被调用时，将遍…

OpenHarmony网络协议通信—kcp

kcp 是一种 ARQ 协议,可解决在网络拥堵情况下 tcp 协议的网络速度慢的问题下载安装直接在 OpenHarmony-SIG 仓中搜索 kcp 并下载。使用说明准备一套完整的 OpenHarmony 3.1 Beta 代码库代码存放路径：./third_party/kcp 修改添加依赖的编译脚本在/develo…

书生·浦语实战营第二期（六）——Agent

一、概述： 1.1、Lagent: Lagent 是一个轻量级开源智能体框架，旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。 Lagent 目前已经支持了包括 AutoGPT、ReAct 等在内的多个经典智能体范式&#xf…

jeecgflow之camunda工作流-串行流程

引言 UserTask用户任务,是需要人处理后才能流转的任务。本文将构建一个简单的串行流程带大家快速入门camunda工作流。 BPMN在线建模如需亲自体验文章案例，请访问如下网址。 JeecgFlow演示站点需求我们以三国为背景， 假设系统中拥有将军&#xff0c…

ardunio中自定义的库文件

1、Arduino的扩展库都是放在 libraries目录下的。完整路径为：C:\Users\41861\AppData\Local\Arduino15\libraries 所以我们需要在这个目录下创建一个文件夹，比如上面的例子是esp32上led灯控制程序，于是我创建了 m_led文件夹（前面加…

根据 Excel 列生成 SQL

公司有个历史数据刷数据的需求, 开发功能有点浪费, 手工刷数据有点慢, 所以研究了下 excel 直接生成 SQL, 挺好用, 记录一下; 例如这是我们的数据, 要求把创建时间和完成时间刷进数据库中, 工单编号唯一 Excel 公式如下: "UPDATE service_order SET create…

浅析Redis④：字典dict实现

什么是dict？ 在 Redis 中，dict 是指哈希表（hash table）的一种实现，用于存储键值对数据。dict 是 Redis 中非常常用的数据结构之一，用于实现 Redis 的键空间。在 Redis 源码中，dict 是一个通用…

linux中如何挂载yum云仓库进行软件的安装

1.首先在根目录下建立文件，用来挂载镜像文件 [rootclient ~]# mkdir /rhel9 2.挂载镜像文件： [rootclient ~]# mount /dev/cdrom /rhel9 3.切换到 /etc/yum.repos.d 下的目录并查看 ，创建 rhel9.repo文件，并编辑云仓库域名&am…

【LLM 论文】Self-Consistency — 一种在 LLM 中提升 CoT 表现的解码策略

论文：Self-Consistency Improves Chain of Thought Reasoning in Language Models ⭐⭐⭐⭐⭐ ICLR 2023, Google Research 文章目录论文速读论文速读本工作提出了一种解码策略：self-consistency，并可以用于 CoT prompting 中。该策略提…

Linux使用Libevent库实现一个网页服务器---C语言程序

Web服务器这一个库的实现其他的知识都是这一个专栏里面的文章实际使用编译的时候需要有一个libevent库 gcc httpserv.c -o httpserv -levent实际使用的时候需要指定端口以及共享的目录 ./httpserv 80 .这一个函数会吧这一个文件夹下面的所有文件共享出去实际的效果, 这…

NLP_知识图谱_三元组实战

文章目录三元组含义如何构建知识图谱模型的整体结构基于transformers框架的三元组抽取baselinehow to use预训练模型下载地址训练数据下载地址结构图代码及数据bertconfig.jsonvocab.txt datadev.jsonschemas.jsontrain.jsonvocab.json 与bert跟data同个目录model.pytrain.py…