我的编程空间,编程开发者的网络收藏夹
学习永远不晚

node如何实现ocr

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

node如何实现ocr

本文小编为大家详细介绍“node如何实现ocr”,内容详细,步骤清晰,细节处理妥当,希望这篇“node如何实现ocr”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

效果展示

node如何实现ocr

详细代码

tesserract.js 这个库提供了多个版本供选择,我这里使用的是离线的版本tesseract.js-offline,毕竟谁都由网络不好的时候。
node如何实现ocr
默认示例代码

const { createWorker } = require('tesseract.js');const path = require('path');const worker = createWorker({  langPath: path.join(__dirname, '..', 'lang-data'),   logger: m => console.log(m),});(async () => {  await worker.load();  await worker.loadLanguage('eng');  await worker.initialize('eng');  const { data: { text } } = await worker.recognize(path.join(__dirname, '..', 'images', 'testocr.png'));  console.log(text);  await worker.terminate();})();

1. 支持多语言识别

tesseract.js 离线版本默认示例代码只支持识别英文,如果识别中文,结果会是一堆问号。但是幸运的是你可以导入多个训练好的语言模型,让它支持多个语言的识别。

  • 从https://github.com/naptha/tessdata/tree/gh-pages/4.0.0这里下载你需要的对应语言模型,放入到根目录下的lang-data目录下
    我这里选择了中(chi_sim.traineddata.gz)日(jpn.traineddata.gz)英(eng.traineddata.gz)三国语言模型。

  • 修改代码中加载和初始化模型的语言项配置,来同时支持中日英三国语言。

await worker.loadLanguage('chi_sim+jpn+eng');await worker.initialize('chi_sim+jpn+eng');

2. 提高识别性能

如果你运行了离线的版本,你会发现模型的加载和ocr的识别有点慢。可以通过这两个步骤优化。

  • web项目中,你可以在应用一启动的时候就加载模型,这样后续接收到ocr请求的时候就可以不用等待模型加载了。

  • 参照Why I refactor tesseract.js v2?这篇博客,可以通过createScheduler方法添加多个worker线程来并发的处理ocr请求。

多线程并发处理ocr请求示例

const Koa = require('koa')const Router = require('koa-router')const router = new Router()const app = new Koa()const path = require('path')const moment = require('moment')const { createWorker, createScheduler } = require('tesseract.js');(async () => {  const scheduler = createScheduler()  for (let i = 0; i < 4; i++) {    const worker = createWorker({      langPath: path.join(__dirname, '.', 'lang-data'),      cachePath: path.join(__dirname, '.'),      logger: m => console.log(`${moment().format('YYYY-MM-DD HH:mm:ss')}-${JSON.stringify(m)}`)    })    await worker.load()    await worker.loadLanguage('chi_sim+jpn+eng')    await worker.initialize('chi_sim+jpn+eng')    scheduler.addWorker(worker)  }  app.context.scheduler = scheduler})()router.get('/test', async (ctx) => {  const { data: { text } } = await ctx.scheduler.addJob('recognize', path.join(__dirname, '.', 'images', 'chinese.png'))  // await ctx.scheduler.terminate()  ctx.body = text})app.use(router.routes(), router.allowedMethods())app.listen(3002)

发起并发请求,可以看到多个worker再并发执行ocr任务

ab -n 4 -c 4 localhost:3002/test

node如何实现ocr

3.前端代码

效果展示中的前端代码主要是用了elementui组件和vue-cropper这个组件实现。

vue-cropper组件具体的使用可以参考我的这篇博客vue图片裁剪:使用vue-cropper做图片裁剪

ps: 上传图片的时候可以先在前端加载上传图片的base64,先看到上传的图片,再请求后端上传图片 ,对用户的体验比较好

完整代码如下

<template>  <div>    <div style="margin-top:30px;height:500px">      <div class="show">        <vueCropper          v-if="imgBase64"          ref="cropper"          :img="imgBase64"          :output-size="option.size"          :output-type="option.outputType"          :info="true"          :full="option.full"          :can-move="option.canMove"          :can-move-box="option.canMoveBox"          :original="option.original"          :auto-crop="option.autoCrop"          :fixed="option.fixed"          :fixed-number="option.fixedNumber"          :center-box="option.centerBox"          :info-true="option.infoTrue"          :fixed-box="option.fixedBox"          :max-img-size="option.maxImgSize"          style="background-image:none"          @mouseenter.native="enter"          @mouseleave.native="leave"        ></vueCropper>        <el-upload          v-else          ref="uploader"          class="avatar-uploader"          drag          multiple          action=""          :show-file-list="false"          :limit="1"          :http-request="upload"        >          <i class="el-icon-plus avatar-uploader-icon"></i>        </el-upload>      </div>      <div        class="ocr"        @mouseleave="leaveCard"      >        <el-card          v-for="(item,index) in ocrResult"          :key="index"          class="card-box"          @mouseenter.native="enterCard(item)"        >          <el-form            size="small"            label-width="100px"            label-position="left"          >            <el-form-item label="识别结果">              <el-input v-model="item.text"></el-input>            </el-form-item>          </el-form>        </el-card>      </div>    </div>    <div style="margin-top:10px">      <el-button        size="small"        type="primary"        style="width:60%"        @click="doOcr"      >        文字识别(OCR)      </el-button>    </div>  </div></template><script>import { uploadImage, ocr } from '../utils/api'export default {  name: 'Ocr',  data () {    return {      imgclass="lazy" data-src: '',      imgBase64: '',      option: {        info: true, // 裁剪框的大小信息        outputSize: 0.8, // 裁剪生成图片的质量        outputType: 'jpeg', // 裁剪生成图片的格式        canScale: false, // 图片是否允许滚轮缩放        autoCrop: true, // 是否默认生成截图框        fixedBox: false, // 固定截图框大小 不允许改变        fixed: false, // 是否开启截图框宽高固定比例        fixedNumber: [7, 5], // 截图框的宽高比例        full: true, // 是否输出原图比例的截图        canMove: false, // 时候可以移动原图        canMoveBox: true, // 截图框能否拖动        original: false, // 上传图片按照原始比例渲染        centerBox: true, // 截图框是否被限制在图片里面        infoTrue: true, // true 为展示真实输出图片宽高 false 展示看到的截图框宽高        maxImgSize: 10000      },      ocrResult: []    }  },  methods: {    upload (fileObj) {      const file = fileObj.file      const reader = new FileReader()      reader.readAsDataURL(file)      reader.onload = () => {        this.imgBase64 = reader.result      }      const formData = new FormData()      formData.append('image', file)      uploadImage(formData).then(res => {        this.imgUrl = res.imgUrl      })    },    doOcr () {      const cropAxis = this.$refs.cropper.getCropAxis()      const imgAxis = this.$refs.cropper.getImgAxis()      const cropWidth = this.$refs.cropper.cropW      const cropHeight = this.$refs.cropper.cropH      const position = [        (cropAxis.x1 - imgAxis.x1) / this.$refs.cropper.scale,        (cropAxis.y1 - imgAxis.y1) / this.$refs.cropper.scale,        cropWidth / this.$refs.cropper.scale,        cropHeight / this.$refs.cropper.scale      ]      const rectangle = {        top: position[1],        left: position[0],        width: position[2],        height: position[3]      }      if (this.imgUrl) {        ocr({ imgUrl: this.imgUrl, rectangle }).then(res => {          this.ocrResult.push(            {              text: res.text,              cropInfo: { //截图框显示的大小                width: cropWidth,                height: cropHeight,                left: cropAxis.x1,                top: cropAxis.y1              },              realInfo: rectangle //截图框在图片上真正的大小            })        })      }    },    enterCard (item) {      this.$refs.cropper.goAutoCrop()// 重新生成自动裁剪框      this.$nextTick(() => {        // if cropped and has position message, update crop box        // 设置自动裁剪框的宽高和位置        this.$refs.cropper.cropOffsertX = item.cropInfo.left        this.$refs.cropper.cropOffsertY = item.cropInfo.top        this.$refs.cropper.cropW = item.cropInfo.width        this.$refs.cropper.cropH = item.cropInfo.height      })    },    leaveCard () {      this.$refs.cropper.clearCrop()    },    enter () {      if (this.imgBase64 === '') {        return      }      this.$refs.cropper.startCrop() // 开始裁剪    },    leave () {      this.$refs.cropper.stopCrop()// 停止裁剪    }  }}</script>

读到这里,这篇“node如何实现ocr”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注编程网行业资讯频道。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

node如何实现ocr

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

node如何实现ocr

本文小编为大家详细介绍“node如何实现ocr”,内容详细,步骤清晰,细节处理妥当,希望这篇“node如何实现ocr”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。效果展示详细代码tesserract.js 这个库
2023-07-04

浅析node怎么实现ocr

怎么实现ocr(光学字符识别)?下面本篇文章给大家介绍一下使用node实现实现实现ocr的方法,希望对大家有所帮助!
2022-11-22

如何实现Opencv图片的OCR识别

小编给大家分享一下如何实现Opencv图片的OCR识别,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一、图片变换0、导入模块导入相关函数,遇到报错的话,直接pip
2023-06-06

php如何实现身份证OCR识别

这篇“php如何实现身份证OCR识别”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“php如何实现身份证OCR识别”文章吧。实
2023-07-04

用node如何实现缓存

本文小编为大家详细介绍“用node如何实现缓存”,内容详细,步骤清晰,细节处理妥当,希望这篇“用node如何实现缓存”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。缓存原理浏览器缓存的基本原理是将静态资源(如 CS
2023-07-05

Clean Architecture如何用Node实现

今天小编给大家分享一下Clean Architecture如何用Node实现的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。C
2023-07-05

node如何实现图片上传

这篇文章主要介绍node如何实现图片上传,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!在web开发中,文件上传是一个很重要的问题,尤其是图片上传,以及由此延伸的“进度条”、“文件大小”、以及著名的“跨域”等问题。本d
2023-06-06

node中如何实现RPC通信

本篇内容主要讲解“node中如何实现RPC通信”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“node中如何实现RPC通信”吧!什么是RPC?RPC:Remote Procedure Call(远
2023-07-04

node如何实现定时任务

这篇文章主要介绍“node如何实现定时任务”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“node如何实现定时任务”文章能帮助大家解决问题。node实现定时任务的方法:1、利用setTimeOut和e
2023-07-04

node如何实现语音聊天

本篇内容主要讲解“node如何实现语音聊天”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“node如何实现语音聊天”吧!node实现语音聊天的方法:1、使用nodejs模块express创建一个w
2023-07-05

Node如何实现JWT鉴权机制

这篇文章主要介绍“Node如何实现JWT鉴权机制”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Node如何实现JWT鉴权机制”文章能帮助大家解决问题。一、为什么使用JWT一种技术的出现,就是弥补另一
2023-07-04

如何用Python实现图像文字识别OCR工具

这篇文章主要介绍“如何用Python实现图像文字识别OCR工具”,在日常操作中,相信很多人在如何用Python实现图像文字识别OCR工具问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何用Python实现图像
2023-06-22

Node的多进程服务如何实现

这篇文章主要介绍“Node的多进程服务如何实现”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Node的多进程服务如何实现”文章能帮助大家解决问题。我们现在已经知道了Node是单线程运行的,这表示潜在
2023-07-01

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录