我的编程空间,编程开发者的网络收藏夹
学习永远不晚

论文阅读---REALISE model

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

论文阅读---REALISE model

REALISE model:

utilizes multiple encoders to obtain the semantic ,phonetic , and graphic information to distinguish the similarities of Chinese characters and correct the spelling errors.
2.And then, develop a selective modality fusion module to obtain the context-aware multimodal representations.
3.Finally ,the output layer predict the probabilities of error corrections.

Encoders:

Semantic encoder:

BERT, which provides rich contextual word representation with the unsupervised pretraining on large corpora.

from transformers import BertTokenizertokenizer = BertTokenizer.from_pretrained('bert-base-chinese')

Tokenizer是一种文本处理工具,用于将文本分解成单个单词(称为tokens)或其他类型的单位,例如标点符号和数字。在自然语言处理领域,tokenizer通常用于将句子分解为单个单词或词元,以便进行文本分析和机器学习任务。常用的tokenizer包括基于规则的tokenizer和基于机器学习的tokenizer,其中基于机器学习的tokenizer可以自动识别单词和短语的边界,并将其分解为单个tokens。

Phonetic encoder

pinyin: initial(21)+final(39)+tone(5)
hierarchical phonetic encoder :character-level encoder and sentence-level encoder

Character-level encoder

GRU:
GRU(Gate Recurrent Unit)是循环神经网络(Recurrent Neural Network, RNN)的一种。和LSTM(Long-Short Term Memory)一样,也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。

GRU和LSTM在很多情况下实际表现上相差无几,那么为什么我们要使用新人GRU(2014年提出)而不是相对经受了更多考验的LSTM(1997提出)呢。
我们在我们的实验中选择GRU是因为它的实验效果与LSTM相似,但是更易于计算。

Sentence-level Encoder: obtain the contextualized phonetic representation for each Chinese characters

4-layer Transformer with the same hidden size as the semantic encoder
because independent phonetic vectors are not distinguished in order, so we add the positional embeading to each vector. +pack the vector together ->transformer layers to calculate the contextualized representation in acoustic modality.

Graphic Encoder

ResNet
three fonds correpond to the three channels of the character images whose size is set to 32*32 pixel

Selective Modality Fusion Module

Ht, Ha,Hv ==textual ,acoustic,visual
fuse information i n different modalities
selective gate unit: select how much information flow to the mixed multimodal representation.
gate values :fully-connected layer followed by a sigmoid function.

Acoustic and Visual Pretraining

aims to learn the acoustic-textual and visual-textual relationships
phonetic encoder:input method pretraining objective
graphhic encoder:OCP pretraining objective

Data and Metrics

data:SIGHAN —>convert to simplified chinese by using the OPENCC tools

two level :detection and correction level to test the model

来源地址:https://blog.csdn.net/qq_48566899/article/details/132560529

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

论文阅读---REALISE model

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

论文阅读---REALISE model

REALISE model: 1.utilizes multiple encoders to obtain the semantic ,phonetic , and graphic information to distinguish th
2023-08-30

论文阅读:Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

前言 要弄清MAML怎么做,为什么这么做,就要看懂这两张图。先说MAML**在做什么?**它是打着Mate-Learing的旗号干的是few-shot multi-task Learning的事情。具体而言就是想训练一个模型能够使用很少的新
2023-08-30

论文阅读_模型结构_LoRA

name_en: LoRA: Low-Rank Adaptation of Large Language Models name_ch: LORA:大语言模型的低阶自适应 paper_addr: http://arxiv.org/abs/2
2023-08-30

论文阅读_图形图像_U-NET

name_en: U-Net: Convolutional Networks for Biomedical Image Segmentation name_ch: U-Net:用于生物医学图像分割的卷积网络 addr: http://lin
2023-08-30

【论文阅读笔记】Endoscopic navigation in the absence of CT imaging

论文小结   上一篇的导航导论,是需要先验,也就是需要事先拍摄堆叠的图片(比如CT图等),在体外构建相应的3D模型,再与内窥镜图像进行实时匹配。对于很多情况来说,是无法拥有如此充足的先验的。所以,本文探索的是没有额外CT图像的一个内窥镜导航
2023-08-30

[论文阅读笔记25]A Comprehensive Survey on Graph Neural Networks

这是一篇GNN的综述, 发表于2021年的TNNLS. 这篇博客旨在对GNN的基本概念做一些记录. 论文地址: 论文 1. 引言, 背景与定义 对于图像数据来说, CNN具有平移不变性和局部连接性, 因此可以在欧氏空间上良好地学习. 然
2023-08-30

论文阅读 FOCUS-AND-DETECT: A SMALL OBJECT DETECTION FRAMEWORK FOR AERIAL IMAGES

文章目录 FOCUS-AND-DETECT: A SMALL OBJECT DETECTION FRAMEWORK FOR AERIAL IMAGESABSTRACT1 Introduction2 Related Work3 Foc
2023-08-30

Discuz论坛权限管理:阅读权限设置指南

Discuz论坛权限管理:阅读权限设置指南在Discuz论坛管理中,权限设置是至关重要的一环。其中,阅读权限的设置尤为重要,它决定了不同用户在论坛中能够看到的内容范围。本文将详细介绍Discuz论坛的阅读权限设置,以及如何针对不同的需求进
Discuz论坛权限管理:阅读权限设置指南
2024-03-10

次次挂在论文上?软考论文阅卷,真的有点"玄学"!

软考论文详细的评分标准没有公布过,阅卷的主观性比较强,而且申请成绩复查也只会查是否有漏评、计分或登分错误,不会涉及阅卷员对评分标准及尺度的把控。
次次挂在论文上?软考论文阅卷,真的有点"玄学"!
2024-10-31

win10系统怎么安装CAJviewer文献阅读器?

CAJviewer是到底是个什么梗?它是一款功能齐全的文献阅读器,相信很多接触过论文www.cppcns.com写作的人士都耳熟能详吧,那php么我们怎么去下载和安装它呐,下面就跟着小编来操作吧!方法/步骤 点击下载,稍等片刻,等待下载完毕
2023-05-20

wordpress怎么不用插件实现文章阅读数

这篇文章主要介绍了wordpress怎么不用插件实现文章阅读数,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。wordpress不用插件实现文章阅读数一、想法一开始想到应该有什
2023-06-14

dedecms5.7文章二次开发实现阅读全文功能的方法

本文实例讲述了dedecms5.7文章二次开发实现阅读全文功能的方法。分享给大家供大家参考。具体分析如下: 阅读全文功能其实在很多的流行站点都有的,比如网易,新浪等,随着文章内容的增加,当一个页面有多个分页的时候,就会显示出这个&ldquo
2022-06-12

Python实现统计文章阅读量的方法详解

这篇文章主要为大家详细介绍了如何溧阳Python语言实现统计文章阅读量的功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
2023-02-14

如何使用FileReader创建Vue文件阅读器组件

这篇文章主要介绍“如何使用FileReader创建Vue文件阅读器组件”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“如何使用FileReader创建Vue文件阅读器组件”文章能帮助大家解决问题。Fi
2023-07-04

怎么用vbscript实现从后到前阅读一个文本文件

本篇内容主要讲解“怎么用vbscript实现从后到前阅读一个文本文件”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用vbscript实现从后到前阅读一个文本文件”吧!具体的实现代码如下所示:
2023-06-08

一文读懂 Java Memory Model:解锁并发编程中的疑惑

Java Memory Model (JMM) 是理解并发编程中内存一致性的关键。它定义了多线程程序中共享变量的可见性、有序性等规则,掌握 JMM 有助于解决并发编程中的疑惑,编写更健壮的代码。
一文读懂 Java Memory Model:解锁并发编程中的疑惑
2024-02-04

编程热搜

目录