我的编程空间,编程开发者的网络收藏夹
学习永远不晚

关于 go 语言中符文、字符串和 unicode 字符的疑问

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

关于 go 语言中符文、字符串和 unicode 字符的疑问

学习知识要善于思考,思考,再思考!今天编程网小编就给大家带来《关于 go 语言中符文、字符串和 unicode 字符的疑问》,以下内容主要包含等知识点,如果你正在学习或准备学习Golang,就都不要错过本文啦~让我们一起来看看吧,能帮助到你就更好了!

问题内容

go中的string是不可变的byte的集合。 byteuint8 的别名。 runeint32 的别名,用于存储字符。

为什么 runes 使用 int32s,而不是 uin32s?不存在所谓的负面角色。

strings使用bytes,其中每个byte足以存储ascii字符,但不能存储unicode字符。然而,go 可以在字符串中存储 unicode 字符,但是索引一个字符会丢失它的数据。您无法在 go 中隐式将 float64 转换为 int ,因为它可能会丢失它,但是索引包含 unicode 字符的 string 的这种转换不会引发任何错误,只会丢失其数据。如何从 string 中索引 rune,而不是 byte

考虑以下程序及其输出。

package main

import (
    "fmt"
)

func main() {
    x := "ඞ"
    y := x[0]

    z := 'ඞ'

    fmt.printf("%s vs %c vs %c\n", x, y, z)
}
ඞ vs à vs ඞ

我觉得 string 用于存储 unicode 字符的做法是组合字节,因为也可以从 x 中索引 1。


正确答案


依次回答您的问题...

为什么 rune 是 int32 而不是 uint32?

我怀疑这可能与机器级别的整数本机表示有关,可能针对有符号整数与无符号整数进行了优化。

但最终这并不重要。

首先,unicode 代码点(至少目前)仅使用 0x0000 到 0x10ffff 范围。也就是说,在处理合法 unicode 时,您永远不会遇到负面符文。

如果有 int24 这样的东西,这就足够了。 unicode(代码点)未使用高 8 位(显然是符号位所在的位置)。

所以这可能是使用 int32 的原因,与“优化”无关。

但即使 unicode 规范扩展到完整的 32 位范围,这仍然不会出现问题。

无论有符号还是无符号,内部表示都是一致的。因此,例如,如果某些 go 代码要与其他代码交换符文,并且其他代码使用无符号类型,则不会有问题,因为从根本上来说,交换的是每个符文中的 32 位,而不是解释由任何特定类型覆盖在这 32 位上。

如果使用符文执行算术,符号可能很重要,但如果您这样做,我希望您会对符文以及如何安全地操作它们有深入的了解(大概是为了某种形式的密码学 - 我想不出进行符文算术的任何其他原因。

对字符串中的字节进行索引“丢失数据”

不,在字符串中索引一个字节(这只是一个 []byte为您提供您所要求的数据:第 1 个指定字节。

没有任何损失(或获得)。

如果您想要一个由字符串中的字节序列表示的符文,那么您需要询问表示该 rune所有字节。

在字符串中索引符文

首先将字符串 ([]byte) 转换为 []rune,然后像对任何其他切片一样进行索引。因此,给定一个字符串 s 并希望获得 ith 符文:

r := []rune(s)[i]

以上就是《关于 go 语言中符文、字符串和 unicode 字符的疑问》的详细内容,更多关于的资料请关注编程网公众号!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

关于 go 语言中符文、字符串和 unicode 字符的疑问

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

关于 go 语言中符文、字符串和 unicode 字符的疑问

学习知识要善于思考,思考,再思考!今天编程网小编就给大家带来《关于 go 语言中符文、字符串和 unicode 字符的疑问》,以下内容主要包含等知识点,如果你正在学习或准备学习Golang,就都不要错过本文啦~让我们一起来看看吧,能帮助到你
关于 go 语言中符文、字符串和 unicode 字符的疑问
2024-04-04

不同语言中字符串与Go语言字符串的差异

go语言字符串与其他语言字符串的主要差异:不可变:创建后不能修改。unicode编码:支持不同语言的文本。utf-8编码:可表示所有unicode字符。无null终止符:节省字节空间。Go语言字符串与其他语言字符串的差异字符串是程序设计中
不同语言中字符串与Go语言字符串的差异
2024-04-11

Go语言如何转换字符串中特定的字符

Go语言中,字符串不可变,但可通过多种技术转换特定字符。可使用strings.ReplaceAll函数替换字符,或strings.ToUpper/ToLower函数进行大小写转换。也可以使用字节数组或正则表达式进行更精细的控制。字符映射可将字符映射到新字符。性能注意事项:strings.ReplaceAll和正则表达式效率较高,但大量字符串转换时,字节数组或字符映射更有效。
Go语言如何转换字符串中特定的字符
2024-04-02

go语言删除字符串字符的方法介绍

今天小编给大家分享的是go语言删除字符串字符的方法介绍,相信很多人都不太了解,为了让大家更加了解,所以给大家总结了以下内容,一起往下看吧。一定会有所收获的哦。 删除字符串的方法:1、用TrimSpace()来去除字符串空格;2、用Tri
2023-07-04

不同语言中字符串操作与Go语言字符串操作的差异

go 语言字符串操作的特点:使用 utf-8 编码表示字符串用 + 运算符拼接字符串用 [] 操作符索引字符串用 [start:end] 语法切片字符串用 == 运算符比较字符串字符串操作 - Go 语言 vs. 其他语言序言处理字符串
不同语言中字符串操作与Go语言字符串操作的差异
2024-04-13

Go语言如何使用一个字符串替换字符串中的另一些字符

Go语言中替换字符串字符的方式有多种,包括:String.Replace函数:替换所有匹配项或指定数量的匹配项。Bytes.Replace函数:与String.Replace类似,但操作字节切片。正则表达式:查找和替换特定模式。字符串循环:逐个字符替换,适合简单替换。选择合适的方法取决于需求,如字符串复杂程度和替换需求。
Go语言如何使用一个字符串替换字符串中的另一些字符
2024-04-02

Go语言如何把字符串分割为更小的字符串

Go语言提供多种字符串分割方法。strings.Split函数按分隔符将字符串拆分为切片。strings.Fields函数按空格、制表符或换行符分割字符串。strings.SplitN函数限制拆分次数。regexp.Split函数使用正则表达式分割字符串。bufio.SplitString函数以字节为单位分割字符串。选择方法取决于具体需求,如按单个字符拆分、按正则表达式拆分或按特定分隔符拆分。
Go语言如何把字符串分割为更小的字符串
2024-04-02

Go语言技巧:快速统计字符串中字符频率

Go语言技巧:快速统计字符串中字符频率在Go语言中,统计字符串中字符出现的频率是一个常见的操作。通过使用map数据结构,我们可以快速、高效地实现这一功能。在本文中,我们将介绍如何使用Go语言编写代码来统计字符串中字符的频率,并附带具体的代
Go语言技巧:快速统计字符串中字符频率
2024-03-12

C语言解决字符串中插入和删除某段字符串问题

这篇文章主要介绍了C语言解决字符串中插入和删除某段字符串问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-02-06

C语言中字符函数和字符串函数介绍

本篇内容介绍了“C语言中字符函数和字符串函数介绍”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!目录前言求字符串长度strlen介绍strle
2023-06-20

go语言中字符串如何遍历

今天小编给大家分享一下go语言中字符串如何遍历的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。字符串遍历方法:1、使用“for
2023-07-05

Go语言如何把字符串中的首字符转换为大写

本文介绍了两种将Go语言字符串中首字符转换为大写的方法:方法1:strings.Title()函数将字符串中每个单词的首字符转换为大写。方法2:字符操作手动将第一个字符转换为大写,然后连接其他字符。了解字符串首字符大写时的一些注意事项,例如:ToUpper()和Title()不会更改原始字符串。Title()将标点符号视为单词分隔符。如果字符串为空,这两个函数返回空字符串。
Go语言如何把字符串中的首字符转换为大写
2024-04-02

Go语言如何随机地打乱字符串中的所有字符

Go语言中,有多种方法可随机打乱字符串中的字符,包括使用math/rand包提供的Shuffle函数、第三方库(如github.com/gophergala/randstrs)、sort包的Sort函数、bytes包的Shuffle函数。不同方法的性能因字符串长度和字符分布而异,一般情况下math/rand包的Shuffle函数最有效。打乱操作仅改变字符顺序,不会影响字符串长度或内容。对于Unicode辅助字符或非常长的字符串,需要特殊处理。
Go语言如何随机地打乱字符串中的所有字符
2024-04-02

Go语言中的字符串截取技巧

Go语言中的字符串截取技巧在Go语言中,字符串截取是一个常见的操作,可以通过一些技巧和函数来实现对字符串的截取和处理。本文将介绍一些常用的字符串截取技巧,并给出具体的代码示例。1. 使用切片进行字符串截取在Go语言中,可以使用切片来对
Go语言中的字符串截取技巧
2024-03-12

解密Go语言中字符串的奥秘

在IT行业这个发展更新速度很快的行业,只有不停止的学习,才不会被行业所淘汰。如果你是Golang学习者,那么本文《解密Go语言中字符串的奥秘》就很适合你!本篇内容主要包括##content_title##,希望对大家的知识积累有所帮助,助力
解密Go语言中字符串的奥秘
2024-04-05

Go语言如何从字符串的两端删除空白字符和其他预定义字符

Go语言提供了从字符串两端删除空白字符或其他预定义字符的功能。通过使用TrimSpace函数删除所有前导和尾随空白字符,或使用Trim函数指定要删除的字符列表,可以实现这一操作。对于更高级的字符删除,可以使用正则表达式。字符串两端的空白字符删除提供了丰富的功能和性能优化技巧,满足各种字符串处理需求。
Go语言如何从字符串的两端删除空白字符和其他预定义字符
2024-04-02

使用Go语言文档中的strings.TrimSpace函数去除字符串首尾空白字符

使用Go语言的strings.TrimSpace函数去除字符串首尾空白字符在Go语言中,字符串操作是一个常见的需求。其中一个常用的任务是去除字符串首尾的空白字符。Go语言提供了strings库,其中的TrimSpace函数正是用于完成这个任
使用Go语言文档中的strings.TrimSpace函数去除字符串首尾空白字符
2023-11-04

c语言怎么删除字符串中的指定字符

在C语言中,可以通过循环遍历字符串并判断字符是否是指定字符,然后将非指定字符复制到新的字符串中,从而删除字符串中的指定字符。以下是一个示例代码:```c#include #include void removeChar(char *str,
2023-08-16

c语言怎么读入字符串中的数字符号

使用 atoi() 函数可以将字符串中的数字转换为整数,具体步骤如下:包含 stdlib.h 头文件。使用 atoi() 函数,用法为:int num = atoi(str);其中 str 为包含数字的字符串。字符串必须包含有效的数字表示。
c语言怎么读入字符串中的数字符号
2024-05-14

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录