去检查文件是否是文本文件
短信预约 -IT技能 免费直播动态提醒
本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《去检查文件是否是文本文件》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~
问题内容如何检查文件是否是文本文件,而不是图像、视频或其他文本文件?
我已经尝试过检查文件中包含的 a-Z 0-9 和特殊字符
解决方案
一种方法是检查文件的所有内容是否都是有效的 utf-8
import (
"fmt"
"os"
"unicode/utf8"
)
func main() {
b, _ := os.readfile(os.args[1])
fmt.println(utf8.validstring(string(b)))
}
对于非常大的文件,这效率很低,因此另一种选择可能是读取文件的“第一行”并仅检查这一行
package main
import (
"bufio"
"fmt"
"os"
"unicode/utf8"
)
func main() {
readFile, err := os.Open(os.Args[1])
if err != nil {
panic(err)
}
fileScanner := bufio.NewScanner(readFile)
fileScanner.Split(bufio.ScanLines)
fileScanner.Scan()
fmt.Println(utf8.ValidString(string(fileScanner.Text())))
}
第二种方法有时会失败 - 例如某些安装程序有一个脚本标头,后跟二进制数据 - 但在很多情况下它会很好
好了,本文到此结束,带大家了解了《去检查文件是否是文本文件》,希望本文对你有所帮助!关注编程网公众号,给大家分享更多Golang知识!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341