Go来合并两个csv的实现示例
短信预约 -IT技能 免费直播动态提醒
背景
通常我们处理文件都是用python+pandas,确实很香。但是今天突然有人找我用go写一个合并两个csv文件的,需要将两个csv按id进行合并,大致如下图
思路很简单,先读入两个csv文件,然后遍历比较id,如果相同就把另一个文件的内容加到第一个中。然后创建merge.csv,将上一步得到的数据写入csv即可。
代码部分
package main
import (
"encoding/csv"
"log"
"os"
"fmt"
)
func join(fileName1 string, fileName2 string) (row [][]string) {
fs1, _ := os.Open(fileName1)
r1 := csv.NewReader(fs1)
content1, err := r1.ReadAll()
if err != nil {
log.Fatalf("can not readall, err is %+v", err)
}
fs2, _ := os.Open(fileName2)
r2 := csv.NewReader(fs2)
content2, err := r2.ReadAll()
if err != nil {
log.Fatalf("can not readall, err is %+v", err)
}
row = make([][]string, len(content1[1:]))
for i, row1 := range content1[1:] {
for _, row2 := range content2[1:] {
if row1[0] == row2[0] {
row[i] = append(row[i], row1[0], row1[1], row1[2], row2[1], row2[2])
}
}
}
return
}
func edit(filename string, row [][]string) {
f, err := os.Create(filename)
if err != nil {
panic(err)
}
defer f.Close()
//防止乱码
f.WriteString("\xEF\xBB\xBF")
w := csv.NewWriter(f)
w.Write([]string{"ID", "name", "gender", "course", "score"})
w.WriteAll(row)
w.Flush()
}
func main() {
row := join("1.csv", "2.csv")
fmt.Println(row)
edit("join.csv", row)
fmt.Println("合并已完成!")
}
优化
对于小数据量这样是没有问题,但是一旦数据量增大,不仅读取的内存占用增加,而且遍历比较会很消耗时间。所以优化的话我们可以以行读取,并且想办法使用go的goroutine来增加速度。唉,太久没怎么写go了,一开始切片都有点忘了。
到此这篇关于Go来合并两个csv的实现示例的文章就介绍到这了,更多相关Go合并csv内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341