pandas数据处理之标签列字符转数字的实现

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

机器学习中，当我们在进行数据预处理的时候，对于标签列非字符的数据，我们往往需要将其转换成字符，因为有的算法可能不支持非数字类型来做特征。

那么怎么快捷地来着这个转换呢，请看我的示例：

1.构建测试数据


import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.数据转换下，并获取标签列的字典


df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函数进行转换


df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

这样，就将标签列处理好了哈

等用完之后，再转回来


df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

补充：pandas factorize将字符串特征转化为数字特征

将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法。

原始数据的job特征值如下

都是字符串特征,无法用于训练，当然可以单独建立map硬编码处理，但是pandas已经封装好了相应的方法。


data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。如有错误或未考虑完全的地方，望不吝赐教。

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

pandas数据处理之标签列字符转数字的实现

下载Word文档到电脑，方便收藏和打印～

下载Word文档

pandas数据处理之 标签列字符转数字的实现

1.构建测试数据

2.数据转换下，并获取标签列的字典

3.使用函数进行转换

pandas数据处理之 标签列字符转数字的实现

相关文章

猜你喜欢

pandas数据处理之标签列字符转数字的实现

pandas数据处理之 标签列字符转数字的实现

Python列表之间的数字与字符转化实例

python数据处理之Pandas类型转换的实现

python数据清洗系列之字符串处理详解

python数据处理之Pandas类型转换怎么实现

R语言 实现将数据框中的字符类型数字转换为数值

lodash里to系列之将数据转换成数字类型实现示例

PHP中处理字符串转浮点数的最佳实践

Python实现列表转换成字典数据结构的方法

深入理解Go语言文档中的strconv.FormatInt函数实现整数转字符串

详解C语言对字符串处理函数的实现方法

深入理解Go语言文档中的strconv.FormatFloat函数实现浮点数转字符串

100天精通Python（数据分析篇）——第72天：Pandas文本数据处理方法之判断类型、去除空白字符、拆分和连接

MySQL怎么有效的实现存储IP地址及字符串IP和数值之间的转换

Java关键字在分布式实时数据处理中的性能表现如何？

mssql sqlserver sql对使用逗号分隔的字符串 转换为数据表的另类方法实现

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复

pandas数据处理之标签列字符转数字的实现

pandas数据处理之标签列字符转数字的实现

pandas数据处理之标签列字符转数字的实现

R语言实现将数据框中的字符类型数字转换为数值

mssql sqlserver sql对使用逗号分隔的字符串转换为数据表的另类方法实现