我的编程空间,编程开发者的网络收藏夹
学习永远不晚

JSON数据怎么从OSS迁移到MaxCompute

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

JSON数据怎么从OSS迁移到MaxCompute

这篇文章主要讲解了“JSON数据怎么从OSS迁移到MaxCompute”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“JSON数据怎么从OSS迁移到MaxCompute”吧!

数据上传OSS

将您的JSON文件重命名后缀为TXT文件,并上传到OSS。本文中使用的JSON文件示例如下。

{    "store": {        "book": [
             {                "category": "reference",                "author": "Nigel Rees",                "title": "Sayings of the Century",                "price": 8.95
             },
             {                "category": "fiction",                "author": "Evelyn Waugh",                "title": "Sword of Honour",                "price": 12.99
             },
             {                 "category": "fiction",                 "author": "J. R. R. Tolkien",                 "title": "The Lord of the Rings",                 "isbn": "0-395-19395-8",                 "price": 22.99
             }
          ],          "bicycle": {              "color": "red",              "price": 19.95
          }
    },    "expensive": 10}

将applog.txt文件上传到OSS,本文中OSS Bucket位于华东2区。 
JSON数据怎么从OSS迁移到MaxCompute

使用DataWorks导入数据到MaxCompute

  1. 新增OSS数据源

    进入DataWorks 数据集成 控制台,新增 OSS类型数据源 。 
    JSON数据怎么从OSS迁移到MaxCompute

    具体参数如下所示,测试数据源连通性通过即可点击完成。Endpoint地址请参见 OSS各区域的外网、内网地址 ,本例中为http://oss-cn-shanghai.aliyuncs.com或 http://oss-cn-shanghai-internal.aliyuncs.com(由于本文中OSS和DataWorks项目处于同一个region中,本文选用后者,通过内网连接)。 
    JSON数据怎么从OSS迁移到MaxCompute

  2. 新建数据同步任务

    在DataWorks上新建 数据同步类型节点。  
    JSON数据怎么从OSS迁移到MaxCompute
    新建的同时,在DataWorks新建一个 建表任务 ,用于存放JSON数据,本例中新建表名为mqdata。 
    JSON数据怎么从OSS迁移到MaxCompute
    表参数可以通过图形化界面完成。本例中mqdata表仅有一列,类型为string,列名为MQ data。 
    JSON数据怎么从OSS迁移到MaxCompute
    完成上述新建后,您可以在图形化界面配置数据同步任务参数,如下图所示。选择目标数据源名称为odps_first,选择目标表为刚建立的mqdata。数据来源类型为OSS,Object前缀可填写文件路径及名称。列分隔符使用TXT文件中不存在的字符即可,本文中使用 ^(对于OSS中的TXT格式数据源,Dataworks支持多字符分隔符,所以您可以使用例如 %&%#^$$^%这样很难出现的字符作为列分隔符,保证分割为一列)。 
    JSON数据怎么从OSS迁移到MaxCompute
    映射方式选择默认的同行映射即可。 
    JSON数据怎么从OSS迁移到MaxCompute
    点击左上方的切换脚本按钮,切换为脚本模式。修改fileFormat参数为: "fileFormat":"binary"。该步骤可以保证OSS中的JSON文件同步到MaxCompute之后存在同一行数据中,即为一个字段。其他参数保持不变,脚本模式代码示例如下。


    {    "type": "job",    "steps": [
            {            "stepType": "oss",            "parameter": {                "fieldDelimiterOrigin": "^",                "nullFormat": "",                "compress": "",                "datasource": "OSS_userlog",                "column": [
                        {                        "name": 0,                        "type": "string",                        "index": 0
                        }
                    ],                "skipHeader": "false",                "encoding": "UTF-8",                "fieldDelimiter": "^",                "fileFormat": "binary",                "object": [                    "applog.txt"
                    ]
                },            "name": "Reader",            "category": "reader"
            },
            {            "stepType": "odps",            "parameter": {                "partition": "",                "isCompress": false,                "truncate": true,                "datasource": "odps_first",                "column": [                    "mqdata"
                    ],                "emptyAsNull": false,                "table": "mqdata"
                },            "name": "Writer",            "category": "writer"
            }
        ],    "version": "2.0",    "order": {        "hops": [
                {                "from": "Reader",                "to": "Writer"
                }
            ]
        },    "setting": {        "errorLimit": {            "record": ""
            },        "speed": {            "concurrent": 2,            "throttle": false,            "dmu": 1
            }
        }
    }

    完成上述配置后,点击运行接即可。运行成功日志示例如下所示。 
    JSON数据怎么从OSS迁移到MaxCompute

获取JSON字段信息

在您的 业务流程 中新建一个ODPS SQL节点。 
JSON数据怎么从OSS迁移到MaxCompute 
您可以首先输入 SELECT*from mqdata;语句,查看当前mqdata表中数据。当然这一步及后续步骤,您也可以直接在 MaxCompute客户端 中输入命令运行。 
JSON数据怎么从OSS迁移到MaxCompute
确认导入表中的数据结果无误后,您可以使用MaxCompute内建字符串函数 GET_JSON_OBJECT 获取您想要的JSON数据。本例中使用 SELECT GET_JSON_OBJECT(mqdata.MQdata,'$.expensive') FROM mqdata;获取JSON文件中的 expensive值。如下图所示,可以看到已成功获取数据。 
JSON数据怎么从OSS迁移到MaxCompute

感谢各位的阅读,以上就是“JSON数据怎么从OSS迁移到MaxCompute”的内容了,经过本文的学习后,相信大家对JSON数据怎么从OSS迁移到MaxCompute这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

JSON数据怎么从OSS迁移到MaxCompute

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

JSON数据怎么从MongoDB迁移到MaxCompute

这篇文章主要介绍“JSON数据怎么从MongoDB迁移到MaxCompute”,在日常操作中,相信很多人在JSON数据怎么从MongoDB迁移到MaxCompute问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答
2023-06-04

Django数据怎么从sqlite迁移数据到MySQL

Django数据怎么从sqlite迁移数据到MySQL,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。昨天快速搭建了一套自己的知识库。感觉一下子有了很多的事情要做
2023-06-04

如何将数据从SQL Server 迁移到PostgreSQL?将数据从SQL Server 迁移到PostgreSQL方法分析!

在不同类型的数据库之间迁移数据并非易事。在本文中,我们将比较几种从 SQL Server 转换到 PostgreSQL 的方法。Microsoft SQL Server 是一个很棒的数据库引擎,但在某些情况下它有缺点。免费的 Microsoft SQL Ser
如何将数据从SQL Server 迁移到PostgreSQL?将数据从SQL Server 迁移到PostgreSQL方法分析!
2020-08-12

Oracle怎么迁移数据到Greenplum

这篇文章主要介绍“Oracle怎么迁移数据到Greenplum”,在日常操作中,相信很多人在Oracle怎么迁移数据到Greenplum问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Oracle怎么迁移数据到
2023-06-03

【数据库迁移系列】从MySQL到openGauss的数据库对象迁移实践

在之前这一篇中我们分享过使用chameleon工具完成MySQL到openGauss的全量数据复制、实时在线复制。9.30新发布的openGauss 3.1.0版本 ,工具的全量迁移和增量迁移的性能不但有了全面提升,而且支持数据库对象视图、
2023-08-17

linux数据怎么迁移到新硬盘

要迁移Linux数据到新硬盘,可以按照以下步骤进行操作:1. 确保新硬盘已经正确连接到计算机。可以通过运行以下命令来查看新硬盘是否被识别: ```sudo fdisk -l```2. 创建一个新分区在新硬盘上,你可以使用工具如fdisk或者
2023-08-24

编程热搜

目录