博客
关于我
MaxCompute访问TableStore(OTS) 数据(20170601更新)
阅读量:796 次
发布时间:2023-02-08

本文共 2233 字,大约阅读时间需要 7 分钟。

MaxCompute与TableStore的数据生态连通性优化

随着阿里云大数据平台MaxCompute的不断发展,其在处理内部与外部数据方面展现出强大的计算能力。特别是在非结构化数据处理方面,MaxCompute 2.0计算框架的上线为用户提供了更广阔的数据接入可能性。在TableStore(OTS)作为阿里云分布式NoSQL数据存储服务的背景下,MaxCompute与其之间的数据链路连接显得尤为重要。本文将详细介绍如何实现MaxCompute对TableStore数据的读取与计算,以及数据写入的实现方法。

  • MaxCompute对TableStore数据进行读取和计算
  • 1.1 使用前提与假设MaxCompute 2.0非结构化功能的使用需要先申请试用。在执行SQL查询时需设置以下参数:set odps.task.major.version=2dot0_demo_flighting;set odps.sql.planner.mode=lot;set odps.sql.ddl.odps2=true;set odps.sql.preparse.odps2=lot;

    1.2 TableStore基础概念与网络连通性MaxCompute与TableStore之间需保持网络连通。建议使用TableStore的私网地址(以ots-internal.aliyuncs.com结尾)进行访问,例如tablestore://odps-ots-dev.cn-shanghai.ots-internal.aliyuncs.com。

    1.3 TableStore与MaxCompute类型对应两者类型系统对应关系如下:| MaxCompute Type | TableStore Type ||-----------------|----------------|| STRING | STRING || BIGINT | INT || DOUBLE | DOUBLE || BINARY* | BLOB |

    1.4 使用STS/RAM访问TableStore数据MaxCompute结合RAM和STS授权机制进行安全访问。需在RAM中创建角色AliyunODPSDefaultRole,并设置相应的策略。

    1.5 创建External Table通过CREATE EXTERNAL TABLE将MaxCompute与TableStore进行连接。示例:CREATE EXTERNAL TABLE IF NOT EXISTS ots_table_external(odps_orderkey bigint, odps_orderdate string, ...)STORED BY 'com.aliyun.odps.TableStoreStorageHandler'WITH SERDEPROPERTIES ('tablestore.columns.mapping'=':o_orderkey, :o_orderdate, o_custkey, o_orderstatus,o_totalprice','tablestore.table.name'='ots_tpch_orders')LOCATION 'tablestore://odps-ots-dev.cn-shanghai.ots-internal.aliyuncs.com';

    1.6 通过External Table访问数据在创建External Table后,可通过MaxCompute SQL直接访问TableStore数据。例如:SELECT odps_orderkey, odps_orderdate, SUM(odps_totalprice) AS sum_totalFROM ots_table_externalWHERE odps_orderkey > 5000 AND ...;

    1. 数据从MaxCompute写入TableStore
    2. 2.1 INSERT OVERWRITE实现使用INSERT OVERWRITE将MaxCompute计算结果写入TableStore。示例:INSERT OVERWRITE TABLE ots_table_externalSELECT odps_orderkey, odps_orderdate, odps_custkey, CONCAT(odps_custkey, 'SHIPPED'), CEIL(odps_totalprice)FROM internal_orders;

      1. 技术细节与高级用法
      2. 3.1 MaxCompute与TableStore对应关系MaxCompute外表与TableStore数据表呈N:1关系,可映射不同属性列子集或特定范围。

        3.2 并发度控制MaxCompute默认并发度与TableStore分区数目一致。针对大规模写入,可提前与TableStore服务沟通,确保网络吞吐量。

        3.3 网络连通性MaxCompute与TableStore间需保持稳定网络连接,推荐使用私网地址进行访问。

        1. 结语:构造大数据生态MaxCompute与TableStore的数据链路连接,为阿里云生态圈中的多种应用场景提供了强大支持。通过打通数据生态,MaxCompute能够更高效地处理OSS、TableStore及内部数据,实现数据价值最大化。

    转载地址:http://clyfk.baihongyu.com/

    你可能感兴趣的文章
    Mac book air 重新安装系统验证显示 untrusted_cert_title
    查看>>
    Mac book pro打开docker出现The data couldn’t be read because it is missing
    查看>>
    mac elasticsearch brew安装填坑
    查看>>
    mac M1 下安装docker 及相关镜像
    查看>>
    Mac M1 安装 TensorFlow 使用Python3.8
    查看>>
    Mac M1 芯片不兼容node-sass
    查看>>
    MAC M1大数据0-1成神篇-25 hadoop高可用搭建
    查看>>
    mac m1导入cv2报错 正确的安装OpenCV的方法
    查看>>
    Mac mini7.1 2014年末 安装单windows 10系统
    查看>>
    Mac mini7.1 2014年末系统损坏开机跳出闪动带问候文件夹
    查看>>
    mac mysql 进程_Mac平台下启动MySQL到完全终止MySQL----终端八步走
    查看>>
    mac node版本管理
    查看>>
    Mac OS 12.0.1 如何安装柯美287打印机驱动,刷卡打印
    查看>>
    Mac OS X 上 Python 的框架和非框架构建之间的差异
    查看>>
    Mac OS X下Sublime Text (V2.0.1)破解
    查看>>
    Mac OS X汇编语言常识
    查看>>
    Mac os 如何安装SVN
    查看>>
    Mac OS下错误The superclass “javax.servlet.http.HttpServlet“ was not found on the Java Build Path的解决方法
    查看>>
    Mac os如何安装绿盾客户端
    查看>>
    mac xmind 激活
    查看>>