博客
关于我
MaxCompute访问TableStore(OTS) 数据(20170601更新)
阅读量:796 次
发布时间:2023-02-08

本文共 2233 字,大约阅读时间需要 7 分钟。

MaxCompute与TableStore的数据生态连通性优化

随着阿里云大数据平台MaxCompute的不断发展,其在处理内部与外部数据方面展现出强大的计算能力。特别是在非结构化数据处理方面,MaxCompute 2.0计算框架的上线为用户提供了更广阔的数据接入可能性。在TableStore(OTS)作为阿里云分布式NoSQL数据存储服务的背景下,MaxCompute与其之间的数据链路连接显得尤为重要。本文将详细介绍如何实现MaxCompute对TableStore数据的读取与计算,以及数据写入的实现方法。

  • MaxCompute对TableStore数据进行读取和计算
  • 1.1 使用前提与假设MaxCompute 2.0非结构化功能的使用需要先申请试用。在执行SQL查询时需设置以下参数:set odps.task.major.version=2dot0_demo_flighting;set odps.sql.planner.mode=lot;set odps.sql.ddl.odps2=true;set odps.sql.preparse.odps2=lot;

    1.2 TableStore基础概念与网络连通性MaxCompute与TableStore之间需保持网络连通。建议使用TableStore的私网地址(以ots-internal.aliyuncs.com结尾)进行访问,例如tablestore://odps-ots-dev.cn-shanghai.ots-internal.aliyuncs.com。

    1.3 TableStore与MaxCompute类型对应两者类型系统对应关系如下:| MaxCompute Type | TableStore Type ||-----------------|----------------|| STRING | STRING || BIGINT | INT || DOUBLE | DOUBLE || BINARY* | BLOB |

    1.4 使用STS/RAM访问TableStore数据MaxCompute结合RAM和STS授权机制进行安全访问。需在RAM中创建角色AliyunODPSDefaultRole,并设置相应的策略。

    1.5 创建External Table通过CREATE EXTERNAL TABLE将MaxCompute与TableStore进行连接。示例:CREATE EXTERNAL TABLE IF NOT EXISTS ots_table_external(odps_orderkey bigint, odps_orderdate string, ...)STORED BY 'com.aliyun.odps.TableStoreStorageHandler'WITH SERDEPROPERTIES ('tablestore.columns.mapping'=':o_orderkey, :o_orderdate, o_custkey, o_orderstatus,o_totalprice','tablestore.table.name'='ots_tpch_orders')LOCATION 'tablestore://odps-ots-dev.cn-shanghai.ots-internal.aliyuncs.com';

    1.6 通过External Table访问数据在创建External Table后,可通过MaxCompute SQL直接访问TableStore数据。例如:SELECT odps_orderkey, odps_orderdate, SUM(odps_totalprice) AS sum_totalFROM ots_table_externalWHERE odps_orderkey > 5000 AND ...;

    1. 数据从MaxCompute写入TableStore
    2. 2.1 INSERT OVERWRITE实现使用INSERT OVERWRITE将MaxCompute计算结果写入TableStore。示例:INSERT OVERWRITE TABLE ots_table_externalSELECT odps_orderkey, odps_orderdate, odps_custkey, CONCAT(odps_custkey, 'SHIPPED'), CEIL(odps_totalprice)FROM internal_orders;

      1. 技术细节与高级用法
      2. 3.1 MaxCompute与TableStore对应关系MaxCompute外表与TableStore数据表呈N:1关系,可映射不同属性列子集或特定范围。

        3.2 并发度控制MaxCompute默认并发度与TableStore分区数目一致。针对大规模写入,可提前与TableStore服务沟通,确保网络吞吐量。

        3.3 网络连通性MaxCompute与TableStore间需保持稳定网络连接,推荐使用私网地址进行访问。

        1. 结语:构造大数据生态MaxCompute与TableStore的数据链路连接,为阿里云生态圈中的多种应用场景提供了强大支持。通过打通数据生态,MaxCompute能够更高效地处理OSS、TableStore及内部数据,实现数据价值最大化。

    转载地址:http://clyfk.baihongyu.com/

    你可能感兴趣的文章
    Metasploit 命令注入漏洞渗透测试实战
    查看>>
    Metasploit 客户端漏洞利用实战
    查看>>
    Metasploit 文件上传漏洞渗透测试实战
    查看>>
    Metasploit 文件包含与跨站请求伪造渗透测试实战
    查看>>
    Metasploit 渗透测试框架快速入门
    查看>>
    Meta最新视频生成工具:emu video技术报告解读
    查看>>
    MFC CEdit改变字体大小的方法
    查看>>
    MFC 打印预览 映射模式 坐标变换
    查看>>
    MFC不规则窗体
    查看>>
    MFC之处理消息映射的步骤...
    查看>>
    MFC对话框屏幕居中
    查看>>
    MFC工作笔记0002---MFC HelloWorld程序
    查看>>
    MFC工作笔记0003---WindowsAPI与MFC的关系
    查看>>
    MFC工作笔记0004---MFC中afx_msg是什么,afx_msg void function()是什么意思
    查看>>
    MFC工作笔记0005---::在vc++中是什么意思
    查看>>
    MFC工作笔记0006---#pragma warning(disable:4996)是什么意思
    查看>>
    MFC工作笔记0007---消息映射处理
    查看>>
    MFC工作笔记0008---UDP协议通信_sendto 和 recvfrom 浅析与示例
    查看>>
    MFC工作笔记0009---VC++中 PostMessage和SendMessage的区别
    查看>>
    MFC工作笔记0010---PeekMessage 详解
    查看>>