大数据工具

与服务器建立连接后,您可以使用数据文件。借助 Big Data Tools 插件,您可以轻松执行基本文件操作以及以表格形式快速预览大型结构化文件。

过滤桶列表

  1. 对于类似 S3 的服务器,您可以过滤存储桶以进行预览和使用。您可以在配置新连接时执行此操作,也可以调整之前配置的连接设置。在Big Data Tool工具窗口中选择一个服务器,然后单击连接设置窗口工具栏上的 。

  2. 在设置对话框中,在Buckets 过滤器列表中指定一个模式,然后从Filter type中选择过滤器的应用方式。如果未指定过滤器,则所有存储桶都将显示在Big Data Tool中。

    过滤桶列表

管理服务器目录

  1. 展开服务器节点以预览其结构。

  2. 选择一个目标目录并右键单击以打开上下文菜单。

    在 BDT 窗口中预览服务器结构的上下文菜单
  3. 您可以复制、粘贴、重命名目录、更改其位置或删除它。选择从磁盘上传以将更多文件添加到目录。

    您还可以将目录及其文件保存在本地驱动器上。

管理数据文件

  1. 展开目标目录并选择一个文件。

  2. 右键单击该文件以打开上下文菜单。

    用于处理数据文件的上下文菜单
  3. 您可以复制、粘贴、重命名文件、更改其位置或删除它。

  4. 要简要预览结构化文件的详细信息,例如.csv.parquet,请在目录结构中展开其节点。您应该能够看到列及其类型。

    扩展的 csv 文件

    从上下文菜单中选择显示文件信息以获取有关文件的更多详细信息:

    文件信息
  5. 要查看.csv或.csv .parquet,请双击它或从上下文菜单中选择预览命令。该文件在编辑器中打开。您无法对其进行编辑,但可以将其预览为表格或文本:

    csv 文件的表格视图
    csv 文件的文本视图

    在表格视图中,您可以对表格元素进行操作。右键单击以打开上下文菜单并选择命令以复制原始数据或列,或将整个表复制到剪贴板或文件。

    表特定命令

    您还可以通过单击列标题对列中的数据进行排序。

    当您打开.parquet文件时,插件仅显示文件内容的第一部分。这在您处理非常大的文件时特别有用。

创建一个新存储桶

  1. 要将新存储桶添加到数据存储,请在Big Data Tool工具窗口中右键单击服务器,然后从上下文菜单中选择创建存储桶。

    添加新存储桶
  2. 指定新的存储桶名称,然后单击确定以完成任务。

如果服务器连接丢失,相应的图标会显示服务器的断开状态服务器连接丢失

断开连接的服务器
单击刷新连接以重新建立与服务器的连接。

最后修改:2021 年 12 月 10 日