当前位置:首页|资讯

使用 Apache Arrow 进行内存分析——使用 Arrow Datasets API

作者:数据智能老司机发布时间:2024-10-08

在当前的数据湖和湖仓生态系统中,许多数据集现在是分区目录结构中的大型文件集合,而不是单个文件。为了简化这种工作流程,Arrow 库提供了一个 API,用于轻松处理这些类型的结构化和非结构化数据。这被称...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1