当前位置:首页|资讯

使用 LakeSoul 构建实时机器学习样本库

作者:数元灵发布时间:2024-12-26

在之前的公众号文章《重磅!开源湖仓平台 LakeSoul 设计理念详解》中,我们介绍了 LakeSoul 开源流批一体表存储框架的设计理念和部分实现原理。LakeSoul 设计的初衷,是为了解决在流批一体的业务场景下,传统的 Hive 数仓难以解决的各类问题,包括 Upsert 更新、Merge on Read、并发写等。今天我们以一个典型的应用场景:构建实时机器学习样本库来展示 LakeSoul 的核心功能。 01 业务需求背景 1.1 在线推荐系统 在互联网、金融等行业,很多的业务场景都可以归纳为一个...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1