在之前的公众号文章《重磅!开源湖仓平台 LakeSoul 设计理念详解》中,我们介绍了 LakeSoul 开源流批一体表存储框架的设计理念和部分实现原理。LakeSoul 设计的初衷,是为了解决在流批一体的业务场景下,传统的 Hive 数仓难以解决的各类问题,包括 Upsert 更新、Merge on Read、并发写等。今天我们以一个典型的应用场景:构建实时机器学习样本库来展示 LakeSoul 的核心功能。 01 业务需求背景 1.1 在线推荐系统 在互联网、金融等行业,很多的业务场景都可以归纳为一个...【查看原文】
仿真资料吧 2023-04-09
程序员一诺 2024-01-02