在当今数字时代,数据是创新和决策的引擎,它不仅是很多科技公司的宝贵资源,也是如 ChatGPT 等新型应用落地的催化剂。数据技术的快速演进,正在重塑我们的收集、存储、管理、应用的方式,正因此,了解和掌握数据技术的最新趋势和应用变得尤为重要。
在 2023 长沙·中国 1024 程序员节上,我们于 10 月 24 下午特别设置了“数据技术”主题论坛,邀请来自阿里云RDS和开源OLAP产品研发负责人彭祥、腾讯云数据库专家工程师伍旭飞、openGauss开源数据库总工程师贺承汉、万博智云创始人/CEO王嘉、芒果TV产品技术中心数据技术部副总监佘一夫和数据库首席架构师李海翔等一线数据技术专家,聚焦数据库、大数据技术的最新趋势,共论挑战和机遇,探讨数据技术的最佳实践。
与此同时,我们还邀请到前腾讯、字节跳动数据库首席架构师李海翔担任出品人,严格把关论坛内容的实用性及质量,为开发者们理解数据技术、以更高效的方式应用数据带来新的思考与借鉴。
阿里云瑶池数据库加速云上数智创新
大数据时代下,数据规模高速地增长、不同类型的复杂数据分析和处理的需求不断增加。同时,AIGC 时代下,大语言模型爆发,企业希望将 AI 的能力引入到自己的业务中,助力业务发展。如何在一套系统中高效地处理海量的结构化数据和非结构化数据成为了企业数据管理的一个核心挑战,同时也对云数据库的云原生化、一体化、智能化提出了新的要求。本次分享介绍阿里云数据库如何满足新时代下企业数据库的数智化需求,内容将涵盖云数据库的 Serverless、极致弹性、向量处理以及 AIGC 等能力。
演讲嘉宾:
彭祥,阿里云 RDS 和开源 OLAP 产品研发负责人
彭祥,阿里云数据库事业部 RDS 和开源 OLAP 产品研发负责人,有多年数据库研发经验。曾任职于 AWS 云数据库部门,是 Aurora 团队早期成员之一,参与并负责了相关产品多个重大项目的落地;也曾在 Oracle 数据库部门从事查询优化器的研发工作。在数据库领域有多项发明专利。
演讲大纲:
大模型以及向量数据库的市场机会
当前数据平台面临的挑战
面向大模型的数据架构设计
阿里云数据库在AIGC时代下如何助力企业架构升级
大模型时代下向量数据库的挑战
在 AI 元年之前,腾讯已在向量搜索领域积累经验,但向量索引主要独立存在,许多开发者未完全意识到其潜力。随着大模型的兴起,向量数据库逐渐成为 AI 领域的关键存储基础设施。在这个 AI 繁荣时代,我们需要探讨适合的存储底座及向量数据库未来的发展和演进,以指导技术创新和业务拓展。
演讲嘉宾:
伍旭飞,腾讯云数据库专家工程师
伍旭飞,腾讯专家工程师,10+ 余年工作经验,在游戏和数据库领域有丰富的开发经验,目前专注数据库内核方向的开发和技术演进。
演讲大纲:
向量数据库是什么,为什么需要向量数据库
腾讯云向量数据库的架构和创新
腾讯云向量数据库 AI Native 能力
未来面临的挑战
openGauss 5.1 版本深度解读
openGauss 5.1.0 版本持续在四高内核上增强能力,同时在 DataPod 和 DataKit 持续创新,目标是实现更高效的处理大规模数据。
演讲嘉宾:
贺承汉,openGauss 开源数据库总工程师
贺承汉,openGauss 开源数据库总工程师。在华为工作17年间主力参与7+个产品的架构设计和软件开发,积累了丰富的软件设计和开发经验。目前主要投入 openGauss 资源池化、工具链、DataKit 等特性的设计、开发和规划,以及参与 openGauss 社区建设。其本人作为计算产品线 openGauss 布道师,赋能智能基座高校师资培训,发表专题演讲,负责全国高校的推广,实现产学研用结合,培养数据库领域国内核心技术人才。
演讲大纲:
内核能力:介绍在高性能、高可用、高智能、高安全上的创新特性。
DataPod:介绍透明转发、按需回放、算子下推等能力及原理。
DataKit:介绍插件化软件框架及其各插件新增能力。
上云容灾,我们在节能减排上做了什么?
IT 基础架构从传统,虚拟化到云,意味着容灾方案和工具也需要面向云进行重构。如何在纷繁复杂的外界环境下,解决跨架构容灾难题,利用云的特性做好容灾,做大场景是万博关注的重点。
传统容灾资源投入巨大,流程繁琐,受众面窄,而基于云原生的容灾软件使得按需订阅,低 TCO 的业务系统容灾成为可能。万博通过 Boot in Cloud 独家技术,独特的无主机容灾方案,提供更普惠的容灾服务,为更多用户提供关键业务连续性保障,助力 MSP 提供更优化的容灾服务。更为关键的是,万博通过云上容灾方案实现了大幅降低能耗,为企业实现低碳减排目标做出突出贡献。
王嘉,万博智云创始人/CEO
王嘉,万博智云创始人/CEO。曾于美国 Imation Corp 大中华地区工作超过 11 年,曾任大中华区总经理,深耕存储/IT营销和运营,并拓展/并购多条创新业务线,公司业绩连续多年翻番。2016年创立博飞科技(万博智云前身),深耕云计算行业。
演讲大纲:
容灾市场现状
云容灾方案特点
云容灾方案介绍
典型场景案例
芒果 TV 极速统一的流批分析架构
企业数字化转变过程中对于数据分析的要求逐步变化推动大数据技术架构的演进,同时当前大数据架构的发展、推动企业从Hadoop全家桶逐步简化,我们积极探索基于 StarRocks 实现极速统一的可能性。
佘一夫,芒果TV产品技术中心数据技术部副总监
佘一夫,芒果TV算法工程师,产品技术中心数据技术负责人,曾任商汤科技计算机视觉研发工程师。从 0 到 1 建设芒果在线广告库存预测、程序化广告在线服务等系统体系,拥有专利 8 项。
演讲大纲:
芒果TV业务和数据产品介绍
使用StarRocks构建极速统一的流批分析架构
技术热点“存算分离”的使用与经验分享
未来规划:打造芒果TV云原生数据湖仓方案
数据库的红与黑--事务处理技术的暗礁
事务型数据库的核心是可串行化理论,该理论是数据库的黄金圣律。在该理论下的最核心部分是并发访问控制技术,但遗憾的是,数据库诞生几十年,人们在数据异常、隔离级别、并发算法等方面有诸多的暗礁,严重影响着人们的认知、实践,甚至影响着数据库引擎的研发。
本分享即从这些暗礁着手,讨论数据库的核心技术的缺陷、改进方法,使得听众可高屋建瓴掌握事务处理技术的现状和未来全貌。
演讲嘉宾:
李海翔,数据库首席架构师
李海翔,前腾讯、字节跳动等数据库首席架构师,中国人民大学、北京林业大学硕士企业导师,CCF大数据、数据库专委会执行委员,北京市、深圳市科技进步一等奖得主。著有《数据库查询优化器的艺术》《数据库事务处理的艺术》《分布式数据库原理、架构和实践》等。申请与授权专利100+,SIGMOD、VLDB等大会发表论文若干篇,参与国家863重大专项、核高基等多项目研发。
演讲大纲:
隔离级别有价值吗?
为什么SQL标准要定义隔离级别?
用户主动加锁有用吗?
为什么要禁止用户主动加锁?
可串行化理论正确吗?为什么存在反例?
1024,程序员的盛会,解锁更多内容
除了数据技术论坛,本届程序员节以“研发新高地,数智创未来”为主题,还设置了岳麓对话、技术英雄会、全球开源掌门人高峰论坛、新程序员人工智能高峰论坛等十多场主题峰会,围绕 AI 模型技术及应用、开源技术、操作系统、云原生、机器人与智能制造、自动驾驶与智能汽车、金融科技等多个重要领域都开设了专题研讨。会上还将重磅发布“开源创新联盟”、“2023 中国开发者AI创新榜单”、“2023 AI 开发者生态报告”等。