助理 :1三6三二四61四五4
一)专业背景:
世界最大电信运营商总部大数据系统总设计师、奠基人
北京邮电大学兼职教授
中国企业数字化联盟特聘专家、贵州省大数据技术专家、海南省大数据产业联盟专家、教育部评审专家等
北京大学信息处理专业博士后
十八年专注于数据仓库、大数据、云计算、人工智能chatGPT等研究与推广
段博士曾经在银行工作过三年,熟悉金融领域相关知识。
段博士承担了国际最大电信运营商的数据仓库和大数据中心的设计和建设、运营工作,积累了19年的大数据、人工智能(含机器学习)领域的实际工作经验。带领相关的团队,从系统创建到系统运营,开发了很多大数据领域的各种应用。积累了国内唯一的大数据系统在大型企业建设、运营的经验。其前后主持设计的技术文档,有150余册、1200多万字。涉及大数据系统的数据模型、数据接口、系统架构、质量管控、业务应用、系统安全等各个领域。
近几年启动了人工智能、区块链、5G、智慧中台等新技术的研究和部署工作,积累了大型企业人工智能技术部署和应用的经验,并进行多次相关新技术的培训工作。
受邀为多场大型专业论坛会议进行主题发言,多次获得好评,行业经验丰富。
2018年6月在美国硅谷datawork summit 2018(世界顶级的大数据峰会)上两次登台发言(仅四家中国企业代表登台发言,本人是唯一两次登台发言的中国专家),取得良好效果。
二)教育经历:
2002――2005(博士后学历):北京大学信息科学技术学院博士后工作
1998——2001(博士学位):北京邮电大学电子工程系攻读博士学位
1995——1998(硕士学位):北京邮电大学智能网国家重点实验室 计算机应用专业
三)主要经验:
大数据系统相关领域的知识:数据仓库、大数据的基本技术,熟悉当前业界的使用和规模特点。熟悉数据仓库及数据建模技术基础,实际进行过十余年数据质量管控工作。熟悉DB2/ORACLE/TERADATA等数据仓库的产品特点,了解Erwin等建模工具。了解VERTICA/GP等MPP数据库的原理和特点。熟悉数据挖掘等机器学习技术,熟悉聚类、分类、回归预测等机器学习算法,有十余年的实际数据挖掘案例经验。熟悉HADOOP相关生态的组件技术,包括:SPARK/KAFKA/FLUME/YARN/HIVE/HBASE/STORM等实现技术,熟悉:R、mahout、SAS/SPSS等数据分析技术。掌握Python、Scala等编程语言。
熟悉TensorFlow等人工智能框架,了解深度学习、增强学习、迁移学习原理,实际进行过人工智能项目的实施和部署。进行了智慧机房监控、智慧办公监控、疫情知识问答等实际AI产品的开发和管理工作。
参与了5G电信网络的相关部署培训工作,参与了区块链的相关研究工作,编写了《5G开启万物智能》和《5G+智慧制造》两本书籍。积累了5G和人工智能等在部分行业的应用部署和培训经验。
四)工作经历:——十八年的大数据/人工智能专业经验
1.主持设计并完成了世界电信行业最大的大数据中心系统(截至到2020年底达到800PB存储容量,累计capex投资190亿元)
充分参考了互联网行业BAT(百度、阿里、腾讯)和谷歌等互联网企业的大数据建设案例,在电信行业主持设计并建设了国内最大的大数据中心(500PB)。基于HADOOP云计算架构,结合数据仓库系统,构建了混搭的大数据中心系统,完成了互联网内容爬去、客户内容喜好分析、客户数据业务营销、社会渠道欺诈、GIS网格量化、客户投诉分析等各种应用。提升了企业对外数据服务管理能力,增强了企业“数据变现”的水平,凸显了大数据的“要素”价值。
2.主持设计并完成了世界上最大的数据仓库系统建设
结合某电信运营商的实际情况,创制性地提出了分级式数据仓库理论,本人主持设计并建设了某电信运营商的“经营分析系统”,前后投资了100多亿人民币,建成了目前国际最大容量的数据仓库系统。实现了客户离网分析、客户细分分群、客户价值评估、数据业务产品喜好分析、一线经理贴身支撑、客户渠道分析、供应链分析、员工量化薪酬管理、营销成本分析等。提升了企业内部量化管理水平,确保客户精准营销能力,降低企业运营成本。
3.带动了国内数据仓库和大数据产业的发展
通过本人主持和设计的最大的数据仓库系统,填补了国内在数据仓库领域技术和应用的很多空白,通过十八年的努力,带动了国内一批数据仓库领域的厂商和研究力量,对国内数据仓库行业的发展起到了积极的推动作用。同时,从2010年开始通过HADOOP云计算技术的研发和推广,探索了云计算如何在大型企业落地的方式、方法,总结了大量的实际案例,推动了大数据在非互联网企业的经营研究。
4.启动AI领域自主研发工作
组建并带来相关技术团队,启动人工智能领域的自主研发工作。在人脸识别、肢体动作识别、语音识别、智能应答、智能客服等领域,进行自主技术研发,并形成相关产品。机房监控、办公室监控等部分产品已经在企业内部获得应用,取得很好效果。
5.学术上取得了一些成绩
依据提出的“分级式数据仓库理论”,获得了北京大学的博士后。发表了几十篇文章,出版了八本技术专著。
基于相关成就,被聘为北京邮电大学兼职教授。
6.组建了某电信运营商在数据仓库领域、云计算领域和人工智能领域的队伍
带动某电信运营商相关领域的员工,通过多次的培训,逐步组织了各省公司的技术骨干团队,在对系统的维护、新业务的开发和工程项目的管理等方面,积累了宝贵的经验。
被聘为第一届中国大数据大赛的评委。
7. 参与国家自然基金项目《基于带内遥测的超大规模数据中心网络架构研究与性能优化》(项目编号:U21B2022)
该国家自然基金项目将持续到2025年。该项目将借助带内遥测技术,将数据中心的传输网络“白盒化”,借助相关的网络状态元数据,实时掌握网络传输状态,进而优化数据中心(含GPU人工智能集群)的数据处理效率。改变了传统数据中心从X86节点进行优化的思路。该项目将大大提升国内大数据中心的处理性能,改进数据中心新基建的处理性能。
8.与国内外进行了积极的交流
通过举办多次大数据相关技术论坛,与国内外的厂商进行了广泛的技术交流。先后与VODAPHONE 、AT&T、VERIZION等多家国外运营商就数据仓库的建设和使用进行了充分的交流,并赴部分国外运营商进行了实地的考察工作。
与BAT等互联网企业进行了充分的调研和交流,熟悉BAT大数据的架构和应用情况。详细分析、比较过互联网企业和传统企业在大数据应用领域的各自优势,给出了实际的咨询方案。
五)出版著作:
2005年出版了电信行业第一本数据仓库专著《数据仓库技术及其在电信领域中的应用》和《数据仓库基础》(电子工业出版社出版)两本书籍。前后在各种技术媒体发表了几十篇各种文章,有的文章被SCI检索收录。
2015年结合15年大数据从业经验,完成了《大数据&大分析》(人民邮电出版社)和《大数据的互联网思维》(电子工业出版社)两本书籍的编写和出版工作。