PolarDB-X最佳实践系列（五）：使用通义千问和存储过程快速生成测试数据

作者：阿里云云栖号发布时间：2024-12-19

通义千问

我们在测试数据库性能的过程中，通常需要生成一批测试数据。

以前，一般要写一段程序或者脚本来完成这项工作，但现在是2024年啦！时代变了！

PolarDB-X目前是少有的支持存储过程的分布式数据库，结合大模型，我们可以非常简单的来制造测试数据：存储过程的原理和使用方法通义官网

例如，有这样的表结构：

CREATE TABLE t2 (

id bigint(20) NOT NULL AUTO_INCREMENT,

c1 varchar(64) NOT NULL ,

c2 tinyint(4) NOT NULL ,

c3 varchar(64) NOT NULL ,

c4 tinyint(4) NOT NULL ,

c5 varchar(64) NOT NULL ,

c6 bigint(20) DEFAULT NULL ,

c7 bigint(20) DEFAULT NULL ,

c8 double DEFAULT NULL ,

c9 bigint(20) DEFAULT NULL ,

PRIMARY KEY (id),

CLUSTERED INDEX gsi1 (c3)

PARTITION BY KEY(c3)

PARTITIONS 32,

UNIQUE KEY uk1 (c5, c3, c1),

KEY idx1 (c1),

KEY idx2 (c5, c1, c8),

KEY idx3 (c5, c3, c8)

) ENGINE = InnoDB PARTITION BY KEY(c1) PARTITIONS 32;

我们只需要对通义千问进行提问，描述以下需求，它就能自动生成一个存储过程：

写一个存储过程，为以下表生成100万条数据，其中，c1和c5是40位的十六进制字符串。（SQL内容省略了）

通义千问生成了这样的下面的存储过程：

DELIMITER ;;

CREATE PROCEDURE GenerateTestData()

BEGIN

DECLARE v_counter INT DEFAULT 0;

DECLARE v_hex_string CHAR(40);

WHILE v_counter < 1000000 DO

-- 生成40位十六进制字符串

SET v_hex_string = LPAD(LOWER(REPLACE(UUID(), '-', '')), 40, '0');

INSERT INTO t2 (

c1,

c2,

c3,

c4,

c5,

c6,

c7,

c8,

c9

) VALUES (

-- 生成c1的十六进制字符串

v_hex_string,

-- 随机生成tinyint值（例如，范围从0到255）

FLOOR(RAND() * 256),

-- 生成c3的随机字符串（也可以是十六进制，这里仅作示例）

LPAD(LOWER(REPLACE(UUID(), '-', '')), 32, '0'),

-- 随机生成tinyint值

FLOOR(RAND() * 256),

-- 生成c5的十六进制字符串

v_hex_string,

-- 随机生成bigint值

FLOOR(RAND() * POW(2, 63)),

-- 随机生成bigint值

FLOOR(RAND() * POW(2, 63)),

-- 随机生成double值

RAND(),

-- 随机生成bigint值

FLOOR(RAND() * POW(2, 63))

);

SET v_counter = v_counter + 1;

END WHILE;

END;;

DELIMITER ;

CALL GenerateTestData();

由于PolarDB-X对MySQL的语法兼容都非常高，我们无需对生成结果进行修改，直接粘贴到PolarDB-X中即可执行：

喝一杯茶，我们的测试数据就创建完成了：

欢迎关注，我们会带给大家更多PolarDB-X的最佳实践！

作者：梦实

原文链接：https://developer.aliyun.com/article/1458381?utm_content=g_1000392134

本文为阿里云原创内容，未经允许不得转载。

相关资讯

在自动化测试过程中，你如何处理测试数据？你会使用哪些方法来生成测试数据？

在自动化测试过程中，测试数据对于测试的准确性和覆盖率至关重要，常见方法有：1、使用真实的生产数据：使用真实的生产数据进行测试可以更好地模拟实际情况，确保测试数据的质量和真实性。2、随机数据生成器：对于需要大量数据的场景，可以使用随机数据生成器来生成测试数据。例如，可以使用Python的Faker库或者Java的随机数生成器来生成随机测试数据。3、人工智能技术：现代技术可以使用人工智能技术来生成测试数据。例如，可以使用机器学习模型来生成测试数据，这些模型可以学习现有数据并生成与其类似的新数据。4、手工创建测

人工智能机器学习

慧测 2023-03-02

通义千问Qwen-VL最佳实践从0开始

Qwen-VL 是阿里云研发的大规模视觉语言模型（Large Vision Language Model, LVLM）。Qwen-VL 可以以图像、文本、检测框作为输入，并以文本和检测框作为输出

通义千问

秋之 2023-09-22

通义千问开源模型在PAI灵骏的最佳实践

本实践将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

通义千问

阿里云云栖号 2023-12-28

快速接入通义千问

本文介绍了如何使用PHP调用"通义千问"的API，包括使用curl发送HTTP请求、编写API调用程序以及进行基本的错误处理。

通义千问

我码玄黄 2024-06-22

【AIGC】通义千问生成问答数据集

AIGC 通义千问

Kida的技术小屋 2024-04-08

近期资讯

浙江杭惠阀门取得控制阀专利，满足高压差大可调比极端复杂工况要求

金融界2024年12月27日消息，国家知识产权局信息显示，浙江杭惠阀门有限公司取得一项名为“种控制阀”的专利，授权公告号CN222208992U，申请日期为2024年2月。

金融界 2024-12-27

越强阀门取得热熔断防火球阀专利，达到更加安全使用的效果

金融界2024年12月27日消息，国家知识产权局信息显示，越强阀门有限公司取得一项名为“热熔断防火球阀”的专利，授权公告号CN222209061U，申请日期为2024年7月。

金融界 2024-12-27

浙江正宏阀门取得高密封性阀门专利，使密封效果更好

金融界2024年12月27日消息，国家知识产权局信息显示，浙江正宏阀门有限公司取得一项名为“一种高密封性阀门”的专利，授权公告号CN222209059U，申请日期为2024年5月。

金融界 2024-12-27

青田阿迪玛阀门铸造取得便于更换填料的球阀专利，便于对填料本体更换，减轻工作人员强度

金融界2024年12月27日消息，国家知识产权局信息显示，青田阿迪玛阀门铸造有限公司取得一项名为“一种便于更换填料的球阀”的专利，授权公告号CN222209062U，申请日期为2024年7月。

金融界 2024-12-27

北京市阀门总厂取得自紧式阀座及浮动球阀专利，提升防火密封性能

金融界2024年12月27日消息，国家知识产权局信息显示，北京市阀门总厂股份有限公司取得一项名为“自紧式阀座及浮动球阀”的专利，授权公告号CN222209060U，申请日期为2024年5月。

金融界 2024-12-27

金融监管总局：银行保险机构应当建立针对大数据、云计算、移动互联网、物联网等多元异构环境下的数据安全技术保护体系

国家金融监督管理总局印发银行保险机构数据安全管理办法。银行保险机构应当建立针对大数据、云计算、移动互联网、物联网等多元异构环境下的数据安全技术保护体系，建立数据安全技术架构，明确数据保护策略方法，采取技术措施，保障数据安全。

金融界 2024-12-27

念承气动取得一种电子排水阀专用球阀过滤器专利，能够方便对滤芯本体进行拆卸

金融界2024年12月27日消息，国家知识产权局信息显示，念承气动科技南京有限公司取得一项名为“一种电子排水阀专用球阀过滤器”的专利，授权公告号CN222209065U，申请日期为2024年7月。

金融界 2024-12-27

陕西哈曼流体科技取得一种密封球阀专利，避免控制丝杆处出现泄漏影响整个阀体的密封性

金融界2024年12月27日消息，国家知识产权局信息显示，陕西哈曼流体科技有限公司取得一项名为“一种密封球阀”的专利，授权公告号CN222209063U，申请日期为2024年4月。

金融界 2024-12-27

南安亚布洁具取得冷启动式水龙头专利，有效节约能源

金融界2024年12月27日消息，国家知识产权局信息显示，南安亚布洁具有限公司取得一项名为“一种冷启动式水龙头”的专利，授权公告号CN222209069U，申请日期为2024年5月。

金融界 2024-12-27

上海中君阀门取得暖通用电动二通球阀专利，使阀体与执行器之间的稳定性得到提升

金融界2024年12月27日消息，国家知识产权局信息显示，上海中君阀门集团有限公司取得一项名为“一种暖通用电动二通球阀”的专利，授权公告号CN222209064U，申请日期为2024年5月。

金融界 2024-12-27

PolarDB-X最佳实践系列（五）：使用通义千问和存储过程快速生成测试数据

推荐体验

相关资讯

在自动化测试过程中，你如何处理测试数据？你会使用哪些方法来生成测试数据？

通义千问Qwen-VL最佳实践从0开始

通义千问开源模型在PAI灵骏的最佳实践

快速接入通义千问

【AIGC】通义千问生成问答数据集

近期资讯

浙江杭惠阀门取得控制阀专利，满足高压差大可调比极端复杂工况要求

越强阀门取得热熔断防火球阀专利，达到更加安全使用的效果

浙江正宏阀门取得高密封性阀门专利，使密封效果更好

青田阿迪玛阀门铸造取得便于更换填料的球阀专利，便于对填料本体更换，减轻工作人员强度

北京市阀门总厂取得自紧式阀座及浮动球阀专利，提升防火密封性能

金融监管总局：银行保险机构应当建立针对大数据、云计算、移动互联网、物联网等多元异构环境下的数据安全技术保护体系

念承气动取得一种电子排水阀专用球阀过滤器专利，能够方便对滤芯本体进行拆卸

陕西哈曼流体科技取得一种密封球阀专利，避免控制丝杆处出现泄漏影响整个阀体的密封性

南安亚布洁具取得冷启动式水龙头专利，有效节约能源

上海中君阀门取得暖通用电动二通球阀专利，使阀体与执行器之间的稳定性得到提升

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响