网站首页 > 文章精选 正文
导语:
“同事的批量写入脚本跑 2 小时,我的代码只需 12 分钟!” 本文揭秘京东、美团都在用的 MySQL 写入优化方案,文末送【批量写入压测脚本】,关注+转发抽奖送《MySQL 内核优化手册》!
痛点共鸣
"INSERT 语句写满 3 屏,跑批任务等到天荒地老?"
先看触目惊心的数据对比(真实压测):优化前:10万条数据写入耗时 182 秒
优化后:同数据量仅需 9.7 秒
核心优化方案(附代码)
1. 一箭三雕:事务+批处理+参数调优(80% 场景适用)
java
// 错误示范:逐条提交
for (User user : userList) {
stmt.executeUpdate("INSERT INTO users VALUES (...)");
}
// 正确姿势:批处理+事务
Connection conn = dataSource.getConnection();
conn.setAutoCommit(false); // 关闭自动提交
PreparedStatement ps = conn.prepareStatement("INSERT ...");
for (int i=0; i<100000; i++) {
ps.setString(1, "name"+i);
ps.addBatch();
if (i % 5000 == 0) { // 每5000条提交一次
ps.executeBatch();
conn.commit();
ps.clearBatch();
}
}
参数调优:
sql
innodb_buffer_pool_size = 80%内存 # 缓冲池
innodb_flush_log_at_trx_commit = 2 # 事务提交策略
bulk_insert_buffer_size = 256M # 批量插入缓存
2. 核弹级提速:LOAD DATA INFILE(提速 10 倍+)
sql
-- 将CSV导入MySQL(秒级完成百万数据)
LOAD DATA INFILE '/tmp/users.csv'
INTO TABLE users
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n';
性能对比:
方式 | 10万条耗时 | 100万条耗时 |
逐条INSERT | 182s | 1800s+ |
LOAD DATA | 4.2s | 38s |
高阶技巧
3. 空间换时间:内存磁盘混合架构
sql
-- 使用内存临时表中转
CREATE TEMPORARY TABLE tmp_users (...) ENGINE=MEMORY;
-- 批量插入临时表
INSERT INTO tmp_users ...;
-- 一次性导入主表
INSERT INTO users SELECT * FROM tmp_users;
4. 并行写入黑科技(Python示例)
python
from concurrent.futures import ThreadPoolExecutor
def batch_insert(chunk):
# 每个线程处理1万条数据
with connection.cursor() as cursor:
cursor.executemany(sql, chunk)
with ThreadPoolExecutor(max_workers=8) as executor:
# 将10万数据拆分为10个chunk
executor.map(batch_insert, [chunk1, chunk2,...])
避坑指南
- 索引陷阱:写入前禁用非必要索引,完成后重建
ALTER TABLE users DISABLE KEYS; ... ENABLE KEYS; - 日志深渊:关闭binlog(SET sql_log_bin=0)或使用ROW模式
- 连接池误区:HikariCP 配置不当引发雪崩(附配置模板)
实战压测报告
使用 sysbench 对比不同方案的 TPS(Transactions/sec):
方案 | TPS | 资源消耗 |
逐条写入 | 62 | CPU 8% |
批量+事务 | 5400 | CPU 31% |
LOAD DATA | 21000 | CPU 68% |
猜你喜欢
- 2025-06-09 技术老兵十年专攻MySQL:编写了763页核心总结,90%MySQL问题全解
- 2025-06-09 从B+树原理到实战:MySQL索引设计的22条军规
- 2025-06-09 mysqldump备份操作大全及相关参数详解
- 2025-06-09 在Windows 10下安装配置MySQL数据库
- 2025-06-09 从零到亿级数据:MySQL 分库分表实战避坑指南
- 2025-06-09 重磅发布!这份MySQL全面总结手册,受喜爱程度不输任何大厂笔记
- 2025-06-09 MySql客户端(MySQL客户端安装教程)
- 2025-06-09 掌握Pymysql轻松实现Python数据库编程
- 2025-06-09 Linux:从命令行备份 MySQL 数据库
- 2025-06-09 「MySQL」性能测试如何快速生成千万数据
- 最近发表
- 标签列表
-
- newcoder (56)
- 字符串的长度是指 (45)
- drawcontours()参数说明 (60)
- unsignedshortint (59)
- postman并发请求 (47)
- python列表删除 (50)
- 左程云什么水平 (56)
- 编程题 (64)
- postgresql默认端口 (66)
- 数据库的概念模型独立于 (48)
- 产生系统死锁的原因可能是由于 (51)
- 数据库中只存放视图的 (62)
- 在vi中退出不保存的命令是 (53)
- 哪个命令可以将普通用户转换成超级用户 (49)
- noscript标签的作用 (48)
- 联合利华网申 (49)
- swagger和postman (46)
- 结构化程序设计主要强调 (53)
- 172.1 (57)
- apipostwebsocket (47)
- 唯品会后台 (61)
- 简历助手 (56)
- offshow (61)
- mysql数据库面试题 (57)
- fmt.println (52)