Mysql某个表有近千万数据，CRUD比较慢，如何优化？( 二 ) _Mysql

跨节点的count,order by,group by以及聚合函数问题
这些是一类问题，因为它们都需要基于全部数据集合进行计算。多数的代理都不会自动处理合并工作。解决方案：与解决跨节点join问题的类似，分别在各个节点上得到结果后在应用程序端进行合并。和join不同的是每个结点的查询可以并行执行，因此很多时候它的速度要比单一大表快很多。但如果结果集很大，对应用程序内存的消耗是一个问题。
数据迁移，容量规划，扩容等问题
来自淘宝综合业务平台团队，它利用对2的倍数取余具有向前兼容的特性（如对4取余得1的数对2取余也是1）来分配数据，避免了行级别的数据迁移，但是依然需要进行表级别的迁移，同时对扩容规模和分表数量都有限制。总得来说，这些方案都不是十分的理想，多多少少都存在一些缺点，这也从一个侧面反映出了Sharding扩容的难度。
ID问题
一旦数据库被切分到多个物理结点上，我们将不能再依赖数据库自身的主键生成机制。一方面，某个分区数据库自生成的ID无法保证在全局上是唯一的；另一方面，应用程序在插入数据之前需要先获得ID,以便进行SQL路由.
一些常见的主键生成策略
UUID
使用UUID作主键是最简单的方案，但是缺点也是非常明显的。由于UUID非常的长，除占用大量存储空间外，最主要的问题是在索引上，在建立索引和基于索引进行查询时都存在性能问题。
Twitter的分布式自增ID算法Snowflake
在分布式系统中，需要生成全局UID的场合还是比较多的， twitter的snowflake解决了这种需求，实现也还是很简单的，除去配置信息，核心代码就是毫秒级时间41位机器ID 10位毫秒内序列12位。
跨分片的排序分页
一般来讲，分页时需要按照指定字段进行排序。当排序字段就是分片字段的时候，我们通过分片规则可以比较容易定位到指定的分片，而当排序字段非分片字段的时候，情况就会变得比较复杂了。为了最终结果的准确性，我们需要在不同的分片节点中将数据进行排序并返回，并将不同分片返回的结果集进行汇总和再次排序，最后再返回给用户。

Mysql某个表有近千万数据，CRUD比较慢，如何优化？( 二 )

推荐阅读

哈尔滨主城区狂犬疫苗告罄-狂犬疫苗有效期是多久

看了辛芷蕾的脚，我不由得慨叹，这真的是女明星的脚？

小额度贷款容易批的平台(稳下款的小额贷款)

曹云金|曹云金要回德云社了？

数码八叔|小米10成国产唯一9月销10万+的高端手机，小米高端旗舰彻底成了

索尼|索尼本田正式联手“造车”！总裁确认：PS5技术上车

射手座|错过真爱就不愿再将就的几大星座

「全民健康生活方式行动TB」癌症、糖尿病、脂肪肝、高血压，都有哪类“候选人”？

瓷砖,地砖木纹砖与木地板的区别有什么木纹砖优缺点有哪些

汽车熄火后不能做的几件事，再不注意，车坏了都不知道

美国@重型火箭弹从天而降，美国大使馆成一片火海，美俄：凶手已确定

『美食点播台』小小马兰价值高，不要只会凉拌，马兰猪肉饺子了解一下

kk时尚报|比丸子头显瘦！今年最流行“辣椒头”，洋气不挑人，比扎马尾时髦

#机智玩机机#诺基亚王者归来！2020新旗舰确认：全球首发屏下镜头！

小孩经常说谎如何教育，小孩经常说谎如何教育呢

秋月的私语@为美雪的课程指导加油

「文化课」好的文学作品就像浦东的一幢幢高楼，浦东开发开放30周年

回收微商库存上门收购闲置物品

王丽坤|王丽坤与他同居8年，却不敌她4个月，能打败爱情的从不是新鲜感

水果■这几种水果千万别吃，太致癌了，可惜很多人每天都在吃