从Oracle迁移到MySQL需要考虑的事情其实远比我们要理清数据类型转换这些技术细节要多,也更重要。
有两个问题需要前置考虑:
为什么要从Oracle迁移出去?
为什么要迁移到MySQL
如果解答了上述的两个问题,也就基本理顺了整个事情的脉络,我会本着基本客观的态度来说明。
问题1:为什么要从Oracle迁移出去?
这件事情从行业的实践来看(主要是说互联网行业),绝对不是先从技术可行性触发,而是从业务可行性来入手,归根结底,主要的出发点就两个字:成本。
MySQL开源免费,更重要的是行业实践验证充分,所以它具有得天独厚的优势。阿里多年前的去IOE风风火火,俨然成为了行业的标杆。
成本的事情很微妙,三言两语说不清。举例来说,你可以使用Office来办公,当然你可能考虑买授权或者绿色版激活,但是如果使用WPS就是名正言顺的事情,当然功能上是和Office有一些差距,但是不会存在一些模糊的边界。
从业务的另一个维度来看,试想我们所接触的互联网行业,很多业务除了充值和钱相关的业务,其实对于数据完整性一致性的要求就会降低一个维度,很多时候钱能解决的问题都不是问题,比钱更重要的是什么,我觉得应该是安全,安全包括生命安全,行业安全,系统安全,这些绝对不允许出一些重大问题的,这些影响面太大,比如医院医生给患者开药的数据,这些影响面是很大的,一旦出问题很容易成为公众事件。而以金融级业务作为一个分界点,之上的是安全领域,之下的领域其实就是一些可选择的空间了,这些空间很大。选择商业的一个原因也在此,有技术兜底,这些成本对企业来说也是需要和厂商的绑定关系。稀里糊涂硬上,出了问题找不到专业的快速支持,那就悲剧了。
然后是开源定制,其实很多开源技术的开源协议是有差别的,我们采用开源技术也需要考虑这些协议的边界和适用范围。
所以到此需要明确的是:
1.成本因素需要权衡,绝对不是非黑即白的事情
2.迁移到MySQL其实不是终极解决方案,只是一种可选的方案
3.对开源技术积累足够,技术把控能力要强
4.迁移的本质是找到最适合的业务场景,而不是为了技术实现而实现
对于第4点,举个例子,Oracle从性能上是毫无疑问的,但是如果有海量的读请求,其实就不适合Oracle来扛了,当然也不适合用MySQL,可能Redis的方案会更好一些。
问题2:为什么要迁移到MySQL
要回答这个问题,其实我们的主线就是MySQL可以做什么。
第一还是成本,开源免费,方便定制,MySQL的可选方案可绝对不只有社区版,还有一系列的分支,比如Percona分支,MariaDB分支,存储引擎InnoDB,MyRocks等统统都是免费可选。
第二是MySQL效率高,足够轻量级。MySQL的效率从使用上来说,学习周期会很短,容易上手,而且对于系统的资源要求不高。
第三是水平扩展能力,把Oracle比作地铁,MySQL比作公交车会更容易理解,我们可以很轻松的加开公交专线,但是加开地铁线路那就完全不同了。我觉得这是迁移到MySQL的一个核心点,这也就是为什么很多互联网的MySQL规模动辄几百几千了,爆发式增长的业务,MySQL扩展能力了不是体现在MySQL数据库本身,而是对于架构的扩展性上,而这也就是为什么很多MySQL DBA比较贵的一个原因。
第四是复制,这是MySQL相比Oracle的一个亮点,如果需要做跨数据中心的复制,允许存在一定的延迟,使用MySQL原生的复制方案是一件很容易的事情,MySQL支持很多不同维度的复制方案。
第五是业务轻依赖,这个可以分为两个维度来说。一个是功能限制,一个是性能限制。这本身是MySQL功能和性能上的缺失,但是反而是一个优点因为要支撑分布式需求,需要业务对数据库的依赖要更轻巧一些,原本支持不好的存储过程就可以很自然的弱化了。
第六是开源带来的生态体系,开源红利带给企业的是很多的技术方案选择,让原本需要花钱买的事情变成了我们干我们用。
问题3:从Oracle迁移到MySQL需要考虑的事情
首先是架构的差异,在oracle和MySQL里面的差异还是比较大的,当然Oracle里面也是可以使用同义词的架构来实现类似MySQL的访问模型的。
数据类型的差异其实是比较具体的技术细节,我举一些补充的。
oracle里面的Null和空串都可以按照null来处理,但是MySQL里两者是不同的。
oracle表名,用户名都是有长度限制,在30个字符以内,在MySQL里长度要大得多,尤其是表名就需要注意了。
oracle里会默认统一按照大写来处理,MySQL里面默认是大小写敏感的。
对于MySQL类型在MySQL里需要考虑的细节较多,比如数值型,oracle里面number搞定,MySQL有一系列的数值类型可以选择,不建议大一统的big int适配所有需求。
要更清晰的回答注意事项,可以归类为一个问题:MySQL相比Oracle少了些什么?
性能上肯定有差异,我们主要理一理功能上的。比较的原则不是说oracle有一定要MySQL有,而是从一些使用场景上来说更好的使用特性。
存储过程支持有限,这是很多企业的技术债,处理好了是坦途,处理不好是大坑。比如存储过程,硬要用存储过程调用来对接,后期后患无穷。
没有同义词
没有db link,这个特性MySQL里不支持其实是件好事,杜绝了那种跨库关联的需求。
没有sequence,这个MySQL的自增列完全可以弥补。
没有物化视图,难以实现增量刷新的需求。
分区表有,但是很少用
优化器薄弱,多表关联,Hash Join在MySQL里还是一个弱项。
索引的差异,覆盖索引的实现两者差异也很大。
绑定变量的性能差异不大,Oracle里面敏感的绑定变量问题在MySQL里不是问题。
性能工具,MySQL里面的性能工具还是比较少的,而且粒度和效果有限。
小结一下:
迁移的本质是找到最适合的业务场景,而不是为了技术实现而实现