正则表达式 - 你必须掌握的

很多人不愿意修改公共代码,因为公共代码一修改,将可能影响到别的工程代码,必须同时修改大量的别的工程代码。对于简单的修改,比如函数名修改,使用简单的批量查找替换就可以完成。但如果遇到更加复杂的情况,很多人手足无措,只能一个一个的手工修改。《卓有成效的程序员》里有这么一个故事:

 “事情发生在一个项目中,那个项目已使用了1000个EJB(Enterprise Java Bean),当时决定所有的非EJB方法(就是说除了EJB托管的回调方法之外的所有方法)都需要一个额外的参数。原本估计需要一个人花6天来手工完成。但一个熟悉正则表达式的开发人员,用他信赖的编辑器(Emacs)仅使用两个小时就完成了所有的替换。也就是那一天开始,我决定好好学习正则表达式。

可以想象一下,一个原本6天的手工工作量, 最后只需要两小时。(1小时58分钟建立正确的语法,然后不足两分钟时间去执行。)

一、学习正则表达式

曾有人总结了程序员的七种武器,其中就有“正则表达式”。如果你现在对正则表达式还是一知半解,好好的静下心来,用心花上2个小时,仔细学习和研读一下正则表达式语法规则,是绝对值得的。要学习正则表达式,资源非常多。 如果想要系统的学习,建议看《精通正则表达式》等书。如果你想要快速入门,我推荐一下园里最近很火的Jimmy Zhang曾经写过的一个简易教程:

学习资源:

http://www.cnblogs.com/jimmyzhang/archive/2007/10/24/936151.html (花上1-2个小时仔细学习,然后反复实践,能够很快上手)

正则表达式工具:

我首推RegexBuddy了。下面这个地址里有RegexBuddy3.2.1完整版的下载地址(如果你仔细浏览这个网站,会发现此人是一个正则表达式狂热分子):

http://iregex.org/blog/regexbuddy321.html

二、实例

接下来,我们回到开头讲到的修改公共库的问题。我来举一个的例子,我们设计了一个Game类,提供Start实例方法如下:

 

然后,该方法被大量其他代码使用。直到某一天,我们决定将Start方法的两个参数顺序对换,因为gameName作为第一个参数看起来更加顺眼。。。然后,我们观察了一些使用到Game类的代码,发现有非常多的地方使用到了该代码,但几乎的代码都使用了类似如下的方法调用Start方法:

 

当然,实际情况下,调用该方法的代码千奇百怪,对于某些复杂情况,想要通过一个正则表达式达到完美的批量替换确实很难。这里,我就将问题简化一下,只是给大家提供一个思路。我假设所有调用该方法的代码都使用了如上的方法进行调用。(为了简化正则表达式,易理解,我假设调用代码都遵循代码规范,不会去多出一些多余的空格,也不胡乱换行。)

那么,一个怎样的正则表达式能够将上面的一段代码中的Game实例的Start方法的两个参数调换呢?

答案:

搜索:Game (\w+) = new Game();([\W\w]*?)\1.Start(([\w"]+), ([\w"]+));

替换:Game $1 = new Game();$2..Start($4, $3);

这个例子很常见,也很有用,如果你还不会,请耐心花上2个小时学习,然后解决它!

在实际的批量搜索替换过程中,你肯定会遇到各种各样的麻烦,因为你会发现,调用它的代码风格千差万别,比如上面的例子,可能有人将Game实例做为一个参数传递到了另外一个函数(甚至这个函数在另外一个文件里),如:

 

甚至,某些人不符合代码规范的怪异写法也会让你非常头疼。你会发现一个正则表达式已经不能一次性做完所有事情,这时,你也许需要编写一定的脚本进行更加复杂的处理,假如正则表达式这把武器在你的手上运用自如,你是否会感觉一切都变得那么简单呢?如果你有更多实际的正则表达式批量替换的经验,欢迎分享!

[温馨提示]:该文章由原博客园导入而来,如排版效果不佳,请移步:http://www.cnblogs.com/coderzh/archive/2009/07/16/1525170.html

微信扫一扫交流

作者:CoderZh
微信关注:hacker-thinking (代码随想)
本文出处:https://blog.coderzh.com/2009/07/16/1525170/
文章版权归本人所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。