介绍
在java的广泛应用中,一个关键驱动因素是由于使用标准类库和应用框架从而提高了生产效率。通过减少必要的设计,实现和调试等软件开发任务,java在各种平台之间极大地改善了集成性和互操作性;其它的开发环境都不能提供象java那样的强大功能。实际上,没有一个环境象j2ee那样具有明显的基于框架开发的优点,j2ee能够快速地构建可扩展,分布式的安全企业级应用。
虽然这些优点一直在促进j2ee的空前发展,但也经常出现一些麻烦,那就是人们经常对j2ee应用的性能感到失望。因此,我们需要一些工具和调查策略来帮助j2ee开发团队解决这些性能问题。这就是quest
jprobe profiler和jprobe memory debugger所要解决的问题。
1.1 j2ee性能概揽
一般情况下,最终用户对j2ee应用性能的体验与下面层次是紧密相关的:
1 j2ee体系结构图
l j2ee应用是指servlets,jsps,ejbs和支持类,它们在j2ee应用服务器的上下文环境中构成了客户的应用。
l j2ee应用服务器是指j2ee应用服务器基础结构的设计,实现和配置,它们提供了客户j2ee应用的上下文环境。
l java运行环境是指java虚拟机及其配置(堆的大小等等)的设计和实现。
l 平台-底层硬件(如cpu的数目,内存的大小,i/o子系统等)和操作系统设计,实现和配置(线程和进程调度,子系统优化,整体负载等) 。
虽然毫无疑问,底部层次会影响整个性能,经验也不断地表明,性能下降的普遍原因是由组成j2ee应用的servlets,jsps和ejbs的设计问题和不佳的实现造成的。本文将集中讨论在这个底层中如何识别出性能下降的原因。
1.2 概述
本文描述了在bea weblogic server6.1上下文环境中,怎样用quest jprobe memory debugger和profiler分析j2ee应用。包括三个主要部分:
设置-在介绍jprobe的体系结构之后,我们将描述怎样把jprobe memory debugger和profiler集成到weblogic server6.1环境中。
l 对象循环分析-在j2ee应用中,性能下降的普遍原因是创建过多的短期对象(也可称为对象循环)。在这部分里,我们将展示怎样使用jprobe memory debugger's garbage monitor识别大量创建短期对象的方法。这些是进一步分析减少创建过多对象的最佳方法。
l j2ee性能分析-最后,我们将使用jprobe profiler向你介绍怎样进行j2ee应用的性能分析,并且在语句级上快速地识别出一些耗时最多的方法。
2. 集成bea weblogic 服务器和quest jprobe
2.1 quest jprobe
quest jprobe产品线由一族工具组成,该族工具包括下面四个分析工具。
l jprobe memory debugger-检查java软件的内存使用情况。
l jprobe profiler-剖析java软件的性能。
l jprobe threadalyzer-识别线程级的死锁和错误的访问冲突
l jprobe coverage-通过提供的语句级执行信息验证测试框架的完整性。
虽然本文集中讨论了jprobe memory debugger和profiler,但所有四个工具都采用了相同的体系结构设计,并且与bea weblogic服务器的集成方法是相同的。
2.1.1 jprobe的体系结构
一个基于jprobe的调查会话由两个程序组成:
图2 jprobe体系结构
jprobe控制台是一个基于swing的java应用,它提供了用户图形界面(gui),用于建立调查会话,在程序运行时查看分析信息和深入分析snapshot文件中的信息内容。
测试型java虚拟机-jprobe通过jvmpi(java virtual machine profiling interface)提供的回调方法,使用标准的java虚拟机运行java应用并收集分析信息,该虚拟机是由厂商提供的。在剖析基于wls的j2ee应用中,java应用运行在java虚拟机中,该虚拟机由weblogic服务器的基本框架组成,就象j2ee应用部署到上面一样。
这种结构具有非常灵活的启动方式。你可以从用户图形界面本身启动测试型java虚拟机,也可以单独启动测试型java虚拟机并且使它连接上jprobe控制台。
2.2 使用jprobe application server integration tool
1. 启动jprobe application server integration。
2. 从左上角下拉列表中选择你要集成的bea weblogic服务器版本。
图3 jprobe application server integration窗口
3. 点击"create"按钮。编辑窗口右边的内容,如图3所示。
4. 编辑下面区域或使用默认值。
直接输入要调查的服务器的启动脚本或者通过"浏览"方式输入。
jprobe settings:
(jpl file)
check the var checkbox
集成工具允许你使用先前创建的jpl(jprobe launchpad)文件。如果要使用由每个工具在启动时默认创建的jpl文件,选择var复选框。
java executable:
d:\sun\jdk1.3.1\bin\java.exe
可直接输入或通过浏览方式输入java虚拟机的执行文件路径。
5. 点击"advanced>>"按钮。
6. 填写下面这区域。
|
java options:
|
-classic -mx128m -ms64m
|
有选择地给java虚拟机输入参数。
|
7. 点击"save"按钮。
图4. jprobe application server intergation窗口
你已经成功创建和bea weblogic6.1的集成,
所有四个工具都可以使用这个集成过程。
8. 点击"close"按钮。
3. 识别j2ee应用性能下降
jprobe memory debugger能帮助你追踪到游离对象(loitering objects)和减少创建过多的对象,并且jprobe profiler能帮助你发现性能瓶颈。根据具体情况,需要具体分析。在这里,我们简单地概括用于解决对象循环和性能瓶颈这两个常见问题的步骤。更多的信息和其它使用jprobe memory debugger和jprobe profiler的方法,可以参考在线帮助或者阅读jprobe memory debugger guide和jprobe profiler developer's guide。
3.1 对象循环(object cycling)
java应用性能下降的一个主要原因是创建过多的对象 (或称为对象循环)。java虚拟机分配了过多的内存,创建了不必要的对象并对这些对象的初始化,加大了垃圾回收活动,从而引起性能下降。
作为一个性能分析人员,你首先需要识别出创建大量短期对象的方法。这些方法是进一步做减少创建对象数量分析的理想入手点。。jprobe memory debugger提供的一个垃圾监视功能可以把对象和分配它们的方法连接起来,并且当你的应用运行时,可以追踪有多少对象已经被垃圾回收了。
3.1.1
启动jprobe memory debugger的研究会话
1. 启动jprobe memory debugger。当欢迎界面出现的时候,点击"run"开始启动。
在jprobe launchpad窗口中:
a.
选择"using application server"
b.
从"application server"下拉的菜单中选择bea weblogic6.1
c.
注意在"integration id"下拉的菜单中填写jprobe demo 1
3. 选择"filter"
a.
点击"please enter a package,or method to display data for"。输入你要调查的包:profiler.com.quoteme.stockwatch
b.
在"display"栏的下拉菜单里选择"display"
4. 选中"monitor garbage collections from program start"复选框。
5. 选择"snapshot directory:"为d:\temp。
6. 点击"run"按钮。
图7.jprobe launchpad pad窗口
当weblogic server初始化时,runtime heap graph将增高,这反映了对象创建和垃圾回收活动。一旦weblogic server已经被充分初始化后,你就可以开始着手分析了。
3.1.2
运行时交互
一旦weblogic server已经充分初始化,选择你想要用于分析对象循环的应用用例。选择grabage monitor标签,按下面的步骤:
1. 首先运行一次garbage collection ,回收在java堆中分配的,但不再使用的对象。garbage monitor表随时更新反映这些被回收对象的情况。
2. 点击"clear table"清空garbage monitor表。
3. 运行你的应用用例。当java虚拟机开始垃圾回收时,grabage monitor表将随之更新。
提示:在heap usage chart中寻找负载峰值。急剧升降的负载峰值意味着一些对象在被垃圾回收之前只存活了很短的时间。连在一起的一些急剧升降的负载峰值是一个明确的信号,意味着是一个对象循环问题。
4. 在完成你应用用例后,再次运行garbage collection ,回收最后分配但不再使用的对象。
3.1.3
分析结果
当会话结束时,garbage monitor中包含了已回收最多实例的前十个类。通常,这些类不是你自己应用的类,准确地说,它们是被你的一些方法(直接地或间接地)分配的第三方的类。最后一列是分配这些已回收对象的方法名。
提示:如果被不同方法分配的实例属于同一个类,并且都是前十个类的话,你将见到两行相同的类。
1. 使用filter allocating methods,只显示你包中的一些方法,屏蔽掉其它包中的方法。在我们的例子中,客户j2ee应用定义在profiler.com.quoteme.stockwatch包里面,所以我们把过滤规范profiler.com.quoteme.stockwatch.*.*输入到filter allocating methods文本输入控制中。
2. 在gc'ed列中,你能看到你的方法分配了多少实例。作为比较,查看alive列就能看到还有多少实例仍在堆中。java开发者通常会对创建和移走了多少对象而感到惊奇。
3. 现在你已经识别到你有问题的方法。想想你可能怎样修改这些分配对象的方法,从而减少或排除对象循环?例如,你可以尝试重用某个对象或者创建一个可重用的对象池。
4. weblogic server6.1编译jsp后,自动产生了一个servlet类名,并赋予一个包名和类名。例如,如果有一个名为testjsp.jsp的jsp文件,将被编译成名为jsp_servlet.__testjsp的类(jsp名跟着两个下划线,并且都是小写字母)。
用filtering classes为jsp_servlet.*限制garbage monitor中的内容,可以看到已经被垃圾回收到garbage monitor中的jsp。在filtering allocating methods设置jsp_servlet.*.*或jsp_servlet._<你的jsp名>.* 限制garbage monitor中的内容,可以从分配的角度在指定的jsp中查看垃圾回收对象。
如果你分配的方法没有一个出现在garbage monitor中,或者在修改明显的问题后,仍然有对象循环的问题;你需要进行堆栈跟踪,检查哪个方法的调用导致了创建实例并分配了空间。需要使用heap snapshot查看堆栈跟踪。要了解更多的信息,请看在线帮助里的garbage collection tutorial或者jprobe memory debugger developer's guide。
3.2 性能分析
解决对象循环问题有助于性能的改进,但你可能仍然面临着性能瓶颈。进行一次性能分析可帮助你在j2ee应用中识别低效率的算法。jprobe profiler提供了应用的方法级和源代码行级度量值。
3.2.1启动jprobe profiler调查会话。
1. 启动jprobe profiler。当欢迎界面出现时,点击"run"开始。
图9。jprobe欢迎窗口
2. 在jprobe launchpad窗口中:
a. 选择"using application server"
b. 从application server下拉菜单中选择bea weblogic6.1
c. 注意在integration id下拉菜单中填jprobe demo 1
4. 选择filter
a. 点击please enter a package,class,or method to display data for。输入你要调查的包profiler.com.quoteme.stockwatch
d. 从detail level列的下拉菜单中选择line lever
这个元素定义了我们想要把所有运行在环境中的java软件看作基础结构。因为我们不想详细了解它们的性能信息
(我们只是想知道在代码上的影响,我们不想更细地分析)
提示:在wls6.1中的jsp profiling
当jsp被weblogic server6.1编译时,产生的servlet被给予一个产生的包和类名。例如,如果有一个名为testjsp.jsp的jsp文件,它被编译后,生成名为jsp_servlet._testjsp的类(两个底线被jsp名跟着,都是小写字母)。
如果你想跟踪你的jsp里的方法在执行中花了多少时间,你必须指定正确的过滤策略,用于捕获数据。
5. 选择"cpu time"
6. 选择"record performance at program start"复选框
7. 选择"a snapshot directory:"为d:\temp
8. 点击"run"按钮
图11。 jprobe profiler launchpad窗口
3.2.2
运行时交互
在性能分析中,heap usage chart就象一个执行进度的监视器,与上节介绍的garbage monitor不同,这里不提供类似的运行时性能信息。使weblogic server自己初始化到完全启动。
作为对象循环分析,我们推荐使用应用级的,以用例为中心的方法进行性能分析,具体如下:
1. 清空累积的性能数据
。
2. 运行你的应用用例。
3. 执行一次性能快照
,保存性能信息。
性能快照包括时间和在用例运行期间对象创建等度量数据(这个运行期间从重新设置性能信息开始-第一步,一直到执行快照结束,第三步)。
3.2.3
解释结果
jprobe profiler提供两个工具,以不同的格式显示收集到的数据;可根据具体情况选择:
l method list是指以表的形式显示与方法有关的数据信息。使用method list可以按照名称或度量值排序,或显示只显示其中部分方法。
l call graph--是指以有向图的形式显示方法。可以使用call graph查看并跟踪程序中方法间的调用关系。
从method list或call graph中,你能使用下面这些工具深入到更多的细节数据。
l method detail view是指对于所选的方法,显示它们是被哪些方法(也称父方法)调用了或它们调用了哪些方法(也称子方法)。
l source window显示所选方法的语句级性能信息。
3.2.3.1 time and object creation metrics
jprobe profiler在方法方面收集了三个基本度量值:
l number of calls是指在会话期间该方法被调用的次数
l method time是指执行该方法所花费的总时间
l method objects是指该方法创建的对象总数
在这些基本的度量值基础上,jprobe profiler计算出两种度量值表示方法调用树:
l cumulative time是指执行这些方法的时间,和执行它们直接或间接调用的方法所花费时间的总和。
l cumulative objects是指这些方法创建的对象,和这些方法直接或间接调用其它方法创建的对象的总合
基于number of calls用四种平均度量值:
l avg.method time是指调用方法的时间除以调用次数
l avg.method objects是指方法对象除以调用次数(方法对象指方法执行期间创建的对象数,不包括派生对象创建的数)
l avg.cumulative time是指累积时间除以调用次数
l avg.cumulative objects是指累积对象除以调用次数
在默认情况下,call graph显示的数据是在性能快照中的数据。我们建议你关闭call graph一会再打开method list窗口。
3.2.3.2 method list
method list窗口(见图12)以表的形式显示性能数据。
图12。jprobe profiler method list窗口
每一行显示了方法的时间和方法创建对象的度量值。使用method list能很快识别你最耗时的方法。通常你会发现你的性能瓶颈和这些方法有关。
如果你是第一次调查,跟着下面这些步骤将使你能更有效地使用method list。
1. 选中你的snapshot,打开"method list"。
2. "filter"区域只用于显示在你包中或在你感兴趣的类中的方法。
3. 点击"method time"列名,把你最消耗时间的方法排在最前面。仔细查看前十个。是不是有一些度量值令你惊讶?你能改进你方法中的算法吗?
4. 点击"cumulative time"列名,把最消耗时间的调用树排在最前面。比较一下"method time"和"cumulative time"。虽然方法本身可能效率很高,但也可能调用了低效率的方法,这些低效率的方法可能在你的代码中,或者在第三方的包或应用框架中。
5. 点击”number of calls”列名,查看一下你哪个方法被调用最多。如果一个或多个度量值同时反映这些方法是低效率的,需要考虑减少调用这些方法,或调用那些效率稍好的方法。
3.2.3.3. call graph
call graph(见图13)提供一个非常有力的方法调用关系视图。它把j2ee应用放到weblogic server上下文环境中,所以你能看到weblogic启动的所有线程,包括调用j2ee应用的线程。为了方便查找,call graph下面有"method list"。
当分析性能时,在定位j2ee应用的入口点和排除与weblogic线程有关的数据方面, call method是最有效的。在分离出应用的数据基础上,可
下面是使用call method的有效技巧:
1. 选中你的snapshot,打开"call graph" 。
2. 点击"find"并且定位你的j2ee应用的入口位置。
通常是servlet中的doget()或dopost()方法。
3. 选择方法并分离出数据形成图形
。
4. 显示方法的一个子集作为开始,这些方法按照"cumulative time"排序是最耗时的方法。当你分析一个方法,在方法的调用树上将增加额外的节点。
5. 在"method list"中,根据你发现的瓶颈位置,在"color by"的下拉列表中选择相同度量值。根据你选择的度量值,现在最耗时的方法都以鲜艳的颜色突出显示出来。
6. 选择最耗时的方法。展开父方法树(通过点击节点部分或节点左边部分的空箭头记号),就能看到哪个方法调用它了。你可以调用不同的,耗时比较少的方法吗?你需要经常调用这些方法吗?
7. 展开子方法树(指向节点的右边),可以看到调用了哪个耗时的方法。还有哪些子方法也是耗时的呢?你意识到第三方的方法实际的耗时情况吗?你能调用一个实现了更有效率算法的不同方法吗?
图13。jprobe profiler call graph窗口
3.2.3.4 method detail view
从method list或call graph中,你都能深入地分析,在一个视图中很方便地看到耗时的方法的度量值,还有它们子方法和父方法的度量值。选择方法并打开"method detail view" 。
"method detail view"(见图14)在窗口的中心显示了选择方法,它的父方法在上面,它的子方法在下面。我们对列的头部已经熟悉了,它们和你在其它工具中看到的度量值相同。一个重要的区别是:用于显示父方法和子方法度量值表示对所选方法的贡献值,不是对它们自己的度量值。所以,如果一个方法被调用了12次,这些调用它的方法,和12次调用分别显示在父方法的图中。如果你想继续分析父方法或子方法,双击该方法,使该方法在"method detail view"的中心显示。
图14 jprobe profiler method detail窗口
3.2.3.5 source window
要查看你方法中的代码,选择方法并且打开source window。你需要指出你的源代码具体位置。
如果你是按行收集数据,你能在source window(见图15)中看到这些数据。在左列中,显示了每条语句的数据度量值。行级度量值是方法级度量值的细化,包括调用次数,执行该行的时间,执行该行时创建的对象数量,累积时间和累计对象数量。
提示:如果需要编辑你的代码,并且已经把集成开发环境ide和jprobe profiler集成在一起了,你可以通过选择edit>edit source打开你的集成开发环境。当然,需要运行你重写的代码,并建立新的jprobe profiler分析会话时,你做的改变才反映在jprobe profiler上。
图15 jprobe profiler source window