了帮助 DB2 DBA 避免性能灾难并获得高性能,我为我们的客户、用户和 DB2 专家同行总结了一套故障诊断流程。以下详细说明在 Unix、Windows 和 OS/2 环境下使用 DB2 UDB 的电子商务 OLTP 应用程序的 10 条最重要的性能改善技巧 - 并在本文的结束部分作出总结。
1。 监视开关
确保已经打开监视开关。如果它们没有打开,您将无法获取您需要的性能信息。要打开该监视开关,请发出以下命令:
1 db2 "update monitor switches using2 lock ON sort ON bufferpool ON uow ON3 table ON statement ON"
2。
代理程序
确保有足够的 DB2 代理程序来处理工作负载。要找出代理程序的信息,请发出命令:
1 db2 "get snapshot for database manager"
并查找以下行:1 High water mark for agents registered = 72 High water mark for agents waiting for a token = 03 Agents registered= 74 Agents waiting for a token= 05 Idle agents= 56 Agents assigned from pool= 1587 Agents created from empty Pool = 78 Agents stolen from another application= 09 High water mark for coordinating agents= 710 Max agents overflow= 0
如果您发现Agents waiting for a token或Agents stolen from another application不为 0,那么请增加对数据库管理器可用的代理程序数(MAXAGENTS 和/或 MAX_COORDAGENTS取适用者)。
3。 最大打开的文件数
DB2 在操作系统资源的约束下尽量做一个优秀公民。它的一个优秀公民的行动就是给在任何时刻打开文件的最大数设置一个上限。数据库配置参数 MAXFILOP约束 DB2 能够同时打开的文件最大数量。当打开的文件数达到此数量时,DB2 将开始不断地关闭和打开它的表空间文件(包括裸设备)。
不断地打开和关闭文件减缓了 SQL 响应时间并耗费了 CPU 周期。要查明 DB2 是否正在关闭文件,请发出以下命令:
1 db2 "get snapshot for database on DBNAME"
并查找以下的行:
1 Database files closed = 0
如果上述参数的值不为 0,那么增加MAXFILOP的值直到不断打开和关闭文件的状态停埂。
1 db2 "update db cfg for DBNAME using MAXFILOP N"
4。 锁
LOCKTIMEOUT的缺省值是 -1,这意味着将没有锁超时(对 OLTP 应用程序,这种情况可能会是灾难性的)。尽管如此,我还是经常发现许多 DB2 用户用LOCKTIMEOUT= -1。
将LOCKTIMEOUT设置为很短的时间值,例如 10 或 15 秒。在锁上等待过长时间会在锁上产生雪崩效应。
首先,用以下命令检查LOCKTIMEOUT的值:
1 db2 "get db cfg for DBNAME"
并查找包含以下文本的行:
1 Lock timeout (sec) (LOCKTIMEOUT) = -1
如果值是 -1,考虑使用以下命令将它更改为 15 秒(一定要首先询问应用程序开发者或您的供应商以确保应用程序能够处理锁超时):
1 db2 "update db cfg for DBNAME using LOCKTIMEOUT 15"
您同时应该监视锁等待的数量、锁等待时间和正在使用锁列表内存(lock list memory)的量。
请发出以下命令:
1 db2 "get snapshot for database on DBNAME"
查找以下行:
1 Locks held currently= 02 Lock waits= 03 Time database waited on locks (ms)= 04 Lock list memory in use (Bytes)= 5765 Deadlocks detected= 06 Lock escalations= 07 Exclusive lock escalations= 08 Agents currently waiting on locks= 09 Lock Timeouts= 0
如果Lock list memory in use (Bytes)超过所定义LOCKLIST大小的 50%,那么在LOCKLIST数据库配置中增加 4k 页的数量。
5。 临时表空间
为了改善 DB2 执行并行 I/O 和提高使用TEMPSPACE的排序、散列连接(hash join)和其它数据库操作的性能,临时表空间至少应该在三个不同的磁盘驱动器上拥有三个容器。