MySQL 优化(十)

7.5.4
编译和连接如何影响MySQL的速度

以下的大部分测试都是在Linux上用MySQL的基准套件来做的,不过它们对其他操作系统以及不同的工作量也是有一定启示的。

-static 连接的话,MySQL执行速度的速度是最快的。
在Linux上,用 pgcc-O3
编译的代码最快。大概需要200MB的内存加上这些选项来编译 `sql_yacc.cc`,因为 gcc/pgcc
需要大量内存来编译所有的内部函数。想要配置MySQL以避免包含 libstdc++ 库就要加上 CXX=gcc
参数,不过这不是必须的。注意,使用某些版本的 pgcc
编译的结果代码只能在奔腾处理器上运行,尽管已经给编译器增加选项想让结果代码可以在所有的x586类型(如AMD)处理器上运行。
如果使用比较好的编译器以及编译选项,应用程序大概能提高10-30%的速度。这在自己编译MySQL服务器的时候尤为重要。
我们已经测试
Cygnus CodeFusion 和 Fujitsu
编译器了,不过测试它们时,无论哪个都没有完全地解决bug以允许最佳方式编译MySQL。
标准的MySQL二进制发布包已经编译支持所有的字符集了。如果想要自己编译MySQL,只需编译支持想要使用的字符集。可以在
configure 时增加 --with-charset
选项来控制。

以下是我们已经做过的一些测量:

  • 如果使用 pgcc
    编译任何东西时用
    -O6 选项,则 mysqld 服务器会比用 gcc 2.95.2
    编译快1%。
  • 如果使用动态连接(没用
    -static),则在Linux上结果会慢13%。注意,这仍然可以让你的应用程序客户端动态连接MySQL的库。这对提高服务器性能相当关键。
  • 如果做
    strip mysqld
    了,则结果会快4%。
  • 在同一个主机上连接到服务器,如果使用TCP/IP而不是Unix套接字文件,那么会慢7.5%(在Unix上,如果使用主机名
    localhost
    连接,MySQL默认使用套接字文件)。
  • 用TCP/IP连接时,直接连接本机服务器比连接不同主机上的服务器会慢8-11%,尽管是通过100Mb/s的以太网。
  • 运行基准测试时如果采用安全连接(所有的数据都用内部支持的SSL加密)则会比用不加密链接慢55%。
  • 编译时增加
    --with-debug=full
    选项,则大部分查询都会慢20%。一些查询可能会变得很慢;例如,MySQL的基准套件可能会慢35%。如果只增加选项
    --with-debug(没有
    =full),则只会慢15%。一个使用 --with-debug=full 选项编译后的
    mysqld 可以在启动时增加 --skip-safemalloc 选项来禁用运行时内存检查。则执行速度就会接近于增加
    --with-debug 参数时的情况。
  • 在 Sun UltraSPARC-IIe 上,用 Forte 5.0 编译的服务器会比用
    gcc 3.2 编译的快4%。
  • 在 Sun UltraSPARC-IIe 上,用 Forte 5.0
    编译的服务器在32位平台上比在64位平台上快4%。
  • 在 UltraSPARC 上用 gcc 2.95.2 编译,增加
    -mcpu=v8 -Wa,-xarch=v8plusa 选项的话会快4%。
  • 在 Solaris 2.5.1 上,MIT-pthreads 比 Solaris
    原始的单处理器线程慢8-12%。在不同的负载或者CPU下,这个差异会更大。
  • 在 Linux x86上用 gcc 编译,不增加
    帧指针(-fomit-frame-pointer-fomit-frame-pointer -ffixed-ebp)选项
    的话会慢1-4%。

MySQL AB提供的Linux上的MySQL二进制发布包通常用 pgcc 编译。不过我们又重新使用
gcc 来编译了,因为用 pgcc 编译的代码不能在AMD上运行。我们会一直使用 gcc 来编译直到
pgcc 的这个bug解决了。与此同时,如果你有非AMD机器,就可以用 pgcc 来编译以使MySQL更快。标准的MySQL
Linux二进制包是静态连接的,这使得它更快且移植性更好。

 

7.5.5 MySQL 如何使用内存

以下展示了 mysqld
服务器使用内存的几种方法。可适用的是,和使用内存相关的系统变量名已经给出了:

  • 索引缓冲(key_buffer_size 变量)在所有的线程间是共享的;服务器所需的其他缓冲已经分配好了。详情请看"7.5.2 Tuning Server
    Parameters
    "。
  • 每个连接使用的一些线程特有的空间:
    • 一个堆栈(默认是64KB,thread_stack 变量)。
    • 一个连接缓冲(net_buffer_length
      变量)。
    • 一个结果缓冲(net_buffer_length 变量)。

    连接缓冲和结果缓冲可根据需要动态扩大到
    max_allowed_packet。一个查询正在执行时,当前查询语句的一份拷贝也需要为之分配内存。

  • 所有的线程共享一样的基本内存。
  • 只有压缩后的 ISAMMyISAM
    表才是内存映射的。这是因为32位的内存只有4GB的内存空间,对大部分大表都不够。当64位寻址的操作系统更普遍时,我们会普遍支持内存映射的。
  • 每个需要顺序扫描数据表的请求都需要分配一个读缓冲(read_buffer_size 变量)。
  • 如果以"随机"顺序读取记录(例如,排序之后),一个随机-读缓冲就必须分配以避免磁盘搜索(read_rnd_buffer_size
    变量)。
  • 所有的表连接都在一个步骤中完成,甚至大部分连接可以不使用临时表就能完成。大部分临时表都是基于内存(HEAP
    表)的。记录长度很长(所有的字段长度之和)或者包含有 BLOB 字段的临时表都会存储在磁盘中。在MySQL
    3.23.2之前有一个问题是,当一个内部的内存表大小超过 tmp_table_size 后,就会产生一个 The
    table
    tbl_name is full
    错误。在MySQL 3.23.2后,这会自动处理,在必须的时候把内存表转换成基于磁盘存储的
    MyISAM 表。想要在旧版本的MySQL也能正常运行,可以给 mysqld 设置 tmp_table_size
    选项以增加临时表大小,或者在客户端程序中设置 SQL_BIG_TABLES 选项。详情请看"14.5.3.1 SET Syntax"。在MySQL
    3.20中,临时表的大小最多为
    record_buffer*16;如果你使用这个版本,就必须加大
    record_buffer
    的值。可以在使用
    --big-tables 选项启动 mysqld
    来允许将临时表保存在磁盘中。不过这会影响很多查询编译。
  • 大部分需要做排序的请求都会分配排序缓冲,且视结果集大小分配0到2个临时文件。详情请看"A.4.4 Where MySQL Stores Temporary
    Files
    "。
  • 几乎所有的解析和计算在本地内存存储中已经做完了。无需为小的条目耗费内存,因此通常能避免比较慢的内存分配以及释放。内存只分配给不可预料的大字符串;这由
    malloc()free() 来完成。
  • 每个打开着的 MyISAMISAM
    表,索引文件只打开一次,而数据文件则是每次为同时运行的线程打开一次。在每个当前的线程中,表结构,每个字段的结构,需要分配大小
    3 * N 的缓冲(N 是记录的最大长度,不计算 BLOB 字段)。BLOB
    字段需要比 BLOB 数据长度多出来5到8字节。MyISAMISAM
    存储引擎维护一个额外的缓冲字段供内部使用。
  • 对于每个有 BLOB 字段的表,专门为其扩展一个动态缓冲来读取大
    BLOB 数据。读表的时候,就会分配一个以最大长的 BLOB
    数据长度的缓冲。
  • 所有的使用中的表句柄都缓存起来并且被当作FIFO来管理。默认地,这个缓存有64个表目。如果有一个表同时被两个运行着的线程使用了,那么在缓存中包含了该表的2个表目。详情请看"7.4.8 How MySQL Opens and Closes Tables"。
  • FLUSH TABLES 语句或
    mysqladmin flush-tables
    命令会关闭所有非使用中的表,并且也会在线程结束后关闭那些使用中的表。这对释放使用中的内存很有效。

ps
和其他系统程序都可以报告 mysqld 使用了大量内存。这个可能是因为在不同内存地址上的线程堆栈导致。例如,Solaris下的
ps 会把堆栈中未使用的内存也认为是已使用了。可以通过 swap -s
命令来检查可用的交换内存。我们已经用好几个内存泄漏监测器来测试了
mysqld(包括商业的和开源的),应该不会存在内存泄漏。

7.5.6
MySQL 如何使用 DNS

当一个新的客户端连接到 mysqld
时,它就会产生一个新的线程来处理。这个线程首先检查客户主机名是否在主机缓存中。如果没有,它就尝试解析这个主机名:

  • 如果操作系统支持线程安全的
    gethostbyaddr_r()gethostbyname_r()
    调用,就用他们来解析。
  • 如果操作系统不支持上述两个的线程安全调用,那么线程就县锁定一个mutex,然后再调用它们。这时,其他线程便无法解析不在主机缓存中主机名,直到第一个线程释放了mutex锁。


mysqld 启动时使用 --skip-name-resolve
选项就能禁用DNS解析。不过,这样的话就不能在MySQL的授权表中使用主机名了而只能用ip格式。
如果DNS解析很慢且有很多主机,那么可以用
--skip-name-resolve 选项禁用DNS解析或者重新编译 mysqld 时增加 HOST_CACHE_SIZE
的定义值(默认是 128)来提高性能。
启动服务器时使用 --skip-name-resolve
选项就能禁用主机缓存。想要清除主机缓存,可以提交 FLUSH HOSTS 语句或者运行 mysqladmin flush-hosts
命令。
想要彻底禁用TCP/IP连接,在启动服务器时使用 --skip-networking 选项即可。

评论

用TCP/IP连接时,直接连接本机服务器比连接不同主机上的服务器会慢8-11%,尽管是通过100Mb/s的以太网。
这句翻译得有点问题吧,手册上是这么说的:
对于从客户到服务器的TCP/IP连接,从另一台主机连接一台远程服务器要比连接同一主机上的服务器慢8-11%,即使通过100Mb/s以太网进行连接。