对于所有文本搜索技术,性能是需要考虑的最重要的因素。什么方法能使商业需求和数据内容运行最快呢? 我们可以通过下面列出的这些最佳实践来提高SQL Server全文搜索性能。 将至少每月重新组织和构建一次目录的原则改为每周一次。(最优配置需要根据负载情况具体处理)。
不这样做会导致全文索引产生碎片,使得索引效率变得非常差。全文搜索key应该是一个比较小的列,最好选择int类型。因为它不需要联合查询DocID映射表,所以能提高性能。如果该key是一个簇索引,那性能就会提高更多。
使用参数TOP_N_BY_RANK提高查询性能。因为它只查询最前面的N行数据。把目录放在独立的磁盘上。我推荐使用15K RPM……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
对于所有文本搜索技术,性能是需要考虑的最重要的因素。什么方法能使商业需求和数据内容运行最快呢?
我们可以通过下面列出的这些最佳实践来提高SQL Server全文搜索性能。
- 将至少每月重新组织和构建一次目录的原则改为每周一次。(最优配置需要根据负载情况具体处理)。不这样做会导致全文索引产生碎片,使得索引效率变得非常差。
- 全文搜索key应该是一个比较小的列,最好选择int类型。因为它不需要联合查询DocID映射表,所以能提高性能。如果该key是一个簇索引,那性能就会提高更多。
- 使用参数TOP_N_BY_RANK提高查询性能。因为它只查询最前面的N行数据。
- 把目录放在独立的磁盘上。我推荐使用15K RPM的硬盘驱动器。
- 第一个参数决定了执行计划。所以你可能想用OPTIMIZE FOR传递一个最佳的值,以便产生正确的执行计划。
- 我不推荐指定具体索引,除非实在没有办法。因为当索引有变化时,它一般会出问题。
- 请将sp_configure 'max full-text crawl range'设置为系统可用的CPU数。
- 使用Update statistics并且对timestamp列生成辅助索引,提高全文本对象增量填充的性能。
- 尽量不要多次使用关键字CONTAINS,要尽量把它们合并成包含多列字段的一个CONTAINS。
图解1:长时间运行的执行计划示例
性能消耗
CPU: 3,011
Reads: 1,112,473
Duration: 80,128
Rows: 124, 784
作者
Matt在SQL Server和Oracle这两个领域具有12年的经验。他获得微软MCITP认证、是一名数据库开发人员,他还获得了计算机科学专业硕士学位是SQL Server数据库系统高级软件工程师,范围从2 GB到3+ TB、2k和40+ktrans/sec之间。目前他任职于IGT公司,同样是一名独立的咨询师、专攻覆盖自动化、电子商务、娱乐和银行业的SQL Server、Oracle以及.NET方面。Matt擅长OLTP/OLAP数据库管理系统以及用.NET语言写可升级的处理系统。
翻译
TechTarget特邀编辑。2003年入软件行业,熟悉软件过程所有环节,对机构信息化的各方面有深入理解和实践经验。现就职于某互联网创业公司,目前关注互联网分布式系统架构和机器学习。喜欢传统文化社科哲学(尤喜《周易》、《老子》),喜健身喜抓举(具备抱人引体向上的能力),喜欢中国象棋(具备盲棋1对2的能力)。
相关推荐
-
Linux支持的引入 推动了SQL Server 2016集成服务的发展
随着SQL Server的不断发展,集成服务也在发生相应的变化。在最新的SSIS更新中,增加Linux支持和SQL Server 2016升级向导。
-
Notre Dame对云端SQL Server性能基准的探索实践
确立SQL Server的性能基准,对于云端迁移来说是至关重要的第一步,一位来自于University of Notre Dame 的DBA表示,他正在试图通过数据库监控软件,找出SQL server的性能基准。
-
横向扩展SQL Server应用程序:提高工作负载的选项
SQL Server管理员面临的最大挑战之一就是扩展数据库以适应更为繁重的数据处理工作负载。然而事情越发复杂的是,虽然Microsoft提供了许多不同的SQL Server可扩展性选项,但它们并不都适合于每种情况。
-
五大技巧构建首个SQL Server容器
容器的世界庞大而复杂,使用者可能会感到困扰,这里我们将列出一些示例,以便引导您顺利完成SQL Server容器的创建和管理。