`
ld_hust
  • 浏览: 166600 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

英特尔® Parallel Amplifier 入门

阅读更多

英特尔® Parallel Amplifier 可分析并提供关于代码性能的信息。英特尔® Parallel Amplifier 能够显示性能问题,使您能针对这些性能问题集中注意力进行性能调优,并在最短时间内获得最大的性能提升。

本入门指南旨在介绍 Amplifier 的基本特性。

学完本指南后,您将能够使用 Amplifier 分析代码,从而找出可获得最大性能提升的性能热点。

本文将逐步为您介绍调优示例应用程序的全过程,并介绍其中的各个阶段:

  • 定位性能问题
  • 修改代码以消除问题
  • 检测新代码的性能变化

如需直观感受入门体验,请观看Show Me 视频演示


本文分成以下几个部分:

  1. 生成应用程序

    首先,您需要在 Microsoft* Visual Studio* 环境中建立示例应用程序。本指南中的矩阵示例应用程序用于计算矩阵变换。为便于分析并快速评估优化效果,应用程序中包含一个计时器,可显示计算矩阵变换所用的时间。

    建立应用程序:

    • 在 Visual Studio* 中,选择 File > Open > Project/Solution,导航至 <install_dir>\samples\matrix\matrix.vcproj。
    • 项目将被添加到 Visual Studio*,显示在 Solution Explorer 中。选择 Build > Build Solution
      即生成 matrix.exe 应用程序。
  2. 程序在哪里浪费了时间?

    生成应用程序后,即可对 <install-dir>/samples/matrix 目录中所提供代码的性能进行分析。英特尔® Parallel Amplifier 提供了多种类型的分析,可收集不同类型的性能数据。在此步骤中,您将运行热点(Hotspot)分析来收集数据、查看结果并深入观察造成某个问题的相关源代码。热点分析可帮助您理解应用程序将运行时间耗费在哪些地方,并识别出最耗时的函数。查看详情

  3. 并发性在哪里存在不足?

    此步骤中,您将运行并发性分析,了解应用程序是否有效利用了所有处理器内核,并识别哪些串行化程度较高的代码需要并行化。查看详情

  4. 程序在哪里等待?

    此步骤中,您将运行锁定和等待分析,了解 algorithm_3 中出现标记为 OK 的串行 CPU 时间的原因。请点击这里查看详情。

  5. 实现了哪些优化?

    此步骤中,您将比较并发性分析结果。您将能够按函数查看性能变化。通过将优化前后的结果进行比较,可以评估这些优化对性能的影响及影响的程度。请点击这里查看详情。

  6. 后续步骤

    本指南重点介绍了英特尔® Parallel Amplifier 的基本特性。要了解更多特性并通过英特尔® Parallel Amplifier 获得更多收益,请点击这里查看后续步骤。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics