Informatica 中的性能调优2025年3月17日 | 阅读 3 分钟 性能调优的目标是通过消除性能瓶颈来优化会话性能,从而获得更好、可接受的 ETL 加载时间。 调优始于识别源、目标和映射中的瓶颈,然后进行会话调优。可能需要在运行 Informatica PowerCenter 服务的系统资源上进行进一步调优。 我们可以使用测试加载选项来运行会话,以便在调优会话性能时进行测试。 如果我们调优了所有瓶颈,我们可以通过增加会话中的管道分区数量来进一步优化会话性能。 添加分区将通过在使用更多系统硬件处理会话时提高性能。 确定提高性能的最佳方法可能很复杂,因此最好一次更改一个变量。如果会话性能没有提高,那么我们可以恢复到原始配置。 性能调优的目标是优化会话性能,以便会话在 Informatica 服务器的可用加载窗口期间运行。 我们可以借助以下任务来提高会话性能,例如 - 网络:Informatica 服务器的性能与网络连接有关。
通常,数据在网络上的移动速度低于每秒 1 MB,而本地磁盘的移动速度是其五到二十倍。因此,网络连接通常会影响会话性能。所以避免网络连接。 - 纯文本文件:如果纯文本文件存储在Informatica 服务器以外的计算机上,则将这些文件移至包含 Informatica 服务器的设备。
- 减少连接:最小化与源、目标和 Informatica 服务器的连接以提高会话性能。将目标数据库移入服务器系统可能会提高会话性能。
- 暂存区:如果我们使用暂存区,那么强制 Informatica 服务器执行多次数据传递。删除暂存区可以提高会话性能。仅在强制要求时才使用暂存区。
- Informatica 服务器:我们可以针对同一个存储库运行多个 Informatica 服务器。将会话负载分配到多个 Informatica 服务器中可以提高会话性能。
- ASCII:以 ASCII 数据移动模式运行 Informatica 服务器可以提高会话性能。因为 ASCII 数据移动模式将一个字符值存储在一个字节中,而 Unicode 模式需要 2 个字节来保存一个字符。
- 源限定符:如果一个会话在一个源限定符中连接多个源表,那么优化查询可以提高性能。此外,带有 ORDER BY 或 GROUP BY 子句的单表选择语句也可以从优化中受益,例如添加索引。
- 删除约束:如果目标包含键约束和索引,那么它会减慢数据的加载速度。为了提高会话性能,在运行会话之前(在加载事实和维度时)删除约束和索引,并在会话完成后重建它们。
- 并行会话:使用并发批次运行并行会话也将减少加载数据的时间。因此,并发批次会提高会话性能。
- 分区:会话通过为源/目标创建多个连接并在并行管道中加载数据来提高会话性能。
- 增量聚合:如果会话包含一个聚合转换,那么我们使用增量聚合来提高会话性能。
- 转换错误:避免转换错误以提高会话性能。在保存映射之前,验证它并查看是否发生任何错误,然后更正转换错误。
- 查找转换:如果会话包含查找转换,那么我们可以通过启用查找缓存来提高会话性能。缓存通过保存先前的数据来提高速度,因此无需再次加载。
- 过滤转换:如果会话包含过滤转换,请在靠近源的位置创建该过滤转换,或者我们可以在源限定符中使用过滤条件。
- 组转换:聚合器、排名和连接器转换通常会降低会话性能,因为它们必须在处理数据之前对数据进行分组。我们使用排序端口选项来提高会话性能,即在应用转换之前对数据进行排序。
- 数据包大小:我们可以通过配置网络数据包大小来提高会话性能,这允许数据一次通过网络。为此,请转到服务器管理器,选择服务器配置数据库连接。
|