IBM AIX 操作系统

2025年4月29日 | 阅读 13 分钟

引言

IBM AIX 是一款高效的 Unix 操作系统,专为 IBM Power Systems 系列服务器而构建。AIX 诞生三十多年前,为企业提供了稳定性、可扩展性和安全性方面的解决方案,同时非常适合关键任务应用。它包括动态逻辑分区 (DLPAR) 和工作负载分区 (WPARs),这些功能增强了资源的管理和操作,并提供了资源控制的灵活性。其次,AIX 与 IBM PowerVM 无缝协作,从而实现了在一个物理服务器上高效虚拟化或运行多个虚拟实例。

AIX 以其高可用性和安全性而闻名,这些特性在金融、医疗和电信行业至关重要。在 AIX 7.3 等较新版本中,功能涵盖了当前云技术,并支持私有云、公有云和混合云,从而能够向云环境迁移。IBM 通过添加创新技术不断增强 AIX,使其适应现代技术市场。

AIX 系统架构

1. 内核

AIX 内核是应用程序的核心,提供进程调度、内存管理和 I/O 操作等服务。AIX 内核是一个微内核,因此效率很高,能够非常有效地分配系统资源。这种模块化方法也带来了安全性,因为不同的进程被包含在各自的模块中,整个系统很难被攻击者崩溃或渗透。内核负责管理用户级和系统级进程,并能够同时运行多个进程,最大限度地利用系统资源。

2. 文件系统

AIX 使用日志文件系统 (JFS) 和 JFS2 来管理文件和记录,以增强功能。JFS 特别适合用于企业应用程序,因为它具有良好的可扩展性并支持大文件。日志记录在更改发生之前记录更改,以尽量减少系统故障对数据的影响。AIX 文件系统中的另一项功能是加密文件系统 (EFS),这意味着对包含敏感数据的文件的安全措施。

3. 内存管理

AIX 具有内存管理系统,物理内存和虚拟内存都能得到充分利用。内存管理内置了动态分页技术的使用,将不常用的数据交换到磁盘空间,而将常用的数据保留在RAM 空间中。这使得需要更多内存的应用程序能够高效运行。此外,AIX 还具有动态逻辑分区 (DLPAR) 功能,允许实时分配或重新分配应用程序的内存。

4. d-任务管理

通过进程调度,AIX 采用一种复杂的技术,根据所需容量和总体负载对进程进行排序。操作系统将任务组织成进程,以便它们能够并发执行并完成许多任务。这种结构使得应用程序能够一次执行多个任务,从而加快处理速度并提高系统响应能力。同样,AIX 中的进程管理系统支持可扩展性,因为 AIX 能够处理超出标准的大量任务,而不会出现性能下降。

5. IBM 红皮书

AIX 包含一个高级网络软件包,提供TCP/IP 和其他高级高速网络协议。AIX 的网络堆栈紧密遵循操作系统发展的趋势:在通过网络传输大量数据和处理许多连接时,它快速而可靠。Unix 系统支持,如网络文件系统 (NFS) 支持,便于网络中的文件共享;网络信息工具和服务 (inetd) 以及扩展的 inetd (xinetd) 也被集成到 AIX 中以管理网络服务。网络组通过网络安装管理器 (NIM) 和 IP 多路径 (IPMP) 等功能得到增强,这些功能为操作系统提供了始终确保网络可用性的功能。

6. 虚拟化

AIX 拥有 IBM 的操作系统虚拟化 PowerVM,它能够在一个物理主机上运行多个 AIX 实例。PowerVM 具有强大的功能,包括实时分区迁移 (LPM),能够将正在运行的虚拟机从一个服务器物理迁移到另一个服务器,而无需关机;共享处理器池,允许分区高效地使用 CPU。此外,还有工作负载分区 (WPARs),它们提供 AIX 中的受限虚拟化,并为不同的应用程序提供一个与不同操作系统实例一样的独立环境来运行。

安装和配置

《IBM AIX 安装与配置》活动包括在 IBM Power Systems 兼容环境中部署 IBM AIX。AIX 的安装主要可以通过 DVD 等媒体完成,或者通过网络使用网络安装管理器 (NIM) 完成。NIM 对于大型组织特别有用,因为它允许从一个中心点控制安装,从而可以实现多次安装。它首先配置系统启动 AIX 安装介质的引导参数,然后加载 AIX 基本操作系统 (BOS),即预设的系统文件和实用程序。

一旦基本系统存在,就需要进行初始配置设置。这意味着在系统启动时需要配置区域设置、时区和网络设置等内容。AIX 提供了非常灵活的分区方式,这意味着初始更改之一是设置逻辑分区 (LPARs),它们提供了一种为单个物理服务器上的不同应用程序和服务分配资源的方式。这有助于协调硬件的使用,这在实施了许多任务的环境中至关重要。此外,为了实现轻量级应用程序隔离,管理员可以设置工作负载分区 (WPARs)。

接下来是对磁盘进行分区,并使用逻辑卷管理器来很好地管理磁盘上的存储。这包括建立 AIX 在存储数据时使用的逻辑卷和文件系统。通常使用日志文件系统或 JFS2。它在大型工作负载下具有可扩展性、弹性和稳定性。

AIX 具有系统管理界面工具 (SMIT),这意味着操作是通过菜单进行的,使得切换配置非常容易。尽管 SMIT 的重点是系统管理,但还应注意,它提供了许多设施,可以在不掌握命令行的深入知识的情况下更改用户访问权限和其他设置、查看日志、配置参数和其他资源。

AIX 中的文件系统和存储管理

1. 逻辑卷管理器 (LVM)

LVM 是 AIX 存储管理的重要组成部分,因为它将物理存储转换为逻辑存储。LVM 允许管理员定义新的逻辑卷 (LV) 和物理卷 (PV:单个磁盘或磁盘分区)。通过 PV,LVM 支持卷组,通过卷组,数据分布在存储单元中,从而提高了灵活性和容错能力。

2. JFS 和 JFS2

AIX 提供了两个日志文件系统 (JFS 和 JFS2),它们会记录对文件系统的每一次更改,如果发生系统中断,文件系统可以快速恢复。JFS2 支持更大的文件大小和扩展属性,这使其成为高性能、大规模使用的理想选择。日志记录还降低了损坏的风险,这使其成为在高可靠性和快速恢复环境中非常有利的选择;JFS2 是完美的匹配。

3. 动态存储分配

使用 AIX 中的动态存储分配,现在可以在使用过程中增加或减小文件系统和逻辑卷的大小。这种灵活性在某种程度上是通过 LVM 命令实现的,这些命令允许管理员根据应用程序需求增加或减小文件系统大小。当在获取资源以优化存储而又不中断其他进程时,此功能非常有用。

4. 条带化和镜像

在 AIX 中,条带化和镜像是在一起进行性能优化和数据冗余的技术。条带化将数据分布在多个磁盘上,从而提高了输入/输出速率;可以在需要高数据传输速率的地方应用。另一方面,镜像将数据复制到至少两个物理卷的表中,以防止因物理磁盘故障导致数据丢失。结合使用这两种技术,不仅提高了数据的可用性,还提高了读取性能,这在数据准确性至关重要的密集使用场景中至关重要。

5. SNMP 服务器和 NFS 支持

总的来说,AIX 支持网络文件系统 (NFS),通过该系统可以与其他连接的系统共享文件。NFS 允许系统挂载应用程序所需的标准文件系统,而这些文件系统需要两个或多个系统共享数据。这种网络数据存储的方法也主要消除了重复,并在分布式环境中促进了数据共享。AIX NFS 支持客户端和服务器操作;其参数可以进行优化,以正确匹配网络环境。

AIX 中的系统监控和性能调优

1. 使用 topas 和 neon 进行性能监控

topas 和 neon 工具是 AIX 中实时观察的实用设备,它们提供CPU内存、磁盘和网络使用信息。然而,topas 的功能相比 neon 有限,neon 可以在一个窗口中显示系统性能,并提供有关 CPU 和内存占用进程的详细信息。它能够使管理员定期快照性能数据,并进行长期趋势分析和资源瓶颈预测,这对于规划性能容量是必要的。

2. CPU 负载监控和分配

mpstat 和 vmstat 等工具用于 AIX 监控 CPU 使用量,以找到一种方法来识别 CPU 之间的负载均衡。AIX 的 WPAR 技术能够有效地将进程分配给多个 CPU,从而提高系统性能和效率。通过监控 CPU 使用情况,管理员可以观察如何将程序的部分在整个系统中进行调度,以及系统优先级,以便没有任何单个部分对 CPU 产生过大的负载,并将其余部分分配给可用的处理器。

3. 内存利用率跟踪

AIX 拥有出色的 svmon 和 vmstat 功能,用于监控内存分配,特别是物理内存和虚拟内存。它们使管理员能够跟踪页面错误、交换情况,并识别占用大量内存的进程。如果对内存使用情况进行监控,就可以及时检测与分页或交换相关的性能问题的正确诊断,从而提高系统的响应能力。其他内存调优技术,包括 minperm 和 maxperm,也具有根据应用程序需求调整内存的额外好处。

4. GNU iostat 和 Philemon 用于磁盘 I/O

在 AIX 中,磁盘 I/O 性能监控通过两种方法进行,即 iostat 和 Philemon;这些分区将提供对数据传输速率、磁盘队列长度以及读写性能的掌握。这种分析对于输入/输出量大的应用程序尤其重要,因为它有助于查找慢速磁盘或饱和控制器。通过识别 I/O 模式,管理员可以改进数据分布,修改缓存选项,并确定应用程序是否需要额外的存储容量。

5. 系统日志记录和分析

在 AIX 中,syslog 和 errpt 工具等源,系统日志是事件、错误和系统行为的历史数据。大多数技术或 IT 问题是可复现的,日志的频繁分析有助于正确的故障排除和维护。日志的使用使用户能够监控资源消耗的趋势,从而能够及早识别出指向性能问题的模式。通过大量的日志记录和分析,AIX 管理员可以始终保持高系统可用性,并应能迅速对异常情况做出反应。

故障排除

1. 启动失败

  • 问题: 由于某些损坏的文件或配置出现问题,AIX 系统无法启动。
  • 解决方案: 要排除启动问题,在重新启动系统并按正确的键(主要是 F1 或 F5)后,可以访问维护模式。系统规划进入维护模式后,进行一些诊断分析,以至少检查硬件问题。还可以使用 bootlist 命令显示引导设备顺序,并使用 lsfs 命令检查文件系统是否存在错误。如果文件损坏,您可能需要从备份中恢复或使用安装程序来修复系统。

2. CPU 利用率过高

  • 问题: 由于 CPU 大部分时间都处于满负荷状态,系统运行缓慢。
  • 解决方案: 通过 Topas 或 PS 等命令选项来了解哪些应用程序占用了更多 CPU。之后,您可以选择终止进程或管理资源消耗更多的应用程序。此外,请确保在负载高峰期没有计划运行的作业或脚本,并将它们移至负载较低的时段。

3. 内存泄漏

  • 问题: 某些应用程序可能会持续占用大量内存,从而降低产品的性能和效率。
  • 解决方案: 使用 SVMON 和 Topas 检查内存使用模式是否异常,并列出所有进程。内存泄漏可以通过关闭受影响的应用程序并重新打开它,或者应用可用的补丁来解决。频繁更新应用程序可以优化其内存使用,这有助于减少由于软件错误可能导致的内存泄漏。

4. 网络连接问题

  • 问题: 无法连接到给定网络中可访问的其他设备。
  • 解决方案: 首先检查系统线路和网络设置,使用 ifconfig 命令检查接口和IP 地址。使用 netstat -rn 命令仔细检查路由表。如果需要,则重新启动网络服务或更改网络配置。另外,请检查相关的防火墙设置,这些设置可能会阻止流量。

5. 文件系统损坏

  • 问题: 文件系统可能因突然终止、系统停机或硬件故障而损坏。
  • 解决方案: 需要挂载文件系统,然后使用 fsck 命令进行检查和修复。最好在未挂载的文件系统上进行此操作,以防止造成进一步损坏。如果您有损坏的根文件系统,请在维护模式下启动系统进行修复。还建议扫描组件(如磁盘)是否存在潜在问题,并在它们造成相同问题之前进行修复。

6. 服务故障

  • 问题: 某些关键服务根本无法启动或运行不正常。
  • 解决方案: lssrc 是另一个可用于检查服务状态的实用程序,对于错误,应检查位于 /var/log 中的日志文件。使用 starters 重新启动服务,或者如果日志文件中存在配置问题,则必须进行纠正。另一种管理问题的方法是检查服务依赖项是否正在运行。

7. 存储问题

  • 问题: 问题之一是磁盘空间不足或磁盘性能不佳;系统没有更多空间来保存数据。
  • 解决方案: 使用 df 等命令查看磁盘使用情况,使用 du 命令查找占用磁盘空间较大的文件或目录。如果空间是一个问题,用户可以自由地将一些文件转移到存档中,或者删除一些不太有用的文件。如果存在性能问题,请检查 LVM 是否配置正确,也许可以对文件系统进行碎片整理,或者使用更快的逻辑存储设备单元。

案例研究

1. 金融行业应用程序

  • 在金融行业本身,许多,如果不是大多数公司,如银行和保险公司,都依赖健壮可靠的计算平台来处理海量交易。IBM AIX 因其可靠性和安全性规定而被用于这些领域。
  • 一个典型的例子是某大型银行使用自适应智能来运行其银行应用程序。通过这种方式,AIX 提供了应对高交易量时段(例如,在股市交易期间或在特定月份结束时)所需的扩展性。
  • 该银行表示,利用 AIX 管理应用程序资源已提高了正常运行时间,同时通过利用根据工作负载密度识别资源的功能,降低了硬件成本。此外,确保金融监管合规性有效地与 AIX 的安全功能(如基于角色的访问权限和审计机制)协同工作。

2. 医疗保健信息系统

  • 近来,医疗保健行业的组织越来越依赖 IBM AIX 来运行电子病历 (EHR) 和患者应用程序。一家对 AIX 使用感兴趣的组织是一家医疗保健提供商,该提供商使用该系统运行集中式患者数据库,该数据库需要同时保持可用和受保护。
  • 高可用性和灾难恢复设计有助于支持医疗保健提供者即时可用并随时访问患者信息,同时始终保持数据完整性和数据安全。
  • AIX 与各种数据库和应用程序服务器接口的可能性,使医疗系统能够利用最佳分析工具来为患者数据增加价值,从而提高医疗系统的性能。此外,AIX 的可扩展性使该组织能够在不实施昂贵基础设施的情况下吸引新客户。

结论

总之,IBM AIX 是一个高效且灵活的平台,主要为满足可用性、可扩展性和安全性的需求而构建的大中型企业而设计。它具有强大的结构,可以处理金融、医疗和电信等不同行业的各种核心业务,同时帮助公司处理海量信息。

此更新提供了虚拟化、增强的安全措施和整体全面的性能调优,使 AIX 能够支持不断变化的业务需求下的运营效率和灵活性。随着组织寻求强大的关键任务平台,AIX 仍然能够帮助组织在其 IT 系统中获得高性能且可靠的基础设施。