计算机组织中的数据表示2025年03月17日 | 阅读 9 分钟 在计算机组织中,数据是指用于表示事件、人物、事物和想法的符号。 数据表示数据可以以下方式表示 数据 数据可以是任何东西,例如数字、姓名、音乐作品中的音符或照片中的颜色。数据表示可以指我们存储、处理和传输数据的形式。为了将数据以数字格式存储,我们可以使用任何设备,如计算机、智能手机和平板电脑。电子电路用于处理存储的数据。 数字化 数字化是一种将照片、音乐、数字、文本等信息转换为数字数据的过程。电子设备用于处理这些类型的数据。数字革命经历了 4 个阶段的发展,从大型、昂贵的独立计算机发展到今天的数字世界。世界各地,小型、廉价的设备随处可见。 二进制数字 二进制数字或位用于显示数字数据,由 0 和 1 表示。二进制数字可以称为计算机中信息最小的单位。二进制数字的主要用途是它可以以 0 和 1 的形式存储信息或数据。它包含一个可以为开/关或真/假的值。开或真用 1 表示,关或假用 0 表示。数字文件是一个简单文件,用于收集存储介质(如闪存驱动器、CD、硬盘或 DVD)中包含的数据。 ![]() 表示数字数字可以以下方式表示 数字数据 数字数据用于包含数字,这有助于我们执行算术运算。数字设备使用二进制数制系统来表示数字数据。二进制数制系统只能由两个数字 0 和 1 表示。系统中不能有 2 这样的其他数字。如果我们想用二进制表示数字 2,那么我们将写成 10。 ![]() 表示文本文本可以以下方式表示 字符数据 字符数据可以由符号、字母和数字组成,但不能用于计算。使用字符数据,我们可以形成我们的地址、发色、姓名等。字符数据通常以文本形式接收数据。借助文本,我们可以描述许多事情,例如我们父亲的名字、母亲的名字等。 数字设备 数字设备使用多种代码来表示字符数据,包括 Unicode、ASCII 和其他类型的变体。ASCII 的全称是 American Standard Code for Information Interchange(美国信息交换标准代码)。它是一种字符编码标准,用于电子通信。借助电信设备、计算机和许多其他设备,ASCII 代码可以表示文本。ASCII 代码需要 7 位来表示每个字符,其中每个位表示一个唯一的字符。对于大写字母 A,ASCII 代码表示为 1000001。 扩展 ASCII 扩展 ASCII可以被描述为 ASCII 的超集。ASCII 集使用 7 位来表示每个字符,但扩展 ASCII 使用 8 位来表示每个字符。扩展 ASCII 包含 ASCII 字符的 7 位以及附加字符的 1 位。使用 7 位,ASCII 代码为 128 个唯一符号或字符提供代码,但扩展 ASCII 为 256 个唯一符号或字符提供代码。对于大写字母 A,扩展 ASCII 代码表示为 01000001。 Unicode Unicode也称为通用字符编码标准。Unicode 提供了一种方法,通过该方法可以将单个字符表示为网页、文本文件和其他文档的形式。使用 ASCII,我们只能表示基本的英文字符,但借助 Unicode,我们可以表示来自世界所有语言的字符。 ASCII 代码为 128 个字符提供代码,而 Unicode 为大约 65,000 个字符提供代码,使用 16 位。为了表示每个字符,ASCII 代码仅使用 1 位,而 Unicode 支持最多 4 字节。Unicode 编码有几种不同的类型,但 UTF-8 和 UTF-16 是最常用的。UTF-8 是一种可变长度编码方案。它也已成为 Web 上使用的标准字符编码。许多软件程序也将其 UTF-8 设置为默认编码。 ![]() ASCII 码 ASCII 代码可用于电话号码和社保号码等数字。ASCII 文本包含纯文本和无格式文本。这种文件将以文本文件格式保存,其名称以 .txt 结尾。这些文件在不同系统上的标签不同,例如 Windows 操作系统将这些文件标记为“文本文件”,而 Apple 设备将这些文件标记为“纯文本”。ASCII 文本文件中没有任何格式。如果我们想制作带有样式和格式的文档,那么我们必须在文本中嵌入格式代码。 Microsoft Excel Microsoft Word 用于创建格式化的文本和文档。它使用 **DOCX 格式**来完成此操作。如果我们使用 Microsoft Word 2007 或更高版本创建新文档,那么它始终将 DOCX 作为默认文件格式。**Apple Pages** 使用 **PAGES 格式**来生成文档。与 Microsoft Word 相比,使用 page 格式创建和编辑文档更简单。**Adobe Acrobat** 使用 **PDF 格式**来创建文档。以 PDF 格式保存的文件无法修改。但我们可以轻松打印和共享这些文件。如果我们以 PDF 格式保存文档,则无法将其转换为 Microsoft Office 文件或任何其他文件,除非使用特定软件。 **HTML** 是超文本标记语言。它用于文档设计,将在 Web 浏览器中显示。它使用 **HTML 格式**来设计文档。在 HTML 中,超文本是任何文档中的一种文本,其中包含链接,通过这些链接我们可以跳转到文档中的其他位置或跳转到其他文档。标记语言可以称为计算机语言。为了定义文档中的元素,该语言使用标签。 ![]() 表示位和字节位和字节可以以下方式表示 位和字节 在数字通信或计算机领域,位是信息最基本的单位或数据的最小单位。它是二进制数字的缩写,这意味着它只能包含一个值,即 0 或 1。因此,位可以表示为 0 或 1、- 或 +、假或真、开或关、或否或是。许多技术都基于位和字节,这些技术在描述网络访问速度和存储容量方面非常有用。位通常缩写为小写 b。 为了执行指令和存储数据,位被分组为多个位,称为字节。字节可以定义为八位的组合,通常缩写为大写 B。如果我们有四个字节,它等于 32 位(4*8 = 32),10 字节等于 80 位(8*10 = 80)。 用途 位用于数据速率,如电影下载速度、互联网连接速度等。字节用于获取存储容量和文件大小。当我们阅读与数字设备相关的内容时,会经常遇到诸如每秒 90 千比特、1.44 兆字节、2.8 千兆赫和 2 太字节之类的引用。为了量化数字数据,我们有许多选项,如 Kilo、Mega、Giga、Tera 等类似术语,它们如下所述 **104 KB:** Kb 也称为千字节或 Kbyte。它主要用于指代小型计算机文件的大小。 **56 Kbps:** Kbps 也称为千比特、Kbit 或 Kb。56 kbps 表示每秒 56 千比特,用于显示较慢的数据速率。如果我们的互联网速度是 56 kbps,我们将面临连接多个设备困难、流式视频时缓冲、下载缓慢以及许多其他互联网连接问题。 **50 Mbps:** Mbps 也称为兆比特、MB 或 Mbit。50 Mbps 表示每秒 50 兆比特,用于显示更快的数据速率。如果我们的互联网速度是 50 Mbps,我们将体验无缓冲的在线活动,例如在线游戏、下载音乐、流式高清视频、网页浏览等。50 Mbps 或更高将被称为快速互联网速度。借助快速的速度,我们可以轻松处理一个以上用户同时进行一个以上的在线活动,而不会对服务造成重大中断。 **3.2 MB:** 3.2 MB 也称为兆字节、MB 或 MByte。它用于指代包含视频和照片的文件的大小。 **100 Gbit:** 100 Gbit 也称为吉比特或 GB。它用于显示非常快的网络速度。 **16 GB:** 16 GB 也称为千兆字节、GB 或 GByte。它用于显示存储容量。 ![]() 数据压缩数字数据被压缩以减少传输时间和文件大小。数据压缩是减少表示数据所需的位数的过程。数据压缩通常使用编码技术来压缩数据。压缩后的数据将帮助我们节省存储容量,降低存储硬件成本,提高文件传输速度。 压缩使用一些程序,这些程序也使用算法和函数来找出减少数据大小的方法。压缩可以称为“zipping”(压缩)。重建文件的过程将称为“unzipping”(解压缩)或“extracting”(提取)。压缩后的文件将在文件末尾包含 .gz、.tar.gz、.pkg 或 .zip。压缩可分为两种技术:无损压缩和有损压缩。 ![]() 无损压缩 顾名思义,无损压缩是在不丢失任何信息或数据的情况下压缩数据的过程。如果我们使用无损压缩来压缩数据,那么我们可以从压缩数据中精确地恢复原始数据。这意味着无损压缩可以完全恢复所有信息。 许多应用程序希望使用数据无损压缩。例如,无损压缩可用于 ZIP 文件格式和 GNU gzip 工具。无损数据压缩也可以作为有损数据压缩技术的一个组成部分。它通常用于离散数据,如文字处理文件、数据库记录、某些图像和视频信息。 ![]() 根据此图,当我们使用无损压缩原始数据时,我们能够恢复所有原始数据。 有损压缩 有损压缩是压缩数据的过程,但无法 100% 恢复原始数据。这种压缩能够提供高度压缩,并且压缩结果将是更小的压缩文件。但在该过程中,一些视频帧、声波和原始像素将被永久删除。 压缩率越高,文件大小越小。需要完全恢复的业务数据和文本永远不会使用有损压缩。没有人喜欢丢失信息,但有很多文件非常大,我们没有足够的空间来维护所有原始数据,或者很多时候我们根本不需要所有原始数据。例如,视频、照片和音频录制文件,用于捕捉我们世界的 Allure。在这种情况下,我们使用有损压缩。 ![]() 根据此图,当我们使用有损压缩原始数据时,我们只能恢复部分数据。我们无法恢复 100% 的原始数据。 下一个主题计算机组织中的 ALU 和数据路径 |
我们请求您订阅我们的新闻通讯以获取最新更新。