计算机组织中的数据表示

2025年03月17日 | 阅读 9 分钟

在计算机组织中，数据是指用于表示事件、人物、事物和想法的符号。

数据表示

数据可以以下方式表示

数据

数据可以是任何东西，例如数字、姓名、音乐作品中的音符或照片中的颜色。数据表示可以指我们存储、处理和传输数据的形式。为了将数据以数字格式存储，我们可以使用任何设备，如计算机、智能手机和平板电脑。电子电路用于处理存储的数据。

数字化

数字化是一种将照片、音乐、数字、文本等信息转换为数字数据的过程。电子设备用于处理这些类型的数据。数字革命经历了 4 个阶段的发展，从大型、昂贵的独立计算机发展到今天的数字世界。世界各地，小型、廉价的设备随处可见。

二进制数字

二进制数字或位用于显示数字数据，由 0 和 1 表示。二进制数字可以称为计算机中信息最小的单位。二进制数字的主要用途是它可以以 0 和 1 的形式存储信息或数据。它包含一个可以为开/关或真/假的值。开或真用 1 表示，关或假用 0 表示。数字文件是一个简单文件，用于收集存储介质（如闪存驱动器、CD、硬盘或 DVD）中包含的数据。

Data Representation in Computer Organization

表示数字

数字可以以下方式表示

数字数据

数字数据用于包含数字，这有助于我们执行算术运算。数字设备使用二进制数制系统来表示数字数据。二进制数制系统只能由两个数字 0 和 1 表示。系统中不能有 2 这样的其他数字。如果我们想用二进制表示数字 2，那么我们将写成 10。

表示文本

文本可以以下方式表示

字符数据

字符数据可以由符号、字母和数字组成，但不能用于计算。使用字符数据，我们可以形成我们的地址、发色、姓名等。字符数据通常以文本形式接收数据。借助文本，我们可以描述许多事情，例如我们父亲的名字、母亲的名字等。

数字设备

数字设备使用多种代码来表示字符数据，包括 Unicode、ASCII 和其他类型的变体。ASCII 的全称是 American Standard Code for Information Interchange（美国信息交换标准代码）。它是一种字符编码标准，用于电子通信。借助电信设备、计算机和许多其他设备，ASCII 代码可以表示文本。ASCII 代码需要 7 位来表示每个字符，其中每个位表示一个唯一的字符。对于大写字母 A，ASCII 代码表示为 1000001。

扩展 ASCII

扩展 ASCII可以被描述为 ASCII 的超集。ASCII 集使用 7 位来表示每个字符，但扩展 ASCII 使用 8 位来表示每个字符。扩展 ASCII 包含 ASCII 字符的 7 位以及附加字符的 1 位。使用 7 位，ASCII 代码为 128 个唯一符号或字符提供代码，但扩展 ASCII 为 256 个唯一符号或字符提供代码。对于大写字母 A，扩展 ASCII 代码表示为 01000001。

Unicode

Unicode也称为通用字符编码标准。Unicode 提供了一种方法，通过该方法可以将单个字符表示为网页、文本文件和其他文档的形式。使用 ASCII，我们只能表示基本的英文字符，但借助 Unicode，我们可以表示来自世界所有语言的字符。

ASCII 代码为 128 个字符提供代码，而 Unicode 为大约 65,000 个字符提供代码，使用 16 位。为了表示每个字符，ASCII 代码仅使用 1 位，而 Unicode 支持最多 4 字节。Unicode 编码有几种不同的类型，但 UTF-8 和 UTF-16 是最常用的。UTF-8 是一种可变长度编码方案。它也已成为 Web 上使用的标准字符编码。许多软件程序也将其 UTF-8 设置为默认编码。

ASCII 码

ASCII 代码可用于电话号码和社保号码等数字。ASCII 文本包含纯文本和无格式文本。这种文件将以文本文件格式保存，其名称以 .txt 结尾。这些文件在不同系统上的标签不同，例如 Windows 操作系统将这些文件标记为“文本文件”，而 Apple 设备将这些文件标记为“纯文本”。ASCII 文本文件中没有任何格式。如果我们想制作带有样式和格式的文档，那么我们必须在文本中嵌入格式代码。

Microsoft Excel

Microsoft Word 用于创建格式化的文本和文档。它使用 **DOCX 格式**来完成此操作。如果我们使用 Microsoft Word 2007 或更高版本创建新文档，那么它始终将 DOCX 作为默认文件格式。**Apple Pages** 使用 **PAGES 格式**来生成文档。与 Microsoft Word 相比，使用 page 格式创建和编辑文档更简单。**Adobe Acrobat** 使用 **PDF 格式**来创建文档。以 PDF 格式保存的文件无法修改。但我们可以轻松打印和共享这些文件。如果我们以 PDF 格式保存文档，则无法将其转换为 Microsoft Office 文件或任何其他文件，除非使用特定软件。

**HTML** 是超文本标记语言。它用于文档设计，将在 Web 浏览器中显示。它使用 **HTML 格式**来设计文档。在 HTML 中，超文本是任何文档中的一种文本，其中包含链接，通过这些链接我们可以跳转到文档中的其他位置或跳转到其他文档。标记语言可以称为计算机语言。为了定义文档中的元素，该语言使用标签。

表示位和字节

位和字节可以以下方式表示

位和字节

在数字通信或计算机领域，位是信息最基本的单位或数据的最小单位。它是二进制数字的缩写，这意味着它只能包含一个值，即 0 或 1。因此，位可以表示为 0 或 1、- 或 +、假或真、开或关、或否或是。许多技术都基于位和字节，这些技术在描述网络访问速度和存储容量方面非常有用。位通常缩写为小写 b。

为了执行指令和存储数据，位被分组为多个位，称为字节。字节可以定义为八位的组合，通常缩写为大写 B。如果我们有四个字节，它等于 32 位（4*8 = 32），10 字节等于 80 位（8*10 = 80）。

用途

位用于数据速率，如电影下载速度、互联网连接速度等。字节用于获取存储容量和文件大小。当我们阅读与数字设备相关的内容时，会经常遇到诸如每秒 90 千比特、1.44 兆字节、2.8 千兆赫和 2 太字节之类的引用。为了量化数字数据，我们有许多选项，如 Kilo、Mega、Giga、Tera 等类似术语，它们如下所述

**104 KB：** Kb 也称为千字节或 Kbyte。它主要用于指代小型计算机文件的大小。

**56 Kbps：** Kbps 也称为千比特、Kbit 或 Kb。56 kbps 表示每秒 56 千比特，用于显示较慢的数据速率。如果我们的互联网速度是 56 kbps，我们将面临连接多个设备困难、流式视频时缓冲、下载缓慢以及许多其他互联网连接问题。

**50 Mbps：** Mbps 也称为兆比特、MB 或 Mbit。50 Mbps 表示每秒 50 兆比特，用于显示更快的数据速率。如果我们的互联网速度是 50 Mbps，我们将体验无缓冲的在线活动，例如在线游戏、下载音乐、流式高清视频、网页浏览等。50 Mbps 或更高将被称为快速互联网速度。借助快速的速度，我们可以轻松处理一个以上用户同时进行一个以上的在线活动，而不会对服务造成重大中断。

**3.2 MB：** 3.2 MB 也称为兆字节、MB 或 MByte。它用于指代包含视频和照片的文件的大小。

**100 Gbit：** 100 Gbit 也称为吉比特或 GB。它用于显示非常快的网络速度。

**16 GB：** 16 GB 也称为千兆字节、GB 或 GByte。它用于显示存储容量。

数据压缩

数字数据被压缩以减少传输时间和文件大小。数据压缩是减少表示数据所需的位数的过程。数据压缩通常使用编码技术来压缩数据。压缩后的数据将帮助我们节省存储容量，降低存储硬件成本，提高文件传输速度。

压缩使用一些程序，这些程序也使用算法和函数来找出减少数据大小的方法。压缩可以称为“zipping”（压缩）。重建文件的过程将称为“unzipping”（解压缩）或“extracting”（提取）。压缩后的文件将在文件末尾包含 .gz、.tar.gz、.pkg 或 .zip。压缩可分为两种技术：无损压缩和有损压缩。

无损压缩

顾名思义，无损压缩是在不丢失任何信息或数据的情况下压缩数据的过程。如果我们使用无损压缩来压缩数据，那么我们可以从压缩数据中精确地恢复原始数据。这意味着无损压缩可以完全恢复所有信息。

许多应用程序希望使用数据无损压缩。例如，无损压缩可用于 ZIP 文件格式和 GNU gzip 工具。无损数据压缩也可以作为有损数据压缩技术的一个组成部分。它通常用于离散数据，如文字处理文件、数据库记录、某些图像和视频信息。

根据此图，当我们使用无损压缩原始数据时，我们能够恢复所有原始数据。

有损压缩

有损压缩是压缩数据的过程，但无法 100% 恢复原始数据。这种压缩能够提供高度压缩，并且压缩结果将是更小的压缩文件。但在该过程中，一些视频帧、声波和原始像素将被永久删除。

压缩率越高，文件大小越小。需要完全恢复的业务数据和文本永远不会使用有损压缩。没有人喜欢丢失信息，但有很多文件非常大，我们没有足够的空间来维护所有原始数据，或者很多时候我们根本不需要所有原始数据。例如，视频、照片和音频录制文件，用于捕捉我们世界的 Allure。在这种情况下，我们使用有损压缩。

根据此图，当我们使用有损压缩原始数据时，我们只能恢复部分数据。我们无法恢复 100% 的原始数据。

下一个主题计算机组织中的 ALU 和数据路径

计算机组织中的数据表示

数据表示

表示数字

表示文本

表示位和字节

数据压缩

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

COA 教程

基本 CO 和设计

计算机指令

数字逻辑电路

卡诺图简化

组合电路

触发器

数字元件

寄存器传输

微操作

内存组织

流水线

其他

计算机组织中的数据表示

数据表示

表示数字

表示文本

表示位和字节

数据压缩

相关帖子

放大器中负反馈的重要性/必要性

AVR 微控制器中的条件分支指令

基于存储器与基于寄存器的寻址模式

AVR 微控制器中的分支指令

简化指令计算机

计算机组织中的外部存储器

电位和电位差

计算机体系结构中的寻址模式

SIMD

二进制数系统中算术加法中的溢出

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器