Convert Text-to-Speech in Java

2025年5月10日 | 阅读 6 分钟

文本转语音（TTS）或朗读是一种辅助技术（它是指辅助、自适应和康复设备，用于残疾人士），可以朗读数字文本。文本转语音（TTS）转换是 ATM、在线翻译器、文本扫描仪等智能设备的高级功能。在应用程序中实现文本转语音技术，由于相关的可访问性，可以增强客户体验。如今，它被广泛用于将书籍制作成有声读物。甚至一个名为Audible的流行平台也通过使用 TTS 技术提供数千本有声读物。大多数智能设备都带有此功能。

在本节中，我们将讨论Java Speech API FreeTTS以及如何使用 Java 程序将文本转换为语音。

Java Speech API (JSAPI)

Java 提供了Speech API，它将语音技术集成到 UI 中。它定义了一个跨平台 API，用于支持命令和控制识别器、听写系统和语音合成器。它不是 JDK 的一部分。它是一个第三方语音 API，旨在鼓励多种实现的可用性。TTS 系统的架构如下图所示。

JSAPI 包括两个规范，即JSML（Java Speech API 标记语言）和JSGF（Java Speech API 语法格式）。JSML 定义了用于标记文本以输入到语音合成器的标准文本格式。而 JSGF 定义了为语音识别器提供语法的标准文本格式。下图说明了文本转语音的框图。

JSAPI 在将文本转换为语音时需要四样东西。

Engine (引擎)

它是 javax.speech 包中定义的所有语音引擎的父接口。语音引擎包括 Recognizer（识别器）和 Synthesizer（合成器）。因此，它同时处理语音输入和语音输出。

createRecognizer() 和 createSynthesizer() 方法用于创建语音引擎。这两个方法都接受一个参数 EngineModeDesc，该参数定义了要创建的引擎所需的属性。

该参数可以是其子类之一，即 RecognizerModeDesc 或 SynthesizerModeDesc。

模式描述符定义了一组引擎所需的属性。例如，SynthesizerModeDesc 可以描述一个具有男性声音的瑞士德语合成器。类似地，RecognizerModeDesc 可以描述支持日语听写的识别器。

Central (中央)

它是属于 javax.speech 包的类。它是所有语音输入和输出能力器的初始接入点。它提供了定位、选择和创建语音识别器和语音合成器的能力。

SynthesizerModeDesc (合成器模式描述符)

它扩展了 EngineModeDesc，并包含了语音合成器特有的属性。

Synthesizer (合成器)

它也是一个提供语音合成能力主要访问权限的接口。SynthesizerModeDesc 添加了两个属性：合成器提供的声音列表和在合成器启动时要加载的声音。

第三方语音 API

Java 提供了以下第三方语音 API，可用于将文本转换为语音。

FreeTTS
IBM 的 Java 语音
The Cloud Garden
Conversa Web 3.0
Festival

在本节中，我们将讨论广泛使用的语音合成 APIFreeTTS。

FreeTTS

FreeTTS 是一个完全用 Java 编程语言编写的开源语音合成系统。它基于festival-lite，也称为 CMU Flite。它是一个小型、快速的运行时开源文本转语音合成引擎。通过使用 FreeTTS API，我们可以让计算机说话。换句话说，我们可以说它是人类语音的人工制作，它将普通文本转换为语音。

为了创建一个 Java 程序，我们首先需要下载并安装FreeTTS API。请按照以下步骤操作。

步骤 1：下载 FreeTTS API（zip 格式）。

步骤 2：解压 zip 文件，该文件提供两个文件夹，如下图所示。

步骤 3：访问目录 C:\freetts-1.2.2-bin\freetts-1.2\lib\jsapi.exe

步骤 4：通过双击 jsapi.exe 文件安装 jsapi。通过点击 I Agree 按钮接受许可协议。

现在点击 Close 按钮。上述过程会在 jsapi.exe 文件所在的相同位置生成一个名为 jsapi.jar 的 jar 文件。这是一个 jar 文件，其中包含创建文本转语音应用程序所需的 FreeTTS 库。

我们已正确安装 JSAPI。

步骤 5：现在，我们将像平常一样在 IDE 中创建一个 Java 项目。在本例中，我们创建了一个名为 TTS 的 Java 项目。在此项目中，我们创建了一个名为 TextToSpeechExample1 的类并编写了以下代码。

注意：在运行程序之前，我们必须确保以下 jar 文件已包含在我们的项目中。

步骤 6：导航到目录 C:\freetts-1.2.2-bin\freetts-1.2 并复制 speech.properties 文件，然后将属性文件粘贴到主目录中。在本例中，目录是 C:\Users\Anubhav。

让我们创建一个将文本转换为语音的 Java 程序。

文本转语音 Java 程序

TextToSpeechExample1.java

import java.util.Locale;
import javax.speech.Central;
import javax.speech.synthesis.Synthesizer;
import javax.speech.synthesis.SynthesizerModeDesc;
public class TextToSpeechExample1 
{
public static void main(String args[])
{
try 
{
//setting properties as Kevin Dictionary
System.setProperty("freetts.voices", "com.sun.speech.freetts.en.us" + ".cmu_us_kal.KevinVoiceDirectory");
//registering speech engine
Central.registerEngineCentral("com.sun.speech.freetts" + ".jsapi.FreeTTSEngineCentral");
//create a Synthesizer that generates voice
Synthesizer synthesizer = Central.createSynthesizer(new SynthesizerModeDesc(Locale.US));
//allocates a synthesizer
synthesizer.allocate();
//resume a Synthesizer
synthesizer.resume();
//speak the specified text until the QUEUE become empty
synthesizer.speakPlainText("GeeksforGeeks", null);
synthesizer.waitEngineState(Synthesizer.QUEUE_EMPTY);
//deallocating the Synthesizer
synthesizer.deallocate();
}
catch (Exception e) 
{
e.printStackTrace();
}
}
}

现在运行上述程序。由于输出只能听到，因此无法在此处显示。所以，请自行尝试。

TextToSpeechExample2.java

import javax.speech.*;    
import java.util.*;    
import javax.speech.synthesis.*;    
public class TextToSpeechExample2    
{    
//text to listen
String speaktext; 
//function that makes text audible
public void dospeak(String speak, String voicename)    
{    
//assigning text to speak variable
speaktext=speak;    
String voiceName =voicename;    
try    
{    
//the SynthesizerModeDesc class inherits the EngineModeDesc with properties
//it inherits the engine name, mode name, locale, and running properties 
SynthesizerModeDesc desc = new SynthesizerModeDesc(null, "general",  Locale.US, null, null);    
//Synthesizer interface generates sound and the createSynthesizer() method creates the Synthesizer
Synthesizer synthesizer =  Central.createSynthesizer(desc);    
//allocates a Synthesizer
synthesizer.allocate();    
//resumes a Synthesizer
synthesizer.resume();     
desc = (SynthesizerModeDesc)  synthesizer.getEngineModeDesc();     
Voice[] voices = desc.getVoices();      
Voice voice = null;
//loop iterates over the voice until the condition becomes false
for (int i = 0; i < voices.length; i++)    
{    
if (voices[i].getName().equals(voiceName))    
{    
voice = voices[i];    
break;     
}     
}    
synthesizer.getSynthesizerProperties().setVoice(voice);    
System.out.print("Speaking: "+speaktext);    
synthesizer.speakPlainText(speaktext, null);    
synthesizer.waitEngineState(Synthesizer.QUEUE_EMPTY);    
synthesizer.deallocate();    
}    
catch (Exception e)   
{    
String message = " missing speech.properties in " + System.getProperty("user.home") + "\n";    
System.out.println(""+e);    
System.out.println(message);    
}    
}    
public static void main(String args[])    
{    
TextToSpeechExample2 obj=new TextToSpeechExample2(); 
obj.dospeak("Don't limit yourself. Many people limit themselves to what they think they can do. You can go as far as your mind lets you. What you believe, remember, you can achieve.", "kevin16");    
}    
}

JSAPI 还允许我们使用 setRate()、setPitch() 和 setVolume() 方法分别设置声音的速率、音高和音量。例如，请看以下 Java 程序。

在以下程序中，请注意，我们使用了 com.sun.speeach 包，而不是 javax.speech 包。

TextToSpeechExample3.java

import com.sun.speech.freetts.Voice;
import com.sun.speech.freetts.VoiceManager;
public class TextToSpeechExample3
{
public static void main(String args[]) 
{
//creating an object of the Voice class
Voice voice;
//getting voice, here we have used kevin (male version) voice
voice = VoiceManager.getInstance().getVoice("kevin");
if (voice != null) 
{
//the Voice class allocate() method allocates this voice
voice.allocate();
}
try 
{
//sets the rate (words per minute i.e. 190) of the speech
voice.setRate(190);
//sets the baseline pitch (150) in hertz 
voice.setPitch(150);
//sets the volume (10) of the voice 
voice.setVolume(10); 
//the speak() method speaks the specified text
voice.speak("Don't limit yourself. Many people limit themselves to what they think they can do. You can go as far as your mind lets you. What you believe, remember, you can achieve.");
}
catch(Exception e)
{
e.printStackTrace();
}
}
}

注意：上述程序的输出是可听的。

下一主题Java-查找平面图最大团的程序

Convert Text-to-Speech in Java

Java Speech API (JSAPI)

Engine (引擎)

Central (中央)

SynthesizerModeDesc (合成器模式描述符)

Synthesizer (合成器)

第三方语音 API

FreeTTS

注意：在运行程序之前，我们必须确保以下 jar 文件已包含在我们的项目中。

文本转语音 Java 程序

注意：上述程序的输出是可听的。

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

Java Conversion

Java Misc

Convert Text-to-Speech in Java

Java Speech API (JSAPI)

Engine (引擎)

Central (中央)

SynthesizerModeDesc (合成器模式描述符)

Synthesizer (合成器)

第三方语音 API

FreeTTS

注意：在运行程序之前，我们必须确保以下 jar 文件已包含在我们的项目中。

文本转语音 Java 程序

注意：上述程序的输出是可听的。

相关帖子

Java 中的数字补码问题

Image Processing in Java: Image Edge Detection Operators in Digital Image Processing

Java 的 CI/CD 工具

Java 复制数组

Java 中二维矩阵中 0 到中心的 farthest 距离

Multithreading Hierarchy in Java

Java DRY 原则

Java 中 ChoiceFormat hashCode() 方法及示例

如何在 Java 中解决已弃用错误

Java 方法签名

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器