Java 中的语音处理

2024 年 9 月 10 日 | 阅读 7 分钟

Java 编程语言通过 **Java Speech API** 的内置接口，可以实现将文本转换为人类可识别的语音。它用于增强用户体验和便捷性。该 API 定义了一个跨平台 API，用于支持命令和控制识别器以及语音合成器。**文本转语音** (TTS) 或 **朗读** 是一种辅助技术，它使用户能够听到数字文本。辅助技术是为残疾人士构建的辅助、适应性和康复设备的工具。

如今，语音处理在各种应用和自助服务终端中得到广泛应用。一个例子是智能手机中的文本转语音辅助功能，以及像 Domino's 这样的应用程序，它们会朗读选项/菜单给用户。

让我们详细了解 Java Speech API 以及如何将文本转换为语音。

在 Java 中转换文本为语音

Java Speech API (JSAPI)

Java Speech API 允许 Java 应用程序在用户界面中启用语音技术。Java Speech API 定义的跨平台 API 支持命令控制识别器、听写系统和语音合成器。它不包含在 Java Development Kit 中，因此我们需要第三方语音 API 来鼓励提供多种实现。Java Speech 只是一个规范，它没有自己的实现。

在本节中，我们将使用 FreeTTS 的开源实现，但也有其他实现，例如 Cloudscape。

考虑 FreeTTS 相关以下类，可用于将文本转换为语音。

javax.speech.Central 类

这是一个单例类，包含在“javax.speech”包中。它是访问语音引擎功能的主要接口。它是所有语音和输出能力的第一个接入点。availableSynthesizers 和 createSynthesizer 等方法仅属于该类。它提供了检测、选择和创建语音识别和语音合成器的能力。

javax.speech.synthesis.SynthesiserModeDesc 类

该类保存了合成器所有必需的属性。属性列表包括引擎名称、模式名称、区域设置和正在运行的合成器。

引擎名称用于引用程序中使用的引擎的名称。模式名称属性特定于引擎，并将合成器限制在能够朗读文本的合成器中。区域设置属性用于限制国际合成器。最后，正在运行的合成器属性用于将返回的合成器限制为仅那些已加载到内存中的合成器。

引擎：它定义在 **javax.speech** 包中，并被视为所有其他语音引擎的父接口。它包含 **Recognizer** 和 **synthesizer**。因此，语音输入和语音输出可以轻松完成。

用于创建语音引擎的方法是 createRecognizer() 和 createSynthesizer()。这两个方法都只接受一个参数 EngineModeDesc，它定义了创建引擎所需的所有属性。作为参数传递的是 RecognizerModeDesc 或 SynthesizerModeDesc 等子类之一。

模式描述符的作用是定义引擎所需的所有属性集。例如，SynthesizerModeDesc 可以描述一个带有男声的瑞士德语合成器。类似地，RecognizerModeDesc 可以描述一个支持日语听写的识别器。

javaxspeech.synthesis.Synthesizer 类

它也被定义为一个接口，提供语音合成功能作为主要访问方式。在使用合成器之前，必须先分配合成器。SynthesizerModeDesc 添加了以下两个属性，第一个是合成器提供的声音列表，另一个是合成器启动时要加载的声音。

第三方语音 API

Java 编程语言提供了以下第三方语音 API 来将文本转换为语音。

FreeTTS
IBM 的 Java 语音
The Cloud Garden
Conversa Web 3.0
Festival

让我们详细讨论上面提到的库。

FreeTTS

FreeTTS 是一个完全用 Java 编程语言编写的开源编译系统。它是一个小巧、快速的运行时开源文本转语音合成引擎。当使用 FreeTTS API 时，计算机可以真正地说话。通俗地说，它仅仅是人类语音的人工合成，将普通文本转换为语音。

为了在 Java 中实现语音合成，请遵循以下步骤。

在此处以 zip 文件夹形式下载 FreeTTS
解压 zip 文件，然后选择 **freetts-1.2.2-bin/freetts-1.2/lib/jsapi.exe**
打开 jsapi.exe 文件并安装它。
将创建一个名为“jsapi.jar”的 jar 文件。FreeTTS 库包含在这个 JAR 库中，您需要将其包含到项目中。
在您的 IDE 中创建一个新的 Java 项目。
将此 jsapi.jar 文件包含到您的项目中。
根据您的需求编写项目代码。
最后，执行项目以获得所需的输出。

Java 中流行的文本转语音转换包如下：

1. 包 javax.speech

“javax.speech”包定义了定义引擎基本功能的所有类和接口。语音合成器和语音识别器都是语音引擎实例。“javax.speech.synthesis”和“javax.speech.recognition”包扩展了语音合成器和语音识别器的基本功能和特定能力。

让我们看看在应用程序中使用语音引擎的基本流程

确定应用程序对引擎的功能需求。例如，要使用的语言。
找到并创建一个满足上述要求的引擎。
为所选引擎分配资源。
开始处理引擎的操作。
完成后，释放引擎的资源。

考虑以下将文本转换为语音的 Java 程序。

TextToSpeechExample2.java

// importing the javax.seech package and its libraries
import javax.speech.* ;      
import java.util.* ;      
import javax.speech.synthesis.* ;      
public class TextToSpeechExample2  
{      
    // variable to hold the text that will be audible
    String audible ;   
    
    // function that makes text audible  
    public void audible( String speak, String voicename )      
    {      
    // assigning the user entered text in the variable defined 
    audible = speak ;      
    String voiceName = voicename ;      
    
    try      
    {      
    // setting the properties( engine name, mode name, locale and running properties ) of SynthesizerModeDesc
    SynthesizerModeDesc synth = new SynthesizerModeDesc( null, " general ", Locale.US, null, null ) ;      
    // Synthesizer interface generates sound and the createSynthesizer( ) method creates the Synthesizer  
    Synthesizer synthesizer = Central.createSynthesizer( synth ) ;     
    // allocating the Synthesizer  
    synthesizer.allocate( ) ;      
    // woking on the operations of the engine 
    synthesizer.resume( ) ;       
    synth = ( SynthesizerModeDesc ) 
    synthesizer.getEngineModeDesc( ) ;      
    Voice[ ] voices = synth.getVoices( ) ;        
    Voice voice = null ;  
    
    // loop to iterate over the voice until the condition becomes false  
    for ( int i = 0 ; i < voices.length ; i++ )     
    {      
    if ( voices[ i ].getName( ).equals( voiceName ) )     
    {      
    voice = voices[ i ] ;      
    break ;       
    }       
}      
 synthesizer.getSynthesizerProperties( ).setVoice( voice ) ;      
 System.out.print( " Speaking : " + speaktext ) ;      
 synthesizer.speakPlainText( speaktext, null ) ;      
 synthesizer.waitEngineState( Synthesizer.QUEUE_EMPTY ) ;  

 // deallocating the resources of the engine
 synthesizer.deallocate( ) ;      
}      
catch ( Exception e )     
{      
String message = " speech.properties missing in " + System.getProperty( " user.home " ) + " \n " ;      
System.out.println( " " + e ) ;      
System.out.println( message ) ;      
}      
}      
public static void main( String args[ ] )      
{      
    // creating an object of the class TexttoSpeech
    TextToSpeech txt = new TextToSpeech( ) ;   
    txt.audible( " Learning one new idea won't make you a genius, but a commitment to lifelong learning can be tranformative. ", " kevin16 " ) ;     
}      
} 

要获得输出，请执行程序并收听我们在上面程序中指定的文本。

2. 包 com.sun.speech

com.sun.speech 包定义了定义引擎基本功能的所有类和接口。com.sun.speech.freetts 包含 FreeTTS 合成引擎的实现。大多数与语言和语音无关的代码可以在这里找到。

JSAPI 还允许我们通过使用 setRate()、setPitch() 和 setVolume() 等方法来设置语速、音高和音量。例如，请考虑以下 Java 程序。

Voice

它是 FreeTTS 的中央处理点，它接收 FreeTTSSpeakable 作为输入，并将与之相关的文本转换为语音并生成相应的音频。Voice 对象通过 Voice.speak 方法接受 FreeTTSSpeakable。

VoiceManager

它是 FreeTTS 可用声音的中央存储库。它用于获取声音。

考虑以下导入 com.sun.speech 包并使用上述方法的 Java 程序。

TextToSpeech.java

// importing com.sun.speech package
import com.sun.speech.freetts.Voice ;  
import com.sun.speech.freetts.VoiceManager ;  
public class TextToSpeech 
{  
public static void main( String args[ ] )   
{  
    // creating an object of the Voice class  
    Voice voice ;  
    // getting voice, here we have used kevin ( male version ) voice  
    voice = VoiceManager.getInstance( ).getVoice( " kevin " ) ;  
    // checks if there is any information in the object voice 
    if ( voice != null )   
    {  
        // the Voice class allocate( ) method allocates this voice  
        voice.allocate( ) ;  
    }  
    try   
    {  
        // sets the rate ( words per minute i.e. 100 ) of the speech  
        voice.setRate( 100 ) ;  
        // sets the baseline pitch ( 150 ) in hertz   
        voice.setPitch( 150 ) ;  
        // sets the volume ( 10 ) of the voice   
        voice.setVolume( 8 ) ;   
        // the speak( ) method speaks the specified text 
        voice.speak( " Learning one new idea won't make you a genius, but a commitment to lifelong learning can be tranformative. " ) ;  
    }  
    catch( Exception e )  
    {  
        e.printStackTrace( ) ;  
    }  
}  
}  

要获得输出，请执行程序并收听我们在上面程序中指定的文本。

下一主题Java 输出格式化

Java 中的语音处理

在 Java 中转换文本为语音

Java Speech API (JSAPI)

javax.speech.Central 类

javax.speech.synthesis.SynthesiserModeDesc 类

javaxspeech.synthesis.Synthesizer 类

第三方语音 API

FreeTTS

2. 包 com.sun.speech

Voice

VoiceManager

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

Java Conversion

Java Misc

Java 中的语音处理

在 Java 中转换文本为语音

Java Speech API (JSAPI)

javax.speech.Central 类

javax.speech.synthesis.SynthesiserModeDesc 类

javaxspeech.synthesis.Synthesizer 类

第三方语音 API

FreeTTS

2. 包 com.sun.speech

Voice

VoiceManager

相关帖子

Java Color Codes

ArrayList Implementation in Java

FieldPosition getEndIndex() method in Java with Example

Java 8 vs Java 11

Java 中作为参数的对象

Java 中数字阶乘的数字计数

Private Constructor in Java

Java 中定义宏

Java 中的动态变量

Difference Between C and Java

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器