使用 Python 开发电影语音助手

12 Apr 2025 | 7 分钟阅读

语音助手确实在现代生活中扮演着重要角色，因为它们为人们提供了便捷的交互方式和节省时间。例如，设置提醒和根据口味询问电影，语音助手会给出答案。为语音助手提供电影推荐，可以增强任务的功能性、交互性和探索性，并以一种无需动手或用手的方式进行导航。本项目结合了强大的语音识别、文本转语音转换以及预定义的电影推荐库，构建成一个单一的应用程序。

该助手将通过监听用户偏好来聆听用户，并从他们的电影偏好中挑选一个类型，以做出最佳推荐。通过利用 speech_recognition，该助手可以捕获语音输入并将其转换为文本，以便进行分析。应用 pyttsx3 库，助手现在可以说话了，这创造了更具交互性的用户界面。这些推荐来自一个包含流行类型的预定义字典：动作、喜剧、剧情等。

用于开发 Python 电影语音助手的库

以下是语音助手开发中使用的 Python 库列表

1. SpeechRecognition

目的：从音频转录文本。

工作原理

捕获麦克风的音频输入。
使用在线 API，如 Google Speech Recognition，将音频转录为文本。

关键函数

listen(): 从麦克风录制音频
recognize_google(): 使用 Google 的语音识别 API 将音频转换为文本

为什么需要它

它允许程序理解用户给出的语音命令。

2. pyttsx3

目的：将文本翻译成语音（文本到语音）。

工作原理

它实例化一个 TTS 引擎，该引擎会朗读文本字符串。
支持多种声音、语速变化和音量设置。

核心方法

init(): 初始化 TTS 引擎。
say(text): 将文本添加到朗读队列。
runAndWait(): 执行朗读

为什么使用它

通过朗读电影推荐或错误消息，向用户提供可听的输出。

3. requests

用途：从在线 API（如 The Movie Database）获取数据。

工作原理

向 API 端点发送 HTTP 请求。
解析 JSON 响应以获取信息，例如电影标题。

主要功能

get(url): 向 URL 发送 GET 请求
json(): 将响应解析为 Python 字典

为什么有必要

它能根据用户输入（例如“动作片”）即时检索电影推荐。

4. pyaudio

用途：这是一个低级访问库，用于从麦克风捕获音频。

它充当 SpeechRecognition 的后端库，并与麦克风硬件接口以捕获音频。
实时捕获音频流。

关键函数

通过 SpeechRecognition 使用。

为什么需要它

它允许程序访问麦克风并捕获用户的语音输入。

程序工作流程

步骤 1：初始化文本到语音：使用 pyttsx3 欢迎用户并解释功能。

步骤 2：监听用户输入：使用 SpeechRecognition 和 pyaudio 捕获用户语音并将其转换为文本。

步骤 3：处理输入：解析输入文本以确定用户想要的电影类型（例如“动作片”、“喜剧片”）。

步骤 4：获取电影推荐

使用 TMDB API，通过 requests 库根据所选类型获取电影。
解析 JSON 响应以获取电影标题

步骤 5：推荐

让 pyttsx3 朗读推荐列表
控制台打印，有助于简化操作

错误处理

如果没有任何推荐可用，或者出现任何错误（例如网络断开），则通知用户。

这种组合的优点

实时交互：用户可以通过语音进行输入和输出与程序进行交互。
动态内容：通过在线 API 获取最新的电影推荐。
用户友好：无需打字，因此对非技术用户也易于访问。

代码 1

import speech_recognition as sr
import pyttsx3
# Predefined movie recommendations
MOVIE_RECOMMENDATIONS = {
    "action": ["John Wick", "Mad Max: Fury Road", "The Dark Knight"],
    "comedy": ["Superbad", "The Hangover", "Step Brothers"],
    "drama": ["The Shawshank Redemption", "Forrest Gump", "The Godfather"],
    "horror": ["The Conjuring", "Hereditary", "It"],
    "romance": ["The Notebook", "Pride and Prejudice", "La La Land"],
    "sci-fi": ["Inception", "Interstellar", "The Matrix"],
}
# Function to speak out text
def speak(text):
    engine = pyttsx3.init()
    engine.say(text)
    engine.runAndWait()
# Function to capture voice input
def listen_to_user():
    recognizer = sr.Recognizer()
    with sr.Microphone() as source:
        speak("Listening for your movie preferences...")
        try:
            print("Listening...")
            audio = recognizer.listen(source, timeout=5)
            command = recognizer.recognize_google(audio)
            print(f"You said: {command}")
            return command.lower()
        except sr.UnknownValueError:
            speak("Sorry, I couldn't understand you. Please repeat.")
            return None
        except sr.RequestError:
            speak("There was an error with the speech recognition service.")
            return None
        except Exception as e:
            print(f"Error: {e}")
            speak("An error occurred. Please try again.")
            return None
# Function to get movie recommendations based on genre
def get_recommendations(genre):
    return MOVIE_RECOMMENDATIONS.get(genre, [])

# Main function to run the assistant
def main():
    speak("Hello! I am your movie assistant. What type of movie would you like to watch?")
    command = listen_to_user()
    if command:
        # Match the genre from the command
        found_genre = None
        for genre in MOVIE_RECOMMENDATIONS:
            if genre in command:
                found_genre = genre
                break 
        if found_genre:
            speak(f"Here are some {found_genre} movies you might enjoy:")
            movies = get_recommendations(found_genre)
            for movie in movies:
                print(movie)
                speak(movie)
        else:
            speak("Sorry, I don't have recommendations for that genre. Try action, comedy, drama, horror, romance, or sci-fi.")
    else:
        speak("Please try again with a clear request.")
if __name__ == "__main__":
    main()

说明

这是一个用 Python 编写的声控电影推荐助手脚本。它使用存储在字典中的预定义电影推荐，按类型（动作、喜剧、剧情）组织。speech_recognition 库捕获用户的语音并将其转换为文本，而 pyttsx3 提供语音反馈。

当用户开始谈论他们喜欢的电影类型时，助手会开始监听一些关键词，以便与预定义的类型列表进行比较。如果找到匹配项，助手会说出与匹配类型相对应的电影推荐。如果识别出的类型未被检测到或语音不清晰，程序将要求用户重试。

错误处理将识别未知语音或不可用的类型，从而提供无缝的用户体验。此脚本演示了语音交互如何在简单而交互的电影发现过程中应用，并且还可以通过与外部服务的 API 集成或更高级的功能进一步扩展。

代码 2

import speech_recognition as sr
import pyttsx3
import requests
# Replace this with your TMDB API key
API_KEY = "123456789abcdef123456789abcdef12"  # Replace with your actual key

# Function to speak out text
def speak(text):
    engine = pyttsx3.init()
    engine.say(text)
    engine.runAndWait()

# Function to capture voice input
def listen_to_user():
    recognizer = sr.Recognizer()
    with sr.Microphone() as source:
        speak("Listening for your movie preferences...")
        try:
            print("Listening...")   # here, we will print this message to the output screen
            audio = recognizer.listen(source, timeout=5)
            command = recognizer.recognize_google(audio)
            print(f"You said: {command}")
            return command.lower()
        except sr.UnknownValueError:
            speak("Sorry, I couldn't understand you. Please repeat.")
            return None
        except sr.RequestError:
            speak("There was an error with the speech recognition service.")
            return None
        except Exception as e:
            print(f"Error: {e}")
            speak("An error occurred. Please try again.")
            return None

# Function to fetch movies from TMDB API
def fetch_movies(genre):
    url = f"https://api.themoviedb.org/3/search/movie?api_key={API_KEY}&query={genre}"
    try:
        response = requests.get(url)
        print(f"API URL: {url}")
        print(f"Status Code: {response.status_code}")
        if response.status_code == 200:
            data = response.json()
            if 'results' in data and data['results']:
                movies = [movie['title'] for movie in data['results'][:5]]  # Top 5 movies
                return movies
            else:
                print("No results found in the response.")
                return []
        else:
            print(f"Error fetching data from API: {response.status_code}")
            return []
    except Exception as e:
        print(f"Exception during API call: {e}")
        return []

# Main function to run the assistant
def main():
    speak("Hello! I am your movie assistant. What type of movie would you like to watch?")
    command = listen_to_user()
    if command:
        # Extract the genre or keyword
        genre = command.replace("movies", "").strip()
        speak(f"Searching for {genre} movies...")
        movies = fetch_movies(genre)
        if movies:
            speak("Here are some recommendations:")
            for movie in movies:
                print(movie)    # here, we will print movie name
                speak(movie)
        else:
            speak("Sorry, I couldn't find any movies matching your request.")
    else:
        speak("Please try again with a clear request.")

if __name__ == "__main__":
    main()

说明

这是一个提供电影助手语音控制的 Python 代码。它执行语音识别、文本到语音转换以及有关电影的实时信息检索。该助手首先使用 speech_recognition 库，捕获用户的语音输入并将其转换为文本以供处理。pyttsx3 库使助手能够说话，从而为用户提供交互式反馈。TMDB API 密钥根据用户偏好动态获取电影数据。核心逻辑是识别用户语音输入中的关键字或类型，使用 requests 库进行 API 请求，并从 API 响应中获取前 5 部电影推荐。如果存在与查询匹配的电影，助手会说出它们的标题；否则，它会给出一个备用消息来指导用户。

该脚本提供了关于语音不清晰、识别失败和 API 故障的错误处理。它保持流畅的交互，即使输入无效，连接也可能不稳定。该助手是动态且用户友好的：用户可以免提搜索电影。因此，进一步的功能可能包括个性化推荐或增强的过滤，使其成为语音技术如何与世界集成的一个最佳实际示例。

应用

个性化娱乐助手
1. 为用户提供电影推荐
2. 提高与客户沟通的便捷性
家庭电影系统
1. 连接智能家居设备，如 Alexa、Google Home 或定制系统，自动为连接的电视或流媒体设备提供电影建议
流媒体服务连接
1. 为 Netflix、Amazon Prime 或 Disney+ 等服务进行适当的扩展
2. 它可以成为用户语音搜索和推荐的提供者。
辅助功能解决方案
1. 通过基于语音的界面帮助残疾人选择电影。
娱乐客户服务
1. 电影院或票务网站使用这些来提供带有播放时间的电影建议。
程序员的学习实验
1. 上述示例是希望了解语音识别、文本到语音和 API 集成技术的开发人员的练习。
信息亭和公共领域
1. 安装在电影院、商场或公共区域，供用户发现附近播放的电影。
高级游戏机
1. 安装在游戏机上，用于基于语音的娱乐推荐。

下一主题下载-instagram-个人资料-图片-使用-python

使用 Python 开发电影语音助手

用于开发 Python 电影语音助手的库

程序工作流程

错误处理

这种组合的优点

应用

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

其他

使用 Python 开发电影语音助手

用于开发 Python 电影语音助手的库

程序工作流程

错误处理

这种组合的优点

应用

相关帖子

如何在Python中使用Seaborn热图的5种方法

使用Python构建Flutter应用

使用 Python 下载 Instagram 头像

Python中冒号':'运算符有什么作用

Python - 嵌套if语句

如何在Python中使用axis = 0和axis = 1

Python中的Title

使用Pandas和BeautifulSoup抓取HTML表格

解决CodeChef中Python的EOF错误

Python中的图数据结构

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器