Java 查找文本文件中出现次数最多的单词的程序

2025年1月8日 | 阅读需时 2 分钟

在此程序中,我们需要找到给定文本文件中重复最多的单词。这可以通过使用文件指针以读取模式打开文件来完成。逐行读取文件。一次将一行拆分并存储在数组中。遍历数组并找到每个单词的频率,然后将频率与maxcount进行比较。如果频率大于maxcount,则将频率存储在maxcount中,并将相应单词存储在变量word中。程序中使用的数据文件data.txt的内容如下所示。

data.txt

计算机程序是当计算机执行时执行特定任务的指令集合。

计算机需要程序才能运行。

计算机程序通常由计算机程序员以编程语言编写。

一组计算机程序、库和相关数据统称为软件。

计算机程序可以按功能进行分类,例如应用软件和系统软件。

算法

  • 步骤 1: 开始
  • 步骤 2: 定义 String line, word = ""
  • 步骤 3: 设置 count =0, maxCount =0
  • 步骤 4: 定义 ArrayList<String> words
  • 步骤 5: 使用 FileReader 以读取模式打开文件。
  • 步骤 6: 从文件中读取行
  • 步骤 7: 通过循环,将每行转换为小写。
  • 步骤 8: 移除标点符号。
  • 步骤 9: 将行拆分并存储在字符串数组[]中。
  • 步骤 10: 将上一步生成的全部单词添加到 words 中。
  • 步骤 11: 设置 i=0。重复步骤 12 到步骤 17,直到 i<words.size()
  • 步骤 12: 设置 count =1
  • 步骤 13: 设置 j=i+1。重复步骤 14 到 15,直到 j<words.size()
  • 步骤 14: 如果(words.get(i).equals(words.get(j))) 则 count = count+1。
  • 步骤 15: j = j+1
  • 步骤 16: 如果 count>maxCount
    然后
    maxCount = count
    word =words.get(i)
  • 步骤 17: i=i+1
  • 步骤 18: 打印 word
  • 步骤 19:结束

程序

输出

Most repeated word: computer
下一个主题Java 程序