C++ 中的最小基因突变

2025年5月13日 | 阅读 4 分钟

问题描述

此问题中的起始基因字符串和结束基因字符串都由八个字符组成，并且由字母“A”、“C”、“G”和“T”构成。此外，我们还有一个合法的基因突变库。一个基因必须存在于该库中，才能被视为有效突变。突变定义为基因字符串中单个字符的改变。

当前的任务是找到将起始基因转化为结束基因所需的最少突变。如果无法仅使用库中的合法突变从起始基因到达结束基因，我们必须返回 -1。重要的是要记住，起始基因之后的每个步骤都必须涉及库中存在的突变；即使起始基因不存在，它也是有效的。

基因字符串突变是潜在字符集中单个字符的改变。例如，**_‘AACCGGTT’_** 变为 **_‘AACCGGTA’_** 是一种突变。

直觉

可以使用广度优先搜索 (BFS) 或深度优先搜索 (DFS) 来解决此问题。但是，BFS 更适合确定无权图中的最短路径，这类似于确定所需的最少突变。
该解决方案的基本思想是将每个基因字符串视为图的节点，并将每个合法突变视为连接两个节点的边。
使用 BFS，我们逐层检查图，从起始基因到结束基因。
由于 BFS 确定从起始节点到结束节点的最短路径（最少突变），因此它非常适合这种情况。

BFS 的关键步骤如下：

首先，从库中初始化一个集合，以快速确定突变是否合法。
启动一个队列，其中包含已初始化的起始基因和突变计数为 0。
之后，检查字典以确定每个字符的潜在突变。出队一个元素，然后遍历其字符，根据突变的可能性单独更改每个字符。
如果新突变合法（在库中），则将其入队，计数加一。
如果我们到达最后一个基因，则返回突变数量。
如果队列已满但未找到最后一个基因，则返回 -1。
通过应用此 BFS 方法，我们以最少的步骤探索每个潜在的基因突变，如果可行，确保达到目标基因所需的最少突变。

解决方法

解决方案中使用的算法，称为**_广度优先搜索 (BFS)_**，用于搜索或遍历树或图数据结构。在进入下一深度级别的节点之前，它会调查当前深度级别的相邻节点。实现中包含以下数据结构、算法和模式：

Set

集合的初始化来自库，在确定基因字符串是否存在时提供 O(1) 的复杂度。

队列（双端队列）

使用由双端队列数据结构组成的队列来实现 BFS。对象在一端附加，在另一端移除，模拟队列的先进先出 (FIFO) 特性。

哈希图

为了显示单个字符的潜在变体，字典 MP 将每个字符绑定到其他三个字符。这使得在任何给定点确定基因字符串的突变是否可行变得简单。

图的逐层遍历

该算法逐层遍历图。它使用 BFS 方法对其进行检查，将所有可从当前基因字符串通过单个突变访问的基因字符串视为邻居。

提前停止

如果在探索过程中发现了结束基因，则该函数会立即返回达到此状态所需的突变（步骤）数量。

图剪枝

每当在库中发现新的、有效的基因字符串时，都会将其从集合中删除，以防止基因字符串被重新访问，从而陷入循环。这保证了每个基因字符串只访问一次。

示例

让我们举一个例子来说明 C++ 中的最小基因突变。

 
#include <bits/stdc++.h>
using namespace std;
class Solution {
   public:
   vector <string> putStrt(string st){
      vector <string> r;
      for(int x=0; x<st.size();x++){
         string temp = st.substr(0, x) + "*" + st.substr(x + 1);
         r.push_back(temp);
      }
      return r;
   }
   int minMut(string start, string end, vector<string>& bank) {
      unordered_map < string, vector <string> > graph;
      for(int x=0;x<bank.size();x++){
         string st = bank[x];
         vector <string> out = putStrt(bank[x]);
         for(int y=0; y<out.size();y++){
            graph[out[y]].push_back(st);
         }
      }
      queue <string> q;
      q.push(start);
      set <string> visited;
      visited.insert(start);
      for(int lvl = 1; !q.empty(); lvl++){
         int sz = q.size();
         while(sz--){
            string node = q.front();
            q.pop();
            vector <string> out = putStrt(node);
            for(int i = 0; i < out.size(); i++){
               string u = out[i];
               for(int j = 0; j < graph[u].size(); j++){
                  string v = graph[u][j];
                  if(visited.count(v)) continue;
                  if(v == end) return lvl;
                  visited.insert(v);
                  q.push(v);
               }
            }
         }
      }
      return -1;
   }
};
int main(){
   Solution ob;
   vector<string> v = {"AACCGGTA", "AACCGCTA", "AAACGGTA"};
   cout << (ob.minMut("AACCGGTT", "AAACGGTA", v));
}   

输出

下一个主题C++ 中的子网计算器

C++ 中的最小基因突变

问题描述

直觉

BFS 的关键步骤如下：

解决方法

示例

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

C++ 教程

C++ 控制语句

C++ 函数

C++ 数组

C++ 类和对象

C++ 构造函数

C++ 继承

C++ 多态

C++ 抽象

C++ 命名空间

C++ 模板

C++ 字符串

C++ 指针

信号处理

C++ 异常

C++ 文件与流

C++ STL 教程

面试题

选择题

C++ 程序

C++ STL Stack

C++ STL Bitset

C++ STL Deque

C++ STL List

C++ STL Map

C++ STL Math

C++ STL priority_queue

C++ STL Queue

C++ STL Multiset

C++ STL Multimap

C++ STL Set

C++ STD Strings

C++ STL Vector

C++ 操纵符

C++ STL Algorithms

C++ Algorithm

C++ Iterators

C++ 杂项

C++ 中的最小基因突变

问题描述

直觉

BFS 的关键步骤如下：

解决方法

示例

相关帖子

C++ 中的 std::ctype::widen 和 do_widen

C++ 中的 Legendre 定理：概念、算法、实现

C++ 中打印无表情图案的程序

C++ 中的油漆栅栏算法

C++ Ford Fulkerson 算法

C++ 中的五面体数

C++ Std::is_base_of Base,Derived ::value

如何在 C++ 中的 Lambda 函数中捕获 std::vector

C++ 中的 std::get_money

C++ 代码计算数组的局部极值

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题