深度优先搜索
深度优先搜索是一种在开发爬虫早期使用较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件) 。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索单独的一条链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束。
事实上,深度优先搜索属于图算法的一种,英文缩写为DFS即Depth First Search.其过程简要来说是对每一个可能的分支路径深入到不能再深入为止,而且每个节点只能访问一次.
举例说明之:下图是一个无向图,如果我们从A点发起深度优先搜索(以下的访问次序并不是唯一的,第二个点既可以是B也可以是C,D),则我们可能得到如下的一个访问过程:A->B->E(没有路了!回溯到A)->C->F->H->G->D(没有路,最终回溯到A,A也没有未访问的相邻节点,本次搜索结束).
简要说明深度优先搜索的特点:每次深度优先搜索的结果必然是图的一个连通分量.深度优先搜索可以从多点发起.如果将每个节点在深度优先搜索过程中的"结束时间"排序(具体做法是创建一个list,然后在每个节点的相邻节点都已被访问的情况下,将该节点加入list结尾,然后逆转整个链表),则我们可以得到所谓的"拓扑排序",即topological sort.
步骤
深度优先搜索(DFS)有两个重要的点:第一是当前怎么做,第二是下一步怎么做;模板如下:
public static void dfs (int step) { //判断边界,递归出口 //遍历每一种可能,经进行递归 for (int i = 1; i < n; i++) { dfs(step + 1); } }
1. find(方向:right) 在当前层寻找满足要求的节点(剪枝)。 这一步需要构建剪枝的要求;
2. forward(方向:down)当前节点满足要求,就进入下一层,重新开始find操作;
3. done(方向:right)当前节点满足要求,且到达最后一层,得到结果,并进入下一个节点,开始find;
4. back(方向:up)当遍历完了一个节点所有子节点时,就回溯到当前节点的兄弟节点,开始find。
思路
深度优先遍历图的方法是,从图中某顶点v出发:
(1)访问顶点v;
(2)依次从v的未被访问的邻接点出发,对图进行深度优先遍历;直至图中和v有路径相通的顶点都被访问;
(3)若此时图中尚有顶点未被访问,则从一个未被访问的顶点出发,重新进行深度优先遍历,直到图中所有顶点均被访问过为止。 当然,当人们刚刚掌握深度优先搜索的时候常常用它来走迷宫.事实上我们还有别的方法,那就是广度优先搜索(BFS).
算法
伪代码
bool visited[MaxVnum]; void DFS(Graph G,int v) { visited[v]= true; //从V开始访问,flag它 printf("%d",v); //打印出V for(int j=0;j<G.vexnum;j++) if(G.arcs[v][j]==1&&visited[j]== false) //这里可以获得V未访问过的邻接点 DFS(G,j); //递归调用,如果所有节点都被访问过,就回溯,而不再调用这里的DFS } void DFSTraverse(Graph G) { for (int v = 0; v < G.vexnum; v++) visited[v] = false; //刚开始都没有被访问过 for (int v = 0; v < G.vexnum; ++v) if (visited[v] == false) //从没有访问过的第一个元素来遍历图 DFS(G, v); }
c++源码
#include<iostream> #include<vector> #include<stack> #include<memory.h> using namespace std; vector<vector<int>> tree;//声明一个二维向量 int flag[10];//用于搜索到了节点i的第几个节点 stack <int>stk;//声明一个堆栈 int ar_tree[8] = { 1,1,1,3,5,3,5,7 }; void DFS(int node) { cout << node <<" "; if (flag[node] == 0) { stk.push(node); } int temp; //判断node的子节点是否搜索完成 if (flag[node] < tree[node].size()) { temp = tree[node][flag[node]]; flag[node]++; DFS(temp); } else {//若已经完成 stk.pop();//弹出子节点 if (!stk.empty()) {//若堆栈不为空 temp = stk.top();//取此时的栈顶元素,即为node的上一级节点 DFS(temp); } } } int main() { ios::sync_with_stdio(false); memset(flag, 0, sizeof(flag)); register int i,temp; tree.resize(10);//图中的数共有九个节点 //生成树 for (i = 2; i <=9; i++) { temp = ar_tree[i - 2]; tree[temp].push_back(i);//表示第i个节点为第temp个节点的子节点 } //DFS cout << "DFS过程:" << endl; DFS(1); cout << endl; return 0; }
c#
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; namespace DFS { class Program { public int[,] map = new int[100, 100]; public int[] road = new int[120]; public int n, x, y; public int m = 1; public int[] visited = { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, }; static void Main(string[] args) { Program pro = new DFS.Program(); int i, j; pro.n = int.Parse(Console.ReadLine()); pro.x= int.Parse(Console.ReadLine()); pro.y= int.Parse(Console.ReadLine()); for (i = 0; i < pro.n; i++) { for (j = 0; j < pro.n; j++) { pro.map[i,j]= int.Parse(Console.ReadLine()); } } pro.road[0] = pro.x; pro.dfs(pro.x); } public void dfs(int p) { visited[p] = 1; int i, j; for (i = 0; i < n; i++) { if (map[p,i] == 1 && visited[i] == 0) { if (i == y)///如果深搜到了终点,就输出刚才经过的路径 { for (j = 0; j < m; j++) { Console.WriteLine("{0}", road[j]); } Console.WriteLine("{0}\r\n", y); } else///如果该点不是终点 { map[p,i] = 0; road[m] = i;///将该点存起来 m++; dfs(i);///接着深搜 map[p,i] = 1; visited[i] = 0; m--; } } } } } }
本文暂时没有评论,来添加一个吧(●'◡'●)