您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
如何提取网页中的所有链接?
所示,如下图,链接如何提取网页中的所有链接?
发布时间:2019-02-08加入收藏来源:互联网点击:
如何提取网页中的所有链接?
回答于 2019-09-11 08:43:50
回答于 2019-09-11 08:43:50
第一步,
打开Visual Studio 2019 ,如下图所示:
第二步,
点击文件,新建项目,选择C#项目、Linux的控制台项目,如下图示:
第三步,
鼠标右键点击解决方案、项目下的依懒项,如下图所示:
鼠标左键选择管理NuGet程序包,然后出现如下图界面:
点击浏览,输入AngleSharp 名称,如下图所示:
选择上图第一项,点击右侧的安装按钮,如下图所示:
鼠标点击上图中的确定按钮,出现以下界面:
表示已经将依懒项AngleSharp安装到了项目中,如下图所示:
。
第四步,
右键双击解决方案项目下的Program.cs,打开源代码文件Program.cs,编写以下代码,
using System;
using System.Linq;
using AngleSharp;
using AngleSharp.Html.Dom;
namespace ConsoleGetAllLink
{
class Program
{
/// <summary>
/// 读取网页的所有链接
/// </summary>
static async void ReadAllLink()
{
//创建一个场景
var context = BrowsingContext.New(Configuration.Default.WithDefaultLoader());
//以异步方式打开hao123网址首页
var document = await context.OpenAsync("https://www.hao123.com/");
//查询hao123网址首页中所有的链接
var allLinks = document.All.Where(m => m.LocalName == "a");
//循环输出链接的名称和网址
foreach(var link in allLinks)
{
IHtmlAnchorElement ilink = link as IHtmlAnchorElement;
Console.WriteLine($"{ilink.TextContent} ,{ilink.Href}");
}
}
static void Main(string[] args)
{
//读取网页的所有链接
ReadAllLink();
if(Console.ReadLine().ToLower() == "q")
{
}
}
}
}
第五步,
按F5键调试运行,如下图所示:
运行结果:
。
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |