伊莉討論區

標題: 網路爬蟲能不能直接爬本機目錄的網頁? [打印本頁]

作者: koala888    時間: 2022-5-13 03:15 PM     標題: 網路爬蟲能不能直接爬本機目錄的網頁?

本帖最後由 koala888 於 2022-5-13 03:20 PM 編輯

我最近在做網路爬蟲,我要爬本機的內部網頁,是在C:\底下,我是用C#寫的,我直接把目錄貼上去不行,會發生錯誤。我就是用HtmlAgilityPack正常的方法做爬蟲的。


  1. string url = "C:/Tung/%E6%8D%89%E5%AD%97%E8%A9%9E/%E9%A0%90%E8%AD%A6%E4%BA%8B%E4%BB%B6%E7%B5%B1%E8%A8%88%E8%A1%A8_01.html";HtmlWeb web = new HtmlWeb();HtmlDocument doc = web.Load(url);
複製代碼


程式就錯在 HtmlDocument doc = web.Load(url); 請問有沒有辦法改呢?還是本機的網頁都不能爬蟲?謝謝




作者: tryit244178    時間: 2022-5-14 06:37 AM

在 Html Agility Pack 的網站上面是寫
  1. // From File
  2. var doc = new HtmlDocument();
  3. doc.Load(filePath);
複製代碼





歡迎光臨 伊莉討論區 (http://a402.file-static.com/) Powered by Discuz!