找回密碼 或 安全提問
 註冊
|註冊|登錄

伊莉討論區

搜索
伊莉需要你的贊助和支持你準備好成為出色的版主了嗎?安全提問(回答) 和 永久尊貴會員 事宜
mg三上悠亞刀劍神域無碼adobe國中安卓
寝取られ逆襲惡戰模擬市民偽娘4542550手撕白蓮h文

休閒聊天興趣交流學術文化旅遊交流飲食交流家庭事務PC GAMETV GAME
熱門線上其他線上感情感性寵物交流家族門派動漫交流貼圖分享BL/GL
音樂世界影視娛樂女性頻道潮流資訊BT下載區GB下載區下載分享短片
電腦資訊數碼產品手機交流交易廣場網站事務長篇小說體育運動時事經濟
上班一族博彩娛樂

[繁]最狂輔助職業【話

[繁]精靈幻想記 第二

[繁]嘆氣的亡靈想隱退

[簡]重啟人生的千金小

[繁]青春之箱05-

[繁]香格里拉・開拓異
C & C++ 語言C# 語言Visual Basic 語言PHP 語言JAVA 語言
查看: 5555|回復: 3
打印上一主題下一主題

[問題]PHP爬蟲抓中油95油價,出現中文亂碼[複製鏈接]

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
跳轉到指定樓層
樓主
發表於 2020-10-23 05:49 PM|只看該作者|倒序瀏覽
成為伊莉的版主,你將獲得更高級和無限的權限。把你感興趣的版面一步步地發展和豐盛,那種滿足感等著你來嚐嚐喔。
本帖最後由 u48326 於 2020-10-23 05:54 PM 編輯

欲由中油官網得知當日的95油價,用PHP 的 getElementById() 做法,但 id 含有中文、結果回傳值為空。
第2行測試一個無中文的 id,有抓到值,但回傳時中文顯示亂碼。
查中油首頁設定 charset=utf-8,所以我在爬蟲程式裡也加入:
header("Content-Type:text/html; charset=utf-8");卻無效果。程式如附件。有請前輩指導,謝謝!
...
瀏覽完整內容,請先 註冊登入會員
附件: 你需要登錄才可以下載或查看附件。沒有帳號?註冊
分享分享0收藏收藏0支持支持0
如果瀏覽伊莉時速度太慢或無法連接,可以使用其他分流瀏覽伊莉,www01.eyny.com(02,03)。

使用道具檢舉

Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6

帖子
155
積分
1282 點
潛水值
47955 米
頭香
發表於 2020-10-25 03:01 AM|只看該作者

使用道具檢舉

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
3
發表於 2020-10-26 03:28 PM|只看該作者
如果發覺自己無法使用一些功能或出現問題,請按重新整理一次,並待所有網頁內容完全載入後5秒才進行操作。
tryit244178 發表於 2020-10-25 03:01 AM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

你的文件有存成unicode嗎?也許這樣可以解決你的問題

程式是用 Notepad++ 編輯,預設儲存是 UTF-8 。
若在第6行增加一行:echo $html;
...
瀏覽完整內容,請先 註冊登入會員
若對尊貴或贊助會員有任何疑問,歡迎向我們查詢。我們的即時通或MSN: admin@eyny.com

使用道具檢舉

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
4
發表於 2020-10-26 04:06 PM|只看該作者
本帖最後由 u48326 於 2020-10-26 04:09 PM 編輯

搞定了。
原來 UTF-8 的網頁在 loadHTML() 之前要加一道小手續:

$searchPage = mb_convert_encoding($html, 'HTML-ENTITIES', "UTF-8");

原程式修改後如附件。
附件: 你需要登錄才可以下載或查看附件。沒有帳號?註冊

使用道具檢舉

您需要登錄後才可以回帖 登錄 | 註冊

Powered by Discuz!

© Comsenz Inc.

重要聲明:本討論區是以即時上載留言的方式運作,對所有留言的真實性、完整性及立場等,不負任何法律責任。而一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,並應自行判斷內容之真實性。於有關情形下,用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。 由於本討論區受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者發現有留言出現問題,請聯絡我們。有權刪除任何留言及拒絕任何人士上載留言,同時亦有不刪除留言的權利。切勿上傳和撰寫 侵犯版權(未經授權)、粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。本網站保留一切法律權利。
回頂部