网页源代码与cURL获取到的数据不符
本文最后更新于 2072 天前,其中的信息可能已经有所发展或是发生改变。

最近在做图书馆检索,用到了PHP的cURL和正则表达。

今天遇到一个匹配不到的问题,原本以为是正则规则写错了,但后来发现,其实是正则中的文本不符。

一般情况下我是通过ctrl U 查看网页源代码来写正则规则的。通过源代码可以看到这次我要匹配的是。其中我要匹配的是1899.

<span id=”ctl00_ContentPlaceHolder1_countlbl style=”color:Red;>1899</span>

于是我使用了下面的规则:

#<span id=”ctl00_ContentPlaceHolder1_countlbl style=”color:Red;>([^”]+)</span>#iUs

但始终无法匹配出结果。后来将cURL获取到的网页数据输出来,看到的数据竟然和网页源代码的不一致:

<span id=”ctl00_ContentPlaceHolder1_countlbl“><font color=”Red“>1899</font></span>

至此匹配的问题解决。

现在仍然无法理解缘何不同,若游客有见解,留下言吧 :)

评论

  1. illuz
    Windows Firefox
    6年前
    2015-3-07 9:07:20

    可能是 User Agent 或 Cookie 所致。

    • foam
      foam 博主
      Windows Chrome
      6年前
      2015-3-08 19:04:52

      应该不是这个问题哦。

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇