• 搜索引擎使用的網頁分析抽取方式_SEO交流_SEO前線
    發現更大的SEO世界
     找回密碼
     注冊
    搜索
    »首頁»SEO培訓 SEO論壇 SEO交流 帖子
    发新帖
    mage,請到個人資料頁面設置个人签名    

    搜索引擎使用的網頁分析抽取方式

    請問,現在的搜索引擎,百度,搜狗,360等,針對抓取網頁進行網頁主題信息提取分析的時候,是使用具體什麽方式進行網頁html分析的?
    使用dom,還是使用針對div或者table網頁的時候,建立標簽樹抽取分析?
    請了解的朋友幫忙解答,也請zero幫忙解答。
    发表于 2014-12-3 20:16:28
    回複 收藏
    浩辰SEO博客,愛好seo/sem以及網絡營銷    

    本帖最后由 浩辰SEO博客 于 2014-12-4 09:59 编辑

    抓取网页数据通过指定的URL,获得页面信息,进而对页面用DOM进行 NODE分析。

    評分

    參與人數 1贊同 +4 收起 理由
    utterly + 4 很給力!

    查看全部評分

    发表于 2014-12-3 21:18:32
    回複 收藏
    mage,請到個人資料頁面設置个人签名    

    浩辰SEO博客 发表于 2014-12-3 21:18
    抓取网页数据通过指定的URL,获得页面信息,进而对页面用DOM进行 NODE分析,处理得到原始HTML数据,这样做 ...

    這個seo論壇裏面,沒有必要百度一段吧,真的,這也是浪費你我的時間。
     樓主佳哥seo 发表于 2014-12-4 09:32:14
    回複 收藏
    浩辰SEO博客,愛好seo/sem以及網絡營銷    

    本帖最后由 浩辰SEO博客 于 2014-12-4 10:00 编辑
    mage 发表于 2014-12-4 09:32
    這個seo論壇裏面,沒有必要百度一段吧,真的,這也是浪費你我的時間。


    只能說你逗了。孩子。
    发表于 2014-12-4 09:58:59
    回複 收藏
    mage,請到個人資料頁面設置个人签名    

    浩辰SEO博客 发表于 2014-12-4 09:58
    只能說你逗了。孩子。

    111.jpg
    說實話,真沒有必要你再幫忙再百度搜一下。能提這個問題,是真的需要真正了解抽取方式的朋友幫忙解答。
    而在seo前線提問,是因爲現在zero的論壇真的和其他所謂seo平台不同。
    我们是希望真正有懂的朋友帮忙解答,或者你应该学习zero 和其他朋友,如果我们不是真正的了解,就没有必要再搜一堆东西,发上来。
     樓主佳哥seo 发表于 2014-12-4 10:13:13
    回複 收藏
    浩辰SEO博客,愛好seo/sem以及網絡營銷    

    mage 发表于 2014-12-4 10:13
    說實話,真沒有必要你再幫忙再百度搜一下。能提這個問題,是真的需要真正了解抽取方式的朋友幫忙解答。
    ...

    你是不是脑残啊,傻逼!   这句话你去百度下,看下百度有没有! 那是不是也复制的?老子帮你,也帮狗了!搓
    发表于 2014-12-4 21:02:30
    回複 收藏
    浩辰SEO博客,愛好seo/sem以及網絡營銷    

    本帖最后由 浩辰SEO博客 于 2014-12-4 21:08 编辑

    我做SEO快一年,帮人解答问题,像你这样的狗我还是第一次遇到了! 我也不认识这论坛的什么人,只是这个论坛跟我换了友链,我才常点进来看看。不过也没事,在SEO这行 网上像你这种狗我遇见多了,也就麻木了。
    发表于 2014-12-4 21:05:02
    回複 收藏
    菲比,請到個人資料頁面設置个人签名    

    何必計較這些小事,咱們論壇一直很和諧,大家也要自覺維護!!
    发表于 2014-12-4 22:08:26
    回複 收藏
    ZERO,SEO執著愛好者    

    搜索引擎可能使用的是視覺分塊,可參見相關文獻專利,我沒深入研究。

    除了極端情況下比如作弊利用漏洞,覺得了解解析方式沒太大的意義。當網頁本身佳哥seo量很好,html代碼也比較遵守規範的情況下差不多就夠了。
    发表于 2014-12-5 13:54:41
    回複 收藏
    我是帥哥周,請到個人資料頁面設置个人签名    

    雖然我不知道,但我覺得想實現這個真是方法很多,比如多頁面對比就可以,所以搜索引擎對這方面處理應該很成熟。
    发表于 2014-12-5 17:01:15
    回複 收藏
    xcl1086,《走進搜索引擎》也沒看完,python也放棄了~~~    

    ZERO 发表于 2014-12-5 13:54
    搜索引擎可能使用的是視覺分塊,可參見相關文獻專利,我沒深入研究。

    除了极端情况下比如作弊利用漏洞,觉 ...

    百度官方說能識別絕大部分網站的主題內容、導航等各個模塊,我想知道什麽情況下他不能識別
    发表于 2014-12-24 16:26:18
    回複 收藏
    快速回複 返回頂部 返回列表