互联网从业者充电站 头像

消息来源频道

互联网从业者充电站

@https1024

频道28,610 位成员公开可见持续更新

互联网从业者专属 内容多为技术、产品、设计、运营等不同话题内容; 目标人群为程序员、设计师、产品经理、运营管理等不同职能。 投稿/合作: @inside1024_bot 内容来源网络

成员规模28,610 位成员
在线情况待同步
消息总数32,672 条消息
浏览量总数5,084,371 次浏览

在这个频道里搜索消息……

t.me/https1024

#自媒体运营频道 #@yunying23
你的做海量页面的网站为什么会突然没曝光没点击了?
哥飞用谷歌的口吻,从谷歌的视角,给大家说一下。
﹉﹉﹉﹉
我,谷歌,全球第一搜索引擎,为了继续保持市场领先地位,我就需要让用户在这里搜索任何关键词,都能够找到满意的结果。
特别是那些最新发生的事情,最新的关键词,我需要足够敏锐,足够快速,足够及时。
如果世界发上了一些大事,但用户来我这里搜索出来的,都是旧消息,而不是最新的消息,那么用户就会抛弃我,转而去用别的搜索引擎。
为了保证我能够及时的给出第一手消息,我就需要让我的爬虫爬得足够快、足够广,并且还不能受限于 sitemap ,我需要自己去网页里爬。
但是,总有些网站,总想着走捷径,用一些方法,批量生成了大量低质量网页。
这些网站爬来之后,在我的索引、排名算法里,压根就拿不到任何排名,完全是浪费我的时间和算力。
但是为了保证万一能够抓到那么一些新鲜的第一手信息,我又不得不到处去爬,也就是我的爬虫算法不能改。
那要怎么让这些垃圾网站不继续生产垃圾页面呢?
只是在GSC提示有大量页面“已发现未抓取”和“已抓取未索引”好像那个SB站长也不听,那就只能不给他整站排名和曝光了,省得他还以为自己做对了呢。
注意,以上是情绪化表达,大概是那个意思,不一定完全准确。