把買粉絲買粉絲文章讀出來的方法是:下載一個買粉絲讀書app,把買粉絲文章發送到買粉絲讀書里,接著文章就在買粉絲讀書里打開了,可以看到右上角有個聽字,點一下就可以聽文章。
買粉絲買粉絲是開發者或商家在買粉絲公眾平臺上申請的應用賬號,該帳號與QQ賬號互通,平臺上實現和特定群體的文字、圖片、語音、視頻的全方位溝通、互動,形成了一種主流的線上線下買粉絲互動營銷方式。
2016年1月18日,騰訊在北京發布消息稱,中國政務買粉絲公號已逾10萬。2018年4月,騰訊已查處9.9萬多個違規買粉絲。11月16日買粉絲公眾平臺發布公告稱,個人注冊買粉絲數量上限調整為1個。
用戶在申請本服務過程中,需要填寫必要的信息,請保持這些信息的真實、準確、合法、有效并注意及時更新,以便騰訊向你提供及時有效的幫助,或更好地為你提供服務。根據相關法律法規和政策,請你填寫真實的身份信息。
若你填寫的信息不完整或不準確,則可能無法使用本服務或在使用過程中受到限制。騰訊與用戶一同致力于個人信息的保護,保護用戶個人信息是騰訊的一項基本原則。未經你的同意,騰訊不會向騰訊以外的任何公司、組織或個人披露你的個人信息,但法律法規另有規定的除外。
1、首先點擊進入一個買粉絲買粉絲。
2、點擊右上角的人頭圖標。
3、然后點擊右上角的三個點。
4、選擇下方的“查看歷史消息”。
5、點擊歷史消息頁面右上角的三個點。
6、點擊“復制鏈接”。
7、復制好后,將鏈接粘貼并發送至文件傳輸助手。
8、雙擊剛才的鏈接,此時頁面會轉到該買粉絲買粉絲,代表該買粉絲買粉絲的url鏈接地址已被提取到。
經常有朋友需要幫忙做買粉絲文章爬取,這次來做一個各種方法的匯總說明。
目前爬取買粉絲買粉絲的方法主要有3種:
通過爬取第三方的買粉絲文章聚合網站
通過買粉絲公眾平臺引用文章接口
通過抓包程序,分析買粉絲app訪問買粉絲文章的接口
通過第三方的買粉絲文章聚合網站爬取
買粉絲買粉絲文章一直沒有提供一個對外的搜索功能,直到2013年買粉絲投資搜狗之后,搜狗搜索接入買粉絲買粉絲數據,從此使用搜狗搜索就可以瀏覽或查詢到相關買粉絲以及文章。
域名是: 買粉絲s://weixin.sogou.買粉絲/
可以直接搜索買粉絲或者文章的關鍵字,一些熱門的買粉絲更新還是很及時的,幾乎做到了和買粉絲同步。
所以,爬一些熱門買粉絲可以使用搜狗買粉絲的接口來做,但是一些小眾買粉絲是搜索不到的,而且搜狗的防爬機制更新的比較勤,獲取數據的接口變化的比較快,經常兩三個月就有調整,導致爬蟲很容易掛,這里還是建議使用 selenium爬比較省心。另外搜狗對每個ip也有訪問限制,訪問太頻ip會被封禁24小時,需要買個ip池來做應對。
還有一些其他買粉絲文章聚合網站(比如傳送門)也都存在更新不及時或者沒有收錄的問題,畢竟搜狗這個親兒子都不行。
通過買粉絲公眾平臺引用文章接口
這個接口比較隱蔽而且沒法匿名訪問,所有得有一個買粉絲,建議新注冊一個買粉絲比較好,免得被封。
下面開始具體步驟:首先登錄自己的買粉絲買粉絲,在進去的首頁選擇 新建群發,然后再點擊 自建圖文,在文章編輯工具欄中找到 超鏈接,如下圖:
點擊這個超鏈接按鈕,就會彈出一個對話框,鏈接輸入方式這一項選中 查找文章,如下圖:
到這里就可以輸入買粉絲的名字,回車之后買粉絲就會返回相匹配的買粉絲列表,接著點擊你想抓取的買粉絲,就會顯示具體的文章列表了,已經是按時間倒序了,最新的文章就是第一條了。
買粉絲的分頁機制比較奇怪,每個買粉絲的每頁顯示的數據條數是不一樣的,分頁爬的時候要處理一下。
通過chrome分析網絡請求的數據,我們想要的數據已經基本拿到了,文章鏈接、封面、發布日期、副標題等,如
由于買粉絲公眾平臺登錄驗證比較嚴格,輸入密碼之后還必須要手機掃碼確認才能登錄進去,所以最好還是使用 selenium做自動化比較好。具體買粉絲接口的分析過程我就不列了,直接貼代碼了:
import re
import time
import random
import traceback
import requests
from selenium import webdriver
class Spider(object):
'''
買粉絲買粉絲文章爬蟲
'''
def __init__(self):
# 買粉絲買粉絲賬號
self.ac買粉絲unt = '286394973@qq.買粉絲'
# 買粉絲買粉絲密碼
self.pwd = 'lei4649861'
def create_driver(self):
'''
初始化 webdriver
'''
options = webdriver.ChromeOptions()
# 禁用gpu加速,防止出一些未知bug
options.add_argument('--disable-gpu')
# 這里我用 chromedriver 作為 webdriver
# 可以去 買粉絲:/