鍵字取得問題可以手動完成,那麼我

 

列印 PAA 問題

如您所看到的,該工具以 JSON 資料的形式傳回整個 SERP,並且與查詢相關的主要問題位於「lated_questions」鍵中。

 

由於我們獲取的是結構化資料而

不是原始 HTML 數據,因此我們可以透過鍵名選擇特定元素:

 

serp = response.json() all_questions = serp[‘related_questions’] for paa in all_questions: print(paa[‘question’])

我們將整個 JSON 回 紐西蘭電報數據 應儲存在 serp 變數中

 

我們檢索「相關問題」並建立一個元素清單 – 其中每個元素都是 PAA 問題。

 

為了檢索問題,我們循環遍歷列表並僅列印“問題”鍵。

 

結果是控制台上列印出 PAA 問題清單:

 

控制台內的 PAA 問題

步驟 4:將資料匯出到 CSV 文件

對於 CSV 文件,我們可能還想將關鍵字與 PAA 問題相匹配,所以讓我們下載它:

紐西蘭電報數據

keyword = serp[‘search_information’][‘query_displayed’]

完成此操作後,我們將建立一個空列表,用於根據需要格式化資料:

 

paa_questions = []

我們將提取 最佳 10 名印地語網站和博客 的資訊添加到其中:

 

for paa in all_questions: paa_questions.append({ ‘Keyword’: keyword, ‘Related Question’: paa[‘question’] })

如果我們列印 paa_questions,控制台中的內容如下:

 

列印 PAA 問題

這很重要,因為它是 CSV 檔案 銷售艾 的基礎,當我們將抓取工具擴展到數千個關鍵字時,它將幫助我們識別問題的來源。

 

在最後一步中,讓我們使用 Pandas 建立一個 CSV 檔案以便於匯出:

 

db = pd.DataFrame(paa_questions) db.to_csv(‘paa_questions.csv’, index=False)

如果您現在運行程式碼,它不會在控制台上列印任何內容。相反,它將創建一個新的 CSV 文件,如下所示:

 

運行程式碼

第 5 步:大規模收集 PAA 問題

當然,僅針對一個關們該如何擴展這個項目呢?

 

嗯,這就是網頁抓取的美妙之處。這都是關於循環的!

 

首先,建立一個包含您所需關鍵字的清單:

 

keywords = { ‘keyword+research’, ‘keyword+tracker’ }

然後,我們將把之前的所有程式碼放入一個新循環中,該循環將從關鍵字列表中獲取每個術語並運行整個過程。

 

這是最終且完整的程式碼片段:

 

返回頂端