資訊內(nèi)容
Python之自動(dòng)獲取目標(biāo)網(wǎng)站最新通知
tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
python之自動(dòng)獲取目標(biāo)網(wǎng)站**新通知:tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
1、建立通知數(shù)據(jù)庫tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
這一步的目的是爬取目標(biāo)網(wǎng)站已經(jīng)發(fā)布的通知的數(shù)據(jù),并進(jìn)行存儲(chǔ),從而建立與該目標(biāo)網(wǎng)站內(nèi)容相對(duì)應(yīng)的本地?cái)?shù)據(jù)庫。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
考慮到數(shù)據(jù)庫中的數(shù)據(jù)將是辨別和獲取一則新通知的**方法,因此所建立的數(shù)據(jù)庫將存儲(chǔ)每一條通知的標(biāo)題、發(fā)布日期和訪問鏈接。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
第一步使用到的模塊有urllib、BeautifulSoup和sqlite3模塊。其中,通過urllib模塊爬取目標(biāo)網(wǎng)頁html數(shù)據(jù);通過BeautifulSoup模塊解析網(wǎng)頁數(shù)據(jù)、爬取網(wǎng)頁內(nèi)容;通過sqlite3模塊建立目標(biāo)網(wǎng)站已有通知數(shù)據(jù)庫。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
該步主要代碼展示如下。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
2、建立郵件發(fā)送系統(tǒng)tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
這一步的目的是使用Python標(biāo)準(zhǔn)庫模塊smtplib來訪問網(wǎng)絡(luò),創(chuàng)建一個(gè)發(fā)送電子郵件的功能。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
由于我們大部分人的計(jì)算機(jī)并沒有建立自己的郵件服務(wù)器,因此需借助第三方服務(wù)器來模擬郵件發(fā)送。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
常用的有谷歌郵件系統(tǒng)、網(wǎng)易郵件系統(tǒng)和QQ郵件系統(tǒng),如QQ郵件系統(tǒng)的SMTP服務(wù)器和端口號(hào)分別為smtp.qq.com和465。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
該步主要代碼展示如下。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
在這個(gè)示例中,使用了Python標(biāo)準(zhǔn)庫中的email模塊將電子郵件信息進(jìn)行了格式化,主要包括郵件的主題與發(fā)件人、收件人郵箱昵稱和郵件內(nèi)容等信息。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
3、解析檢測目標(biāo)網(wǎng)站通知tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
前面兩步,已經(jīng)完成了目標(biāo)網(wǎng)站已有通知數(shù)據(jù)庫和郵件發(fā)送系統(tǒng)的建立,第三步要完成的工作,主要由兩部分組成。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
一是,利用第一步使用的urllib、BeautifulSoup模塊解析目標(biāo)網(wǎng)站內(nèi)容數(shù)據(jù),并與前面建立的數(shù)據(jù)庫進(jìn)行對(duì)比檢測。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
二是,若檢測到目標(biāo)網(wǎng)站有新的通知,則將新通知數(shù)據(jù)插入到數(shù)據(jù)庫中,然后,發(fā)送提示電子郵件。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
該步主要代碼展示如下。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
在這個(gè)示例中,只選取了**新的一條通知發(fā)送了電子郵件提示,具體郵件信息可自己設(shè)定。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
4、制定計(jì)劃任務(wù)tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
前面三步,已經(jīng)完成了使用Python獲取目標(biāo)網(wǎng)站**新通知,并發(fā)送提示電子郵件的腳本程序。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
在這一步,將使用Windows自帶的DOS命令框架和任務(wù)計(jì)劃程序去每小時(shí)自動(dòng)運(yùn)行一次Python腳本,實(shí)現(xiàn)自動(dòng)更新通知的目的。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
首先,需要編寫一個(gè)cmd命令文件,方便在DOS框架下執(zhí)行Python腳本。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
主要代碼展示如下:tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
@echo off # 關(guān)閉回顯 cd C:demo # 找到Python腳本文件的路徑 python Python.py # 執(zhí)行Python腳本文件**后,使用任務(wù)計(jì)劃程序制定一個(gè)任務(wù),可設(shè)定為每隔一小時(shí)自動(dòng)運(yùn)行一次cmd命令文件。tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)
更多python進(jìn)階知識(shí),請(qǐng)觀看Python進(jìn)階視頻教程!!tvE少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺(tái)

- 上一篇
用python可以做微信小程序嗎?
簡介其實(shí)微信小程序作為一個(gè)前端的機(jī)制,Python 并不能插上邊。只不過可以作為后端接口為微信小程序提供數(shù)據(jù)服務(wù)而已。python可以做后端服務(wù)和小程序通訊,python可以寫后端平臺(tái),提供api,微信小程序就用wx.request()調(diào)用這個(gè)api。微信小程序主要的三大塊wxml控制頁面結(jié)構(gòu)
- 下一篇
python3爬蟲入門:常用網(wǎng)絡(luò)爬蟲模塊和技術(shù)
簡介urllib模塊urllib庫是python中自帶的模塊,也是一個(gè)最基本的網(wǎng)絡(luò)請(qǐng)求庫,該模塊提供了一個(gè)urlopen()方法,通過該方法指定URL發(fā)送網(wǎng)絡(luò)請(qǐng)求來獲取數(shù)據(jù)。urllib是一個(gè)收集了多個(gè)涉及URL的模塊的包urllib.request打開和讀取URL三行代碼即可爬取百度首頁源代碼:imp