HTTP架構(gòu)師通常使用許多復(fù)雜的機(jī)制將多個(gè)子模塊組合成一個(gè)HTTP服務(wù)器。網(wǎng)站云服務(wù)器。如今,網(wǎng)絡(luò)爬蟲(chóng)已經(jīng)形成了四種基本模式。如果已經(jīng)編寫了生成動(dòng)態(tài)內(nèi)容的Python代碼,并且選擇了支持WSGI的API或框架,那么HTTP服務(wù)應(yīng)該如何在線部署?
第一步是運(yùn)行一個(gè)Python編寫的服務(wù)器,一個(gè)web爬蟲(chóng),在服務(wù)器的代碼中可以直接調(diào)用WSGI接口。最受歡迎的服務(wù)器是綠色獨(dú)角獸(Gunicorn),但也有其他純Python服務(wù)器可以在生產(chǎn)環(huán)境中使用。
第二,配置mod_wsgi并運(yùn)行Apache,在單獨(dú)的WSFIDaemonProcess中運(yùn)行Python代碼,通過(guò)mod_wsgi啟動(dòng)守護(hù)進(jìn)程。
第三步:在后端運(yùn)行類似Gunicorn的Python HTTP服務(wù)器(或者任何支持所選異步框架的服務(wù)器),然后在前端運(yùn)行一個(gè)既能返回靜態(tài)文件,又能反向代理Python編寫的動(dòng)態(tài)資源服務(wù)的Web服務(wù)器。
第四步是在前端運(yùn)行一個(gè)純反向代理(比如清漆),反向代理后端運(yùn)行Apache或者nginx,后端運(yùn)行Python編寫的HTTP服務(wù)器。這是一個(gè)三層架構(gòu)。這些反向代理可以分布在不同的地理位置,以便最靠近客戶端的反向代理上的緩存資源可以返回給發(fā)送請(qǐng)求的客戶端。
長(zhǎng)期以來(lái),這四種架構(gòu)的選擇主要是基于CPPython三個(gè)運(yùn)行時(shí)的特點(diǎn),即解釋器占用內(nèi)存大,解釋器運(yùn)行慢,全局解釋器鎖(GIL)禁止多個(gè)線程同時(shí)運(yùn)行Python字節(jié)碼。但同時(shí),內(nèi)存中只能加載一定數(shù)量的Python實(shí)例。IPIDEA提供HTTP代理、HTTPS代理、Socks5代理等。住宅代理響應(yīng)迅速,保證了用戶信息的安全。有不懂的請(qǐng)咨詢夢(mèng)飛服務(wù)器了解。