国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

爬蟲和云計算考試

這篇具有很好參考價值的文章主要介紹了爬蟲和云計算考試。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

防爬蟲應(yīng)對策略:設(shè)置user-agent 使用代理IP 降低訪問頻率 驗證碼限制
網(wǎng)頁請求原理:DNS,全稱為Domain Name System,即域名系統(tǒng),是一種用于將域名和IP地址相互映射的分布式數(shù)據(jù)庫系統(tǒng)。DNS的作用就是將域網(wǎng)站轉(zhuǎn)換成相應(yīng)的服務(wù)器IP地址
?? ?HTTP協(xié)議格式: 由客戶端請求消息和服務(wù)器端相應(yīng)消息組成?
?? ?端口443:明確用于HTTPS服務(wù),因此是HTTPS(加密)流量的標準端口。它也稱為HTTPS端口443
?? ?get從服務(wù)器獲取指定頁面信息(獲取信息),post向服務(wù)器提交數(shù)據(jù)并獲取頁面信息(發(fā)送信息)
?? ?狀態(tài)碼:相應(yīng)狀態(tài)碼由三位數(shù)字組成,其中第一位數(shù)字定義了相應(yīng)的類別,有五種可能取值。
?? ??? ?100~199(服務(wù)器成功接收部分請求,要求客戶端繼續(xù)提交其余請求才能完成整個處理過程)
?? ??? ?200~299(成功接收請求并已完成整個處理過程。常為200表示OK,請求成功)
?? ??? ?300~399(為完成請求,客戶端需進一步細化請求。例如請求的資源已經(jīng)移動到一個新的地址。302'所請求頁面轉(zhuǎn)移到新的URL' 307,304'表示使用緩存資源')
?? ??? ?400~499(客戶請求有錯誤,常用狀態(tài)碼為404'服務(wù)器無法找到被請求的頁面',403'服務(wù)器拒絕訪問,權(quán)限不夠')
?? ??? ?500~599(服務(wù)器端出現(xiàn)錯誤,500'表示請求未完成,服務(wù)器遇到不可預(yù)知的情況')
url用起來麻煩 python自帶
request簡單需要pip安裝
安裝selenium:打開cmd 輸入pip install selenium (指定版本則在后面加上"==版本號") ?速度太慢找國內(nèi)pip鏡像網(wǎng)站(pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple)
?? ??? ?查看版本:pip show selenium
?? ??? ?
user-agent表示用戶代理,是HTTP協(xié)議中的一個字段,在其請求頭部headers里面,其作用是描述發(fā)出HTTP請求的終端信息,服務(wù)器通過這個字段可以知道訪問網(wǎng)站的用戶。
超時設(shè)置 在request語句之后 file=... ... ...(url,timeout=1)無限等待為空值 ?作用:防止url不可訪問,或者響應(yīng)速度太慢而造成的時間浪費。
安裝beautifulsoup:pip install beautifulsoup4?
安裝lxml:一:pip install lxml 報錯方法二:先安裝wheel庫 ?pip install wheel 查看python版本 然后從pypi.python.org上下載lxml的.whl文件 找到文件位置打開cmd 輸入pip install+文件全名
xpath:書本p66

分布式
會做實驗就沒問題
Linux ssh連接服務(wù)器 端口22tcp 用win scp
傳文件
Windows server 遠程桌面連接 端口3389
直接復(fù)制粘貼傳文件
安全組設(shè)置防火墻
防火墻概念
linux命令如cd 創(chuàng)建刪除文件夾
文本編輯器 nano
安裝Inmp全稱linuxnginxmysqlphp
ntp全稱作用給其他設(shè)備提供當(dāng)前時間
不考最難的vpn但是要會生成證書什么的代碼
傳輸層協(xié)議TCP UDP 端口80 43
上機一道linux操作題一道實驗題之一
沒有最難的vpn

爬蟲和云計算考試,爬蟲,云計算爬蟲和云計算考試,爬蟲,云計算爬蟲和云計算考試,爬蟲,云計算爬蟲和云計算考試,爬蟲,云計算

爬蟲和云計算考試,爬蟲,云計算

(1)

from selenium import webdriver

from selenium.webdriver.common.by import By

from selenium.webdriver import ActionChains

import time

options = webdriver.ChromeOptions()

options.add_experimental_option('detach', True)

driver = webdriver.Chrome(options=options)

driver.get('https://yjsy.hunnu.edu.cn')

time.sleep(5)

xpath_1 = "http://ul[@class='menu']/li[4]/a"

xpath_2 = "http://ul[@class='menu']/li[4]/ul/li[2]/a"

button_1 = driver.find_element(By.XPATH, xpath_1)

button_2 = driver.find_element(By.XPATH, xpath_2)

ActionChains(driver).move_to_element(button_1).perform()

time.sleep(5)

ActionChains(driver).move_to_element(button_2).click().perform()

(2)

from selenium import webdriver

from selenium.webdriver.common.by import By

#不讓瀏覽器自動關(guān)閉

options = webdriver.EdgeOptions()

options.add_experimental_option('detach', True)

driver = webdriver.ChromiumEdge(options=options)

#加載網(wǎng)頁,獲取源代碼

url = 'https://www.bilibili.com/v/popular/all/'

driver.get(url)

#導(dǎo)入BeautifulSoup,篩選數(shù)據(jù)

from bs4 import BeautifulSoup

soup = BeautifulSoup(driver.page_source, 'lxml')

result = soup.find_all('div', class_='video-card')

for item in result:

? ? title = item.find('p', class_='video-name')

? ? up = item.find('span', class_='up-name__text')

? ? count = item.find('span', class_='play-text')

? ? print(f'視頻:{title.text},UP:{up.text},播放量:{count.text.strip()}')

(3)

from selenium import webdriver

url = 'https://www.bilibili.com/video/BV1iN4y1a7KJ'

options = webdriver.ChromeOptions()

options.add_experimental_option('detach', True)

driver = webdriver.Chrome(options=options)

driver.get(url)

import time

time.sleep(5)

html = driver.page_source

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, 'lxml')

title = soup.find('h1', class_="video-title")

count = soup.find('span', class_="view item")

dm = soup.find('span', class_="dm item")

datetime = soup.find('span', class_="pubdate-text")

comments = soup.find_all('div', class_="content-warp")

comments_text = []

for comment in comments:

? ? name = comment.find('div', class_="user-info").text

? ? text = comment.find('span', class_="reply-content").text

? ? comments_text.append({

? ? ? ? 'name': name,

? ? ? ? 'text': text

? ? })

# 輸出結(jié)果

print(f"標題:{title.text},播放量:{count.text.strip()},彈幕數(shù):{dm.text.strip()}")

for comment in comments_text:

? ? print(f"評論:\nID:{comment['name']},評論內(nèi)容:{comment['text']}")

driver.close()文章來源地址http://www.zghlxwxcb.cn/news/detail-760515.html

到了這里,關(guān)于爬蟲和云計算考試的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Unity導(dǎo)出速度慢和云計算

    Unity導(dǎo)出速度慢和云計算

    Unity 在有些時候?qū)С鲰椖抗こ痰臅r候速度很慢,有些時候特別慢(七八個小時甚至更多),尤其針對URP管線的項目,將大量時間用在了shader的處理上,雖然對于游戲優(yōu)化來說特別重要,但有時候真的很費時間,而且在到處過程中系統(tǒng)資源被占滿,完全無法做其他工作。 一般

    2023年04月09日
    瀏覽(19)
  • 虛擬化和云計算文章大合集

    近期,我寫了很多虛擬化和云計算類文章,先將各文章整理如下,衷心建議您收藏,慢慢查閱(??)? KVM詳解(一)——KVM基礎(chǔ)知識 KVM詳解(二)——KVM安裝部署 KVM詳解(三)——KVM創(chuàng)建虛擬機 KVM詳解(四)——KVM克隆與KVM配置文件 KVM詳解(五)——KVM虛擬機鏡像格式

    2024年02月01日
    瀏覽(19)
  • 一個專科生和云計算的故事
  • hcie數(shù)通和云計算選哪個好?

    1. 基礎(chǔ)知識與技能要求 數(shù)通技術(shù)是網(wǎng)絡(luò)技術(shù)的核心,它涉及到網(wǎng)絡(luò)協(xié)議、路由交換、網(wǎng)絡(luò)安全等多個方面。如果你是一名網(wǎng)絡(luò)工程師或開發(fā)者,想要在數(shù)通領(lǐng)域有所建樹,你需要具備扎實的基礎(chǔ)知識和豐富的實戰(zhàn)經(jīng)驗。 云計算則更注重于虛擬化、存儲、網(wǎng)絡(luò)和服務(wù)器等方面

    2024年03月16日
    瀏覽(36)
  • 云計算安全和云原生安全的關(guān)系

    云計算安全和云原生安全的關(guān)系

    云計算安全(Cloud Computing Security)指的是在云環(huán)境中保護數(shù)據(jù)、應(yīng)用程序和基礎(chǔ)設(shè)施的安全性。它包括保護云服務(wù)提供商的基礎(chǔ)設(shè)施和平臺,以及云服務(wù)用戶的數(shù)據(jù)和應(yīng)用程序。 云原生安全(Cloud-Native Security)則是指在云原生環(huán)境中保護應(yīng)用程序和服務(wù)的安全性。云原生是一種軟

    2024年02月08日
    瀏覽(24)
  • 虛擬化技術(shù)和云計算的關(guān)系

    虛擬化技術(shù)和云計算的關(guān)系

    1、云計算底層就是虛擬化技術(shù)。 (1)常見的虛擬化技術(shù):VMware(閉源的,需要收費)、XEN、KVM (2)大部分公司用的虛擬化方案:XEN、KVM 2、虛擬化的歷史 (1)1999年VMware首先推出了X86架構(gòu)虛擬化產(chǎn)品 (2)2002年XEN開源了 (3)2006年以色列公司qumaranet開發(fā)了KVM虛擬化 (4)

    2024年02月03日
    瀏覽(25)
  • Java分布式系統(tǒng)和云計算教程

    Java分布式系統(tǒng)和云計算教程

    Java分布式系統(tǒng)和云計算教程 大規(guī)模學(xué)習(xí)分布式 Java 應(yīng)用程序、并行編程、分布式計算和云軟件架構(gòu) 課程英文名:Distributed Systems Cloud Computing with Java 此視頻教程共4.0小時,中英雙語字幕,畫質(zhì)清晰無水印,源碼附件全 課程編號:324 百度網(wǎng)盤地址:https://pan.baidu.com/s/1qGJzKMXt

    2024年02月01日
    瀏覽(28)
  • 獨立服務(wù)器和云計算之間的區(qū)別

    獨立服務(wù)器和云計算之間的區(qū)別 云計算如今風(fēng)靡一時,提供了冗余、可擴展性和按需服務(wù),但人們對許多網(wǎng)絡(luò)托管提供商宣傳的云到底是什么充滿了疑問。唉,云計算不能被用來適應(yīng)每一個業(yè)務(wù)應(yīng)用,因此這種對獨立服務(wù)器和云服務(wù)之間基本區(qū)別的解釋。 磁盤輸入輸出 正確

    2023年04月11日
    瀏覽(22)
  • 一文帶你了解云原生和云計算

    一文帶你了解云原生和云計算

    云計算和云原生 云計算和云原生其實都是表達一個意思 ,只是站的角度不一樣。 云計算,更多是站在 產(chǎn)品或者運營的角度 來解釋如何充分利用物理機的計算資源; 云原生,更多是站在 技術(shù)實現(xiàn)的角度 來解釋如何充分利用物理機的計算資源; 云計算是什么 通過互聯(lián)網(wǎng)向用

    2024年02月05日
    瀏覽(23)
  • 算力調(diào)度和云計算有何區(qū)別

    算力調(diào)度和云計算有何區(qū)別

    Canalys發(fā)布的研究報告顯示,2023年第二季度,全球云基礎(chǔ)設(shè)施服務(wù)支出增長16%,達到724億美元。 此前云廠商們的高速增長,主要歸功于大規(guī)模的企業(yè)數(shù)字化轉(zhuǎn)型和上云。當(dāng)前市場的增速放緩,除了上云普及帶來的市場增量見頂,也與全球宏觀經(jīng)濟的不確定性緊密相關(guān),降本增

    2024年03月18日
    瀏覽(18)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包