国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

讀改變未來的九大算法筆記07_搜索引擎

2年前作者：躺柒分類：Toy博客閱讀(31)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了讀改變未來的九大算法筆記07_搜索引擎。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

讀改變未來的九大算法筆記07_搜索引擎文章來源地址http://www.zghlxwxcb.cn/news/detail-476477.html

1.?車庫軼事

1.1.?1939年

1.1.1.?戴夫·休利特（Dave Hewlett）

1.1.1.1.?惠普（Hewlett-Packard）

1.2.?1976年

1.2.1.?蒂夫·喬布斯（Steve Jobs）和史蒂夫·沃茲尼亞克（Steve Wozniak）

1.2.1.1.?從一間臥室開始的，空間很快就不夠用了，于是他們轉(zhuǎn)移到了車庫

1.3.?1998年

1.3.1.?佩奇和布林

1.3.1.1.?谷歌

1.3.1.1.1.?門洛帕克車庫

2.?互聯(lián)網(wǎng)搜索歷史

2.1.?1945年

2.1.1.?超鏈接

2.1.1.1.?美國工程師范內(nèi)瓦·布什（Vannevar Bush）

2.1.1.2.?論文《誠若所思》（As We May Think）

2.1.1.3.?一臺(tái)被稱作麥麥克斯（memex）的機(jī)器

2.1.1.3.1.?允許“關(guān)聯(lián)索引……任何被選中的東西都能立即自動(dòng)選擇另一個(gè)東西”

2.1.1.3.2.?一種早期的超鏈接

2.2.?1994年

2.2.1.?Infoseek

2.2.2.?Lycos

2.3.?1995年

2.3.1.?AltaVista

2.4.?1999年

2.4.1.?AltaVista遞交的美國專利文件《索引的限制搜索》（“Constrained searching of an index”）中描述了元詞把戲

3.?兩大主要任務(wù)

3.1.?匹配（matching）

3.2.?排名（ranking）

4.?匹配算法

4.1.?AltaVista：互聯(lián)網(wǎng)級別的第一種匹配算法

4.1.1.?20世紀(jì)90年代中期，AltaVista是搜索引擎的王者

4.1.2.?有史以來第一次，有一個(gè)搜索引擎能完全索引互聯(lián)網(wǎng)上每個(gè)頁面的全部文本

4.2.?有效匹配只是高效搜索引擎的一大挑戰(zhàn)

4.3.?索引

4.3.1.?是所有搜索引擎背后最基礎(chǔ)的思想

4.3.2.?是計(jì)算機(jī)科學(xué)中最古老的有用思想

4.3.3.?互聯(lián)網(wǎng)搜索引擎的索引和一本書的索引有著相同的工作原理

4.3.3.1.?“書頁”現(xiàn)在成了萬維網(wǎng)上的網(wǎng)頁

4.3.3.2.?搜索引擎則給互聯(lián)網(wǎng)上的每個(gè)網(wǎng)頁分配了一個(gè)不同的頁碼

4.3.4.?索引不僅應(yīng)該存儲(chǔ)頁碼，還要存儲(chǔ)信息在頁面內(nèi)的位置

5.?排名和鄰度

5.1.?查詢詞彼此相鄰的網(wǎng)頁比那些查詢詞相距很遠(yuǎn)的網(wǎng)頁相關(guān)度更高

5.2.?搜索引擎在不斷地使用和鄰度有關(guān)的信息，以提高搜索排名

5.3.?“NEAR”（鄰近）關(guān)鍵詞

5.3.1.?NEAR查詢

5.4.?搜索引擎的生死由其排名的質(zhì)量決定，而通過利用網(wǎng)頁結(jié)構(gòu)，排名質(zhì)量能夠得到大幅提升

6.?元詞把戲

6.1.?Metaword Trick

6.2.?創(chuàng)建一份索引時(shí)，囊括所有元詞是件很簡單的事

6.3.?標(biāo)題查詢和其他取決于網(wǎng)頁結(jié)構(gòu)的“結(jié)構(gòu)查詢”類似于NEAR查詢

7.?排名算法

7.1.?PageRank

7.1.1.?一種對網(wǎng)頁排名的算法

7.1.2.?主要發(fā)明者拉里·佩奇的排名算法

7.1.3.?學(xué)術(shù)會(huì)議論文《解析大規(guī)模超文本網(wǎng)絡(luò)搜索引擎》（The Anatomy of a Large-Scale Hypertextual Web Search Engine）

7.1.4.?核心思想

7.1.4.1.?權(quán)威性網(wǎng)頁通過超鏈接向其他網(wǎng)頁傳輸權(quán)重

7.2.?基于鏈接的排名算法（Link-based Ranking Algorithms）

7.3.?超鏈接

7.3.1.?網(wǎng)頁上的一個(gè)短語，當(dāng)你點(diǎn)擊它時(shí)，你將被帶到另一個(gè)網(wǎng)頁

7.3.2.?一個(gè)網(wǎng)頁的鏈入鏈接數(shù)可能成為該網(wǎng)頁“有用性”或“權(quán)威性”的指標(biāo)

7.3.3.?人們可以濫用超鏈接把戲，人為地提高自己網(wǎng)頁的排名

7.3.3.1.?搜索引擎稱這種濫用為網(wǎng)絡(luò)垃圾Web Spam

7.3.4.?一個(gè)有許多鏈入鏈接的網(wǎng)頁應(yīng)該有高排名

7.4.?權(quán)重

7.4.1.?來自高權(quán)重網(wǎng)頁的鏈接排名要比來自低權(quán)重網(wǎng)頁鏈接的排名高

7.4.2.?所有網(wǎng)頁的初始權(quán)重值（Authority Score）都是1

7.4.2.1.?如果一個(gè)網(wǎng)頁有鏈入鏈接，在計(jì)算該網(wǎng)頁權(quán)重時(shí)就要加入指向其網(wǎng)頁的權(quán)重

7.4.2.2.?如果X和Y網(wǎng)頁鏈接Z網(wǎng)頁，那么Z網(wǎng)頁的權(quán)重就是X網(wǎng)頁和Y網(wǎng)頁權(quán)重相加的值

7.4.3.?和來自低權(quán)重網(wǎng)頁的鏈入鏈接相比，一個(gè)來自高權(quán)重網(wǎng)頁的鏈入鏈接應(yīng)該更能證明一個(gè)網(wǎng)頁的排名

7.5.?隨機(jī)訪問者

7.5.1.?超鏈接很有可能形成“循環(huán)”（cycle）

7.5.1.1.?隨機(jī)訪問者解決這個(gè)“雞生蛋還是蛋生雞”的問題

7.5.1.2.?不管超鏈接有沒有形成循環(huán)，隨機(jī)訪問者把戲都能完美地運(yùn)作

7.5.2.?關(guān)鍵點(diǎn)

7.5.2.1.?每次訪問一個(gè)網(wǎng)頁時(shí)，都有一個(gè)固定的重新訪問概率（大概是15%），讓訪問者不從已有的超鏈接中挑選一個(gè)并點(diǎn)擊

7.5.2.2.?網(wǎng)頁的訪問者權(quán)重值（Surfer Authority Score）

7.5.2.2.1.?一名隨機(jī)訪問者訪問該網(wǎng)頁的時(shí)間比例

7.5.3.?一個(gè)有許多鏈入鏈接的網(wǎng)頁被訪問的概率較大

7.5.4.?和一個(gè)來自不知名網(wǎng)頁的鏈接相比，訪問者更有可能繼續(xù)點(diǎn)擊一個(gè)來自知名網(wǎng)頁的鏈入鏈接

7.5.5.?每個(gè)網(wǎng)頁鏈入鏈接的質(zhì)量和數(shù)量都會(huì)被納入考慮范圍

7.6.?搜索引擎并非通過模擬隨機(jī)訪問者來計(jì)算PageRank值：它們使用像隨機(jī)訪問者模擬一樣給出相同答案的數(shù)學(xué)技巧，但計(jì)算成本要低很多

7.6.1.?商業(yè)搜索引擎中用來判定排名的算法要比PageRank這類基于鏈接的排名算法多得多

到了這里，關(guān)于讀改變未來的九大算法筆記07_搜索引擎的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

讀改變未來的九大算法筆記08_并非萬能的算法
2.1.1.1.?Alonzo Church 2.1.1.2.?在計(jì)算理論上的突破性工作至今仍是計(jì)算機(jī)科學(xué)許多方面的基礎(chǔ) 2.1.1.3.?單獨(dú)發(fā)現(xiàn)了不可判定問題的存在 2.1.1.3.1.?比圖靈早幾個(gè)月發(fā)表了自己的成果 2.1.1.3.2.?邱奇的公式更為抽象，且并未詳盡地提及由機(jī)器執(zhí)行的計(jì)算 5.3.1.1.?如果輸入會(huì)崩潰，那么
2024年02月08日
瀏覽(17)
讀改變未來的九大算法筆記05_數(shù)字簽名
3.3.1.1.?鐘大小為11的乘法表 3.5.2.1.?歐幾里得算法也能根據(jù)鑰匙值計(jì)算出掛鎖值，而這一算法要比暴力破解高效得多。這也是乘法方法被認(rèn)為不安全的原因 4.2.1.1.?鐘大小為22時(shí)n的三次方和七次方的值 4.5.1.1.?發(fā)明一種高效的分解因子算法只會(huì)破壞類RSA機(jī)制
2024年02月08日
瀏覽(16)
讀改變未來的九大算法筆記02_數(shù)據(jù)庫
? 2.1.1.?當(dāng)一個(gè)程序崩潰時(shí)，它會(huì)丟掉所有正在處理的東西 2.1.2.?只有安放在計(jì)算機(jī)文件系統(tǒng)中的信息會(huì)得到保存 2.1.3.?崩潰相當(dāng)寬泛：包括任何可能導(dǎo)致計(jì)算機(jī)停止運(yùn)行進(jìn)而損失數(shù)據(jù)的事 2.1.3.1.?可能的事件包括斷電、硬盤出錯(cuò)、其他硬件出錯(cuò)，以及操作系統(tǒng)或應(yīng)用程序中的
2024年02月08日
瀏覽(17)
讀改變未來的九大算法筆記09_指尖的精靈
5.1.2.1.?編譯器 5.1.2.2.?程序驗(yàn)證技術(shù) 5.2.2.1.?排序算法（快速排序等） 5.2.2.2.?圖形算法（迪杰斯特拉最短路徑算法等） 5.2.2.3.?數(shù)據(jù)結(jié)構(gòu)（哈希表等） 5.3.2.1.?CPU（中央處理器） 5.3.2.2.?監(jiān)視器 5.3.2.3.?網(wǎng)絡(luò)
2024年02月08日
瀏覽(15)
ChatGPT熱炒之前搜索引擎SEO算法已經(jīng)悄然改變
2022年4月起，某度算法有了新的調(diào)整，這對于靠SEO獲得流量的公司簡直可以說是滅頂之災(zāi)。原本SEO從業(yè)者還指望跟之前一樣，等算法調(diào)整穩(wěn)定后，網(wǎng)站的自然排名還會(huì)再回來，但等到了10月份，仍然沒有回暖的跡象，大家這才不得不面對現(xiàn)實(shí)，總結(jié)這次算法調(diào)整后的特點(diǎn)。特
2023年04月23日
瀏覽(22)
day07 Elasticsearch搜索引擎3
聚合（aggregations）可以讓我們極其方便的實(shí)現(xiàn)對文檔數(shù)據(jù)的統(tǒng)計(jì)、分析、運(yùn)算。例如：什么品牌的手機(jī)最受歡迎？這些手機(jī)的平均價(jià)格、最高價(jià)格、最低價(jià)格？這些手機(jī)每月的銷售情況如何？實(shí)現(xiàn)這些統(tǒng)計(jì)功能比數(shù)據(jù)庫的sql要方便得多，而且查詢速度非?？欤梢詫?shí)現(xiàn)實(shí)時(shí)
2024年02月01日
瀏覽(16)
數(shù)據(jù)結(jié)構(gòu)與算法之美學(xué)習(xí)筆記：42 | 動(dòng)態(tài)規(guī)劃實(shí)戰(zhàn)：如何實(shí)現(xiàn)搜索引擎中的拼寫糾錯(cuò)功能？
本節(jié)課程思維導(dǎo)圖：利用 Trie 樹，可以實(shí)現(xiàn)搜索引擎的提示功能，這樣可以節(jié)省用戶輸入搜索的時(shí)間。實(shí)際上，搜索引擎在用戶體驗(yàn)方面的優(yōu)化還有很多，比如你可能經(jīng)常會(huì)用的拼寫糾錯(cuò)功能。當(dāng)你在搜索框中，一不小心輸錯(cuò)單詞時(shí)，搜索引擎會(huì)非常智能地檢
2024年02月03日
瀏覽(24)
深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎
深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎文章目錄 ???作者簡介：機(jī)器學(xué)習(xí)，深度學(xué)習(xí)，卷積神經(jīng)網(wǎng)絡(luò)處理，圖像處理 ??B站項(xiàng)目實(shí)戰(zhàn)：https://space.bilibili.com/364224477 ?? 如果文章對你有幫助的話，歡迎評論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ ???♂代碼獲?。篅個(gè)人主頁給定一個(gè)
2024年02月03日
瀏覽(28)
搜索引擎筆記
科技行業(yè)一直有個(gè)原則, 即人們不會(huì)愿意改變自己的使用習(xí)慣。Ramaswamy 在采訪中坦言, “我們面臨的最大障礙之一, 確實(shí)就是扭轉(zhuǎn)用戶的固有習(xí)慣。人們忘記了谷歌的成功不僅僅是開發(fā)出了更好的產(chǎn)品。為了實(shí)現(xiàn)目標(biāo), 我們必須做出一系列精準(zhǔn)的分發(fā)決策。” 據(jù)報(bào)道, 谷歌每年
2024年02月12日
瀏覽(19)
算法畢業(yè)設(shè)計(jì) 深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎(源碼分享)
今天學(xué)長向大家分享一個(gè)畢業(yè)設(shè)計(jì)項(xiàng)目畢業(yè)設(shè)計(jì) 深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎(源碼分享) 項(xiàng)目運(yùn)行效果：畢業(yè)設(shè)計(jì) 深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎項(xiàng)目獲?。?https://gitee.com/sinonfin/algorithm-sharing 圖像檢索：是從一堆圖片中找到與待匹配的圖像相似的圖片，就是
2024年02月03日
瀏覽(26)