国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

讀改變未來的九大算法筆記07_搜索引擎

這篇具有很好參考價(jià)值的文章主要介紹了讀改變未來的九大算法筆記07_搜索引擎。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

讀改變未來的九大算法筆記07_搜索引擎文章來源地址http://www.zghlxwxcb.cn/news/detail-476477.html

1.?車庫軼事

1.1.?1939年

1.1.1.?戴夫·休利特(Dave Hewlett)

1.1.1.1.?惠普(Hewlett-Packard)

1.2.?1976年

1.2.1.?蒂夫·喬布斯(Steve Jobs)和史蒂夫·沃茲尼亞克(Steve Wozniak)

1.2.1.1.?從一間臥室開始的,空間很快就不夠用了,于是他們轉(zhuǎn)移到了車庫

1.3.?1998年

1.3.1.?佩奇和布林

1.3.1.1.?谷歌

1.3.1.1.1.?門洛帕克車庫

2.?互聯(lián)網(wǎng)搜索歷史

2.1.?1945年

2.1.1.?超鏈接

2.1.1.1.?美國工程師范內(nèi)瓦·布什(Vannevar Bush)

2.1.1.2.?論文《誠若所思》(As We May Think)

2.1.1.3.?一臺(tái)被稱作麥麥克斯(memex)的機(jī)器

2.1.1.3.1.?允許“關(guān)聯(lián)索引……任何被選中的東西都能立即自動(dòng)選擇另一個(gè)東西”
2.1.1.3.2.?一種早期的超鏈接

2.2.?1994年

2.2.1.?Infoseek

2.2.2.?Lycos

2.3.?1995年

2.3.1.?AltaVista

2.4.?1999年

2.4.1.?AltaVista遞交的美國專利文件《索引的限制搜索》(“Constrained searching of an index”)中描述了元詞把戲

3.?兩大主要任務(wù)

3.1.?匹配(matching)

3.2.?排名(ranking)

4.?匹配算法

4.1.?AltaVista:互聯(lián)網(wǎng)級別的第一種匹配算法

4.1.1.?20世紀(jì)90年代中期,AltaVista是搜索引擎的王者

4.1.2.?有史以來第一次,有一個(gè)搜索引擎能完全索引互聯(lián)網(wǎng)上每個(gè)頁面的全部文本

4.2.?有效匹配只是高效搜索引擎的一大挑戰(zhàn)

4.3.?索引

4.3.1.?是所有搜索引擎背后最基礎(chǔ)的思想

4.3.2.?是計(jì)算機(jī)科學(xué)中最古老的有用思想

4.3.3.?互聯(lián)網(wǎng)搜索引擎的索引和一本書的索引有著相同的工作原理

4.3.3.1.?“書頁”現(xiàn)在成了萬維網(wǎng)上的網(wǎng)頁

4.3.3.2.?搜索引擎則給互聯(lián)網(wǎng)上的每個(gè)網(wǎng)頁分配了一個(gè)不同的頁碼

4.3.4.?索引不僅應(yīng)該存儲(chǔ)頁碼,還要存儲(chǔ)信息在頁面內(nèi)的位置

5.?排名和鄰度

5.1.?查詢詞彼此相鄰的網(wǎng)頁比那些查詢詞相距很遠(yuǎn)的網(wǎng)頁相關(guān)度更高

5.2.?搜索引擎在不斷地使用和鄰度有關(guān)的信息,以提高搜索排名

5.3.?“NEAR”(鄰近)關(guān)鍵詞

5.3.1.?NEAR查詢

5.4.?搜索引擎的生死由其排名的質(zhì)量決定,而通過利用網(wǎng)頁結(jié)構(gòu),排名質(zhì)量能夠得到大幅提升

6.?元詞把戲

6.1.?Metaword Trick

6.2.?創(chuàng)建一份索引時(shí),囊括所有元詞是件很簡單的事

6.3.?標(biāo)題查詢和其他取決于網(wǎng)頁結(jié)構(gòu)的“結(jié)構(gòu)查詢”類似于NEAR查詢

7.?排名算法

7.1.?PageRank

7.1.1.?一種對網(wǎng)頁排名的算法

7.1.2.?主要發(fā)明者拉里·佩奇的排名算法

7.1.3.?學(xué)術(shù)會(huì)議論文《解析大規(guī)模超文本網(wǎng)絡(luò)搜索引擎》(The Anatomy of a Large-Scale Hypertextual Web Search Engine)

7.1.4.?核心思想

7.1.4.1.?權(quán)威性網(wǎng)頁通過超鏈接向其他網(wǎng)頁傳輸權(quán)重

7.2.?基于鏈接的排名算法(Link-based Ranking Algorithms)

7.3.?超鏈接

7.3.1.?網(wǎng)頁上的一個(gè)短語,當(dāng)你點(diǎn)擊它時(shí),你將被帶到另一個(gè)網(wǎng)頁

7.3.2.?一個(gè)網(wǎng)頁的鏈入鏈接數(shù)可能成為該網(wǎng)頁“有用性”或“權(quán)威性”的指標(biāo)

7.3.3.?人們可以濫用超鏈接把戲,人為地提高自己網(wǎng)頁的排名

7.3.3.1.?搜索引擎稱這種濫用為網(wǎng)絡(luò)垃圾Web Spam

7.3.4.?一個(gè)有許多鏈入鏈接的網(wǎng)頁應(yīng)該有高排名

7.4.?權(quán)重

7.4.1.?來自高權(quán)重網(wǎng)頁的鏈接排名要比來自低權(quán)重網(wǎng)頁鏈接的排名高

7.4.2.?所有網(wǎng)頁的初始權(quán)重值(Authority Score)都是1

7.4.2.1.?如果一個(gè)網(wǎng)頁有鏈入鏈接,在計(jì)算該網(wǎng)頁權(quán)重時(shí)就要加入指向其網(wǎng)頁的權(quán)重

7.4.2.2.?如果X和Y網(wǎng)頁鏈接Z網(wǎng)頁,那么Z網(wǎng)頁的權(quán)重就是X網(wǎng)頁和Y網(wǎng)頁權(quán)重相加的值

7.4.3.?和來自低權(quán)重網(wǎng)頁的鏈入鏈接相比,一個(gè)來自高權(quán)重網(wǎng)頁的鏈入鏈接應(yīng)該更能證明一個(gè)網(wǎng)頁的排名

7.5.?隨機(jī)訪問者

7.5.1.?超鏈接很有可能形成“循環(huán)”(cycle)

7.5.1.1.?隨機(jī)訪問者解決這個(gè)“雞生蛋還是蛋生雞”的問題

7.5.1.2.?不管超鏈接有沒有形成循環(huán),隨機(jī)訪問者把戲都能完美地運(yùn)作

7.5.2.?關(guān)鍵點(diǎn)

7.5.2.1.?每次訪問一個(gè)網(wǎng)頁時(shí),都有一個(gè)固定的重新訪問概率(大概是15%),讓訪問者不從已有的超鏈接中挑選一個(gè)并點(diǎn)擊

7.5.2.2.?網(wǎng)頁的訪問者權(quán)重值(Surfer Authority Score)

7.5.2.2.1.?一名隨機(jī)訪問者訪問該網(wǎng)頁的時(shí)間比例

7.5.3.?一個(gè)有許多鏈入鏈接的網(wǎng)頁被訪問的概率較大

7.5.4.?和一個(gè)來自不知名網(wǎng)頁的鏈接相比,訪問者更有可能繼續(xù)點(diǎn)擊一個(gè)來自知名網(wǎng)頁的鏈入鏈接

7.5.5.?每個(gè)網(wǎng)頁鏈入鏈接的質(zhì)量和數(shù)量都會(huì)被納入考慮范圍

7.6.?搜索引擎并非通過模擬隨機(jī)訪問者來計(jì)算PageRank值:它們使用像隨機(jī)訪問者模擬一樣給出相同答案的數(shù)學(xué)技巧,但計(jì)算成本要低很多

7.6.1.?商業(yè)搜索引擎中用來判定排名的算法要比PageRank這類基于鏈接的排名算法多得多

到了這里,關(guān)于讀改變未來的九大算法筆記07_搜索引擎的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 讀改變未來的九大算法筆記08_并非萬能的算法

    讀改變未來的九大算法筆記08_并非萬能的算法

    2.1.1.1.?Alonzo Church 2.1.1.2.?在計(jì)算理論上的突破性工作至今仍是計(jì)算機(jī)科學(xué)許多方面的基礎(chǔ) 2.1.1.3.?單獨(dú)發(fā)現(xiàn)了不可判定問題的存在 2.1.1.3.1.?比圖靈早幾個(gè)月發(fā)表了自己的成果 2.1.1.3.2.?邱奇的公式更為抽象,且并未詳盡地提及由機(jī)器執(zhí)行的計(jì)算 5.3.1.1.?如果輸入會(huì)崩潰,那么

    2024年02月08日
    瀏覽(17)
  • 讀改變未來的九大算法筆記05_數(shù)字簽名

    讀改變未來的九大算法筆記05_數(shù)字簽名

    3.3.1.1.?鐘大小為11的乘法表 3.5.2.1.?歐幾里得算法也能根據(jù)鑰匙值計(jì)算出掛鎖值,而這一算法要比暴力破解高效得多。這也是乘法方法被認(rèn)為不安全的原因 4.2.1.1.?鐘大小為22時(shí)n的三次方和七次方的值 4.5.1.1.?發(fā)明一種高效的分解因子算法只會(huì)破壞類RSA機(jī)制

    2024年02月08日
    瀏覽(16)
  • 讀改變未來的九大算法筆記02_數(shù)據(jù)庫

    讀改變未來的九大算法筆記02_數(shù)據(jù)庫

    ? 2.1.1.?當(dāng)一個(gè)程序崩潰時(shí),它會(huì)丟掉所有正在處理的東西 2.1.2.?只有安放在計(jì)算機(jī)文件系統(tǒng)中的信息會(huì)得到保存 2.1.3.?崩潰相當(dāng)寬泛:包括任何可能導(dǎo)致計(jì)算機(jī)停止運(yùn)行進(jìn)而損失數(shù)據(jù)的事 2.1.3.1.?可能的事件包括斷電、硬盤出錯(cuò)、其他硬件出錯(cuò),以及操作系統(tǒng)或應(yīng)用程序中的

    2024年02月08日
    瀏覽(17)
  • 讀改變未來的九大算法筆記09_指尖的精靈

    讀改變未來的九大算法筆記09_指尖的精靈

    5.1.2.1.?編譯器 5.1.2.2.?程序驗(yàn)證技術(shù) 5.2.2.1.?排序算法(快速排序等) 5.2.2.2.?圖形算法(迪杰斯特拉最短路徑算法等) 5.2.2.3.?數(shù)據(jù)結(jié)構(gòu)(哈希表等) 5.3.2.1.?CPU(中央處理器) 5.3.2.2.?監(jiān)視器 5.3.2.3.?網(wǎng)絡(luò)

    2024年02月08日
    瀏覽(15)
  • ChatGPT熱炒之前 搜索引擎SEO算法已經(jīng)悄然改變

    ChatGPT熱炒之前 搜索引擎SEO算法已經(jīng)悄然改變

    2022年4月起,某度算法有了新的調(diào)整,這對于靠SEO獲得流量的公司簡直可以說是滅頂之災(zāi)。原本SEO從業(yè)者還指望跟之前一樣,等算法調(diào)整穩(wěn)定后,網(wǎng)站的自然排名還會(huì)再回來,但等到了10月份,仍然沒有回暖的跡象,大家這才不得不面對現(xiàn)實(shí),總結(jié)這次算法調(diào)整后的特點(diǎn)。 特

    2023年04月23日
    瀏覽(22)
  • day07 Elasticsearch搜索引擎3

    day07 Elasticsearch搜索引擎3

    聚合(aggregations)可以讓我們極其方便的實(shí)現(xiàn)對文檔數(shù)據(jù)的統(tǒng)計(jì)、分析、運(yùn)算。例如: 什么品牌的手機(jī)最受歡迎? 這些手機(jī)的平均價(jià)格、最高價(jià)格、最低價(jià)格? 這些手機(jī)每月的銷售情況如何? 實(shí)現(xiàn)這些統(tǒng)計(jì)功能比數(shù)據(jù)庫的sql要方便得多,而且查詢速度非??欤梢詫?shí)現(xiàn)實(shí)時(shí)

    2024年02月01日
    瀏覽(16)
  • 數(shù)據(jù)結(jié)構(gòu)與算法之美學(xué)習(xí)筆記:42 | 動(dòng)態(tài)規(guī)劃實(shí)戰(zhàn):如何實(shí)現(xiàn)搜索引擎中的拼寫糾錯(cuò)功能?

    數(shù)據(jù)結(jié)構(gòu)與算法之美學(xué)習(xí)筆記:42 | 動(dòng)態(tài)規(guī)劃實(shí)戰(zhàn):如何實(shí)現(xiàn)搜索引擎中的拼寫糾錯(cuò)功能?

    本節(jié)課程思維導(dǎo)圖: 利用 Trie 樹,可以實(shí)現(xiàn)搜索引擎的提示功能,這樣可以節(jié)省用戶輸入搜索的時(shí)間。實(shí)際上,搜索引擎在用戶體驗(yàn)方面的優(yōu)化還有很多,比如你可能經(jīng)常會(huì)用的拼寫糾錯(cuò)功能。 當(dāng)你在搜索框中,一不小心輸錯(cuò)單詞時(shí),搜索引擎會(huì)非常智能地檢

    2024年02月03日
    瀏覽(24)
  • 深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎

    深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎

    深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎 文章目錄 ???作者簡介: 機(jī)器學(xué)習(xí),深度學(xué)習(xí),卷積神經(jīng)網(wǎng)絡(luò)處理,圖像處理 ??B站項(xiàng)目實(shí)戰(zhàn):https://space.bilibili.com/364224477 ?? 如果文章對你有幫助的話, 歡迎評論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ ???♂代碼獲?。篅個(gè)人主頁 給定一個(gè)

    2024年02月03日
    瀏覽(28)
  • 搜索引擎 筆記

    科技行業(yè)一直有個(gè)原則, 即人們不會(huì)愿意改變自己的使用習(xí)慣。Ramaswamy 在采訪中坦言, “我們面臨的最大障礙之一, 確實(shí)就是扭轉(zhuǎn)用戶的固有習(xí)慣。人們忘記了谷歌的成功不僅僅是開發(fā)出了更好的產(chǎn)品。為了實(shí)現(xiàn)目標(biāo), 我們必須做出一系列精準(zhǔn)的分發(fā)決策。” 據(jù)報(bào)道, 谷歌每年

    2024年02月12日
    瀏覽(19)
  • 算法畢業(yè)設(shè)計(jì) 深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎(源碼分享)

    算法畢業(yè)設(shè)計(jì) 深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎(源碼分享)

    今天學(xué)長向大家分享一個(gè)畢業(yè)設(shè)計(jì)項(xiàng)目 畢業(yè)設(shè)計(jì) 深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎(源碼分享) 項(xiàng)目運(yùn)行效果: 畢業(yè)設(shè)計(jì) 深度學(xué)習(xí)圖像搜索算法-圖像搜索引擎 項(xiàng)目獲?。?https://gitee.com/sinonfin/algorithm-sharing 圖像檢索:是從一堆圖片中找到與待匹配的圖像相似的圖片,就是

    2024年02月03日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包