国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

如何使用索引加速 SQL 查詢 [Python 版]

2年前作者：ygtu2018分類：Toy博客閱讀(632)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了如何使用索引加速 SQL 查詢 [Python 版]。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

推薦：使用 NSDT場(chǎng)景編輯器助你快速搭建可二次編輯器的3D應(yīng)用場(chǎng)景

假設(shè)您正在篩選一本書的頁面。而且您希望更快地找到所需的信息。你是怎么做到的？好吧，您可能會(huì)查找術(shù)語索引，然后跳轉(zhuǎn)到引用特定術(shù)語的頁面。SQL 中的索引的工作方式與書籍中的索引類似。

在大多數(shù)實(shí)際系統(tǒng)中，您將針對(duì)具有大量行（例如數(shù)百萬行）的數(shù)據(jù)庫表運(yùn)行查詢。需要全表掃描所有行以檢索結(jié)果的查詢將非常慢。如果您知道必須經(jīng)?；谀承┝胁樵冃畔ⅲ瑒t可以在這些列上創(chuàng)建數(shù)據(jù)庫索引。這將大大加快查詢速度。

那么我們今天會(huì)學(xué)到什么呢？我們將學(xué)習(xí)使用 sqlite3 模塊在 Python 中連接和查詢 SQLite 數(shù)據(jù)庫。我們還將學(xué)習(xí)如何添加索引，并了解它如何提高性能。

要按照本教程編寫代碼，您應(yīng)該在工作環(huán)境中安裝 Python 3.7+ 和 SQLite。

注意：本教程中的示例和示例輸出適用于 Ubuntu LTS 3.10 上的 Python 3.3 和 SQLite37（版本 2.22.04）。

在 Python 中連接到數(shù)據(jù)庫

我們將使用內(nèi)置的 sqlite3 模塊。在開始運(yùn)行查詢之前，我們需要：

連接到數(shù)據(jù)庫
創(chuàng)建數(shù)據(jù)庫游標(biāo)以運(yùn)行查詢

若要連接到數(shù)據(jù)庫，我們將使用

來自 sqlite3 模塊的 connect（）函數(shù)。建立連接后，我們可以調(diào)用連接對(duì)象來創(chuàng)建數(shù)據(jù)庫游標(biāo)，如下所示：cursor()

import sqlite3

# connect to the db
db_conn = sqlite3.connect('people_db.db')
db_cursor = db_conn.cursor()

在這里，我們嘗試連接到數(shù)據(jù)庫

people_db.如果數(shù)據(jù)庫不存在，運(yùn)行上面的代碼片段將為我們創(chuàng)建 sqlite 數(shù)據(jù)庫。

創(chuàng)建表并插入記錄

現(xiàn)在，我們將在數(shù)據(jù)庫中創(chuàng)建一個(gè)表，并用記錄填充它。

讓我們?cè)跀?shù)據(jù)庫中創(chuàng)建一個(gè)名為?people?的表，其中包含以下字段：people_db

名字
電子郵件
工作

# main.py
...
# create table
db_cursor.execute('''CREATE TABLE people (
                  id INTEGER PRIMARY KEY,
                  name TEXT,
                  email TEXT,
                  job TEXT)''')


...

# commit the transaction and close the cursor and db connection
db_conn.commit()
db_cursor.close()
db_conn.close()

使用偽造器生成合成數(shù)據(jù)

我們現(xiàn)在必須在表中插入記錄。為此，我們將使用?Faker——一個(gè)用于合成數(shù)據(jù)生成的 Python 包——可通過?pip?安裝：

$ pip install faker

安裝faker后，可以將類導(dǎo)入到Python腳本中：Faker

# main.py
...
from faker import Faker
...

下一步是生成記錄并將其插入人員表。為了讓我們知道索引如何加快查詢速度，讓我們插入大量記錄。在這里，我們將插入 100K 條記錄;將變量設(shè)置為 100000。num_records

然后，我們執(zhí)行以下操作：

實(shí)例化一個(gè)對(duì)象并設(shè)置種子，以便我們獲得可重現(xiàn)性。Fakerfake
使用名字和姓氏獲取名稱字符串 - 通過調(diào)用對(duì)象和對(duì)象。first_name()last_name()fake
通過調(diào)用生成假域。domain_name()
使用名字和姓氏以及域生成電子郵件字段。
使用獲取每個(gè)單獨(dú)記錄的作業(yè)。job()

我們生成記錄并將其插入到表中：people

# create and insert records
fake = Faker() # be sure to import: from faker import Faker 
Faker.seed(42)

num_records = 100000

for _ in range(num_records):
    first = fake.first_name()
    last = fake.last_name()
    name = f"{first} {last}"
    domain = fake.domain_name()
    email = f"{first}.{last}@{domain}"
    job = fake.job()
    db_cursor.execute('INSERT INTO people (name, email, job) VALUES (?,?,?)', (name,email,job))

# commit the transaction and close the cursor and db connection
db_conn.commit()
db_cursor.close()
db_conn.close()

現(xiàn)在，main.py 文件具有以下代碼：

# main.py
# imports
import sqlite3
from faker import Faker

# connect to the db
db_conn = sqlite3.connect('people_db.db')
db_cursor = db_conn.cursor()

# create table
db_cursor.execute('''CREATE TABLE people (
                  id INTEGER PRIMARY KEY,
                  name TEXT,
                  email TEXT,
                  job TEXT)''')


# create and insert records
fake = Faker()
Faker.seed(42)

num_records = 100000

for _ in range(num_records):
    first = fake.first_name()
    last = fake.last_name()
    name = f"{first} {last}"
    domain = fake.domain_name()
    email = f"{first}.{last}@{domain}"
    job = fake.job()
    db_cursor.execute('INSERT INTO people (name, email, job) VALUES (?,?,?)', (name,email,job))

# commit the transaction and close the cursor and db connection
db_conn.commit()
db_cursor.close()
db_conn.close()

運(yùn)行此腳本一次，以使用記錄數(shù)填充表。num_records

查詢數(shù)據(jù)庫

現(xiàn)在我們有了包含 100K 條記錄的表，讓我們對(duì)表運(yùn)行一個(gè)示例查詢。people

讓我們運(yùn)行一個(gè)查詢來：

獲取職位名稱為“產(chǎn)品經(jīng)理”的記錄的名稱和電子郵件，以及
將查詢結(jié)果限制為 10 條記錄。

我們將使用 time 模塊中的默認(rèn)計(jì)時(shí)器來獲取查詢的大致執(zhí)行時(shí)間。

# sample_query.py

import sqlite3
import time

db_conn = sqlite3.connect("people_db.db")
db_cursor = db_conn.cursor()

t1 = time.perf_counter_ns()

db_cursor.execute("SELECT name, email FROM people WHERE job='Product manager' LIMIT 10;")

res = db_cursor.fetchall()
t2 = time.perf_counter_ns()

print(res)
print(f"Query time without index: {(t2-t1)/1000} us")

下面是輸出：

Output >>
[
    ("Tina Woods", "Tina.Woods@smith.com"),
    ("Toni Jackson", "Toni.Jackson@underwood.com"),
    ("Lisa Miller", "Lisa.Miller@solis-west.info"),
    ("Katherine Guerrero", "Katherine.Guerrero@schmidt-price.org"),
    ("Michelle Lane", "Michelle.Lane@carr-hardy.com"),
    ("Jane Johnson", "Jane.Johnson@graham.com"),
    ("Matthew Odom", "Matthew.Odom@willis.biz"),
    ("Isaac Daniel", "Isaac.Daniel@peck.com"),
    ("Jay Byrd", "Jay.Byrd@bailey.info"),
    ("Thomas Kirby", "Thomas.Kirby@west.com"),
]

Query time without index: 448.275 us

您還可以通過在命令行運(yùn)行來調(diào)用 SQLite 命令行客戶端：sqlite3 db_name

$ sqlite3 people_db.db
SQLite version 3.37.2 2022-01-06 13:25:41
Enter ".help" for usage hints.

要獲取索引列表，您可以運(yùn)行：.index

sqlite> .index

由于當(dāng)前沒有索引，因此不會(huì)列出任何索引。

您還可以像這樣檢查查詢計(jì)劃：

sqlite> EXPLAIN QUERY PLAN SELECT name, email FROM people WHERE job='Product Manager' LIMIT 10;
QUERY PLAN
`--SCAN people

這里的查詢計(jì)劃是掃描所有效率低下的行。

在特定列上創(chuàng)建索引

若要在特定列上創(chuàng)建數(shù)據(jù)庫索引，可以使用以下語法：

CREATE INDEX index-name on table (column(s))

假設(shè)我們需要經(jīng)常查找具有特定職位的個(gè)人的記錄。在作業(yè)列上創(chuàng)建索引會(huì)有所幫助：people_job_index

# create_index.py

import time
import sqlite3

db_conn = sqlite3.connect('people_db.db')

db_cursor =db_conn.cursor()

t1 = time.perf_counter_ns()

db_cursor.execute("CREATE INDEX people_job_index ON people (job)")

t2 = time.perf_counter_ns()

db_conn.commit()

print(f"Time to create index: {(t2 - t1)/1000} us")


Output >>
Time to create index: 338298.6 us

盡管創(chuàng)建索引需要這么長時(shí)間，但這是一次性操作。運(yùn)行多個(gè)查詢時(shí)，您仍將獲得顯著的加速。

現(xiàn)在，如果您在 SQLite 命令行客戶端上運(yùn)行，您將獲得：.index

sqlite> .index
people_job_index

使用索引查詢數(shù)據(jù)庫

如果您現(xiàn)在查看查詢計(jì)劃，您應(yīng)該能夠看到我們現(xiàn)在使用作業(yè)列上的索引搜索表：peoplepeople_job_index

sqlite> EXPLAIN QUERY PLAN SELECT name, email FROM people WHERE job='Product manager' LIMIT 10;
QUERY PLAN
`--SEARCH people USING INDEX people_job_index (job=?)

您可以重新運(yùn)行sample_query.py。僅修改語句并查看查詢現(xiàn)在運(yùn)行需要多長時(shí)間：print()

# sample_query.py

import sqlite3
import time

db_conn = sqlite3.connect("people_db.db")
db_cursor = db_conn.cursor()

t1 = time.perf_counter_ns()

db_cursor.execute("SELECT name, email FROM people WHERE job='Product manager' LIMIT 10;")

res = db_cursor.fetchall()
t2 = time.perf_counter_ns()

print(res)
print(f"Query time with index: {(t2-t1)/1000} us")

下面是輸出：

Output >>
[
    ("Tina Woods", "Tina.Woods@smith.com"),
    ("Toni Jackson", "Toni.Jackson@underwood.com"),
    ("Lisa Miller", "Lisa.Miller@solis-west.info"),
    ("Katherine Guerrero", "Katherine.Guerrero@schmidt-price.org"),
    ("Michelle Lane", "Michelle.Lane@carr-hardy.com"),
    ("Jane Johnson", "Jane.Johnson@graham.com"),
    ("Matthew Odom", "Matthew.Odom@willis.biz"),
    ("Isaac Daniel", "Isaac.Daniel@peck.com"),
    ("Jay Byrd", "Jay.Byrd@bailey.info"),
    ("Thomas Kirby", "Thomas.Kirby@west.com"),
]

Query time with index: 167.179 us

我們看到查詢現(xiàn)在大約需要 167.179 微秒來執(zhí)行。

性能改進(jìn)

對(duì)于我們的示例查詢，使用 index 進(jìn)行查詢的速度大約快 2.68 倍。我們?cè)趫?zhí)行時(shí)間中獲得了 62.71% 的百分比加速。

您還可以嘗試運(yùn)行更多查詢：涉及對(duì)作業(yè)列進(jìn)行篩選并查看性能改進(jìn)的查詢。

另請(qǐng)注意：由于我們僅在作業(yè)列上創(chuàng)建了索引，因此，如果您運(yùn)行的查詢涉及其他列，則查詢的運(yùn)行速度不會(huì)比沒有索引時(shí)快。

總結(jié)和后續(xù)步驟

我希望本指南能幫助您了解在頻繁查詢的列上創(chuàng)建數(shù)據(jù)庫索引如何顯著加快查詢速度。這是對(duì)數(shù)據(jù)庫索引的介紹。您還可以創(chuàng)建多列索引、同一列的多個(gè)索引等等。

原文鏈接：如何使用索引加速 SQL 查詢 [Python 版] (mvrlink.com)文章來源地址http://www.zghlxwxcb.cn/news/detail-649284.html

到了這里，關(guān)于如何使用索引加速 SQL 查詢 [Python 版]的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

SQL函數(shù)、約束、查詢、索引和事務(wù)
目錄字符串函數(shù) 數(shù)值函數(shù) 日期函數(shù) 流程函數(shù) 多表查詢多表查詢 -- 內(nèi)連接多表查詢 -- 自連接 ?多表查詢 -- 外連接子查詢? 合并查詢? all-any 蠕蟲復(fù)制測(cè)試效率表中數(shù)據(jù)去重? ?主鍵和約束主鍵約束自增長約束索引? 事務(wù)? 事務(wù)的使用事務(wù)的隔離級(jí)別? 存儲(chǔ)引擎
2023年04月09日
瀏覽(85)
【Python】查詢SQL并用柱狀圖展示
需求：查詢2022年各月訂單量，并用柱狀圖展示 SQL： Python代碼：結(jié)果展示： ?
2024年02月13日
瀏覽(83)
淺談SQL Server索引視圖（物化視圖）以及索引視圖與查詢重寫
目錄（一）前言（二）正文 1.?物化視圖（索引視圖）與查詢重寫的基本概念 2. 創(chuàng)建測(cè)試環(huán)境（1）建表（2）寫數(shù)據(jù) 3.?索引視圖創(chuàng)建（1）創(chuàng)建語法（2）為索引視圖創(chuàng)建索引 ?4. 查詢重寫 5.?為什么查詢會(huì)被重寫 ?6.?索引視圖什么時(shí)候更新 7.?改變基于視圖的查詢之前做
2024年02月05日
瀏覽(108)
python3連接pg庫做SQL查詢
使用psycopg2連接在線數(shù)據(jù)庫PostgreSQL數(shù)據(jù)庫。 (1) 安裝psycopg2 打開命令提示符或PowerShell，并輸入以下命令來安裝psycopg2-binary： (2) 連接代碼示例，
2024年02月11日
瀏覽(91)
python連接sql server查詢數(shù)據(jù)輸出excel
要將Python連接SQL Server查詢的數(shù)據(jù)輸出到Excel文件，你可以使用 pyodbc 庫和 pandas 庫。首先，你需要安裝這些庫，可以使用以下命令：接下來，你可以使用以下代碼將SQL Server查詢的數(shù)據(jù)導(dǎo)出到Excel文件：在這個(gè)示例中，你需要將 your_server_name 、 your_database_name 、 your_username 和
2024年01月24日
瀏覽(90)
mysql高級(jí)三：sql性能優(yōu)化+索引優(yōu)化+慢查詢?nèi)罩?/a>
內(nèi)容介紹單表索引失效案例 0 、思考題：如果把 100 萬數(shù)據(jù)插入 MYSQL ，如何提高插入效率（1）關(guān)閉自動(dòng)提交，只手動(dòng)提交一次（2）刪除除主鍵索引外其他索引（3）拼寫mysql可以執(zhí)行的長sql，批量插入數(shù)據(jù) （4）使用java多線程（5）使用框架，設(shè)置屬性，實(shí)現(xiàn)批量插入 1、
2024年02月12日
瀏覽(91)
如何使用GPT作為SQL查詢引擎的自然語言
?生成的AI輸出并不總是可靠的，但是下面我會(huì)講述如何改進(jìn)你的代碼和查詢的方法，以及防止發(fā)送敏感數(shù)據(jù)的方法。與大多數(shù)生成式AI一樣，OpenAI的API的結(jié)果仍然不完美，這意味著我們不能完全信任它們。幸運(yùn)的是，現(xiàn)在我們可以編寫代碼詢問GPT如何計(jì)算響應(yīng)，然后如果認(rèn)可
2024年02月16日
瀏覽(99)
Python 通過pymssql訪問查詢操作 SQL Server數(shù)據(jù)庫
在企業(yè)應(yīng)用開發(fā)中，經(jīng)常用到應(yīng)用程序訪問數(shù)據(jù)庫的開發(fā)模式，中小企業(yè)使用的數(shù)據(jù)庫中，以ms SQL Server居多。本文就以一個(gè)簡單的實(shí)例模型，簡單介紹一下python訪問ms sql sever數(shù)據(jù)庫的方法。本文中以下面的本地SQL Server數(shù)據(jù)庫為例進(jìn)行數(shù)據(jù)庫連接，數(shù)據(jù)表的查詢、增加、刪除
2024年02月10日
瀏覽(378)
使用python在es中基本操作詳解（添加索引、查詢索引、刪除索引、判斷索引是否存在、添加數(shù)據(jù)、更新數(shù)據(jù)、查詢數(shù)據(jù)）
示例代碼1：運(yùn)行結(jié)果：示例代碼2：運(yùn)行結(jié)果：示例代碼3：運(yùn)行結(jié)果：注意：對(duì)比上面幾種建立索引的方法，是有一定區(qū)別的。根據(jù)響應(yīng)結(jié)果可以看出： es.?indices.create() 方法是標(biāo)準(zhǔn)的創(chuàng)建索引的方法，其它幾種方法在創(chuàng)建索引的同時(shí)也會(huì)生成一條數(shù)據(jù)，并且生成mappin
2024年02月11日
瀏覽(1065)
【SQL開發(fā)實(shí)戰(zhàn)技巧】系列（三十）：數(shù)倉報(bào)表場(chǎng)景?樹形(分層)查詢?nèi)绾闻判颍恳约叭绾卧跇湫尾樵冎姓_的使用where條件
【SQL開發(fā)實(shí)戰(zhàn)技巧】系列（一）:關(guān)于SQL不得不說的那些事【SQL開發(fā)實(shí)戰(zhàn)技巧】系列（二）：簡單單表查詢【SQL開發(fā)實(shí)戰(zhàn)技巧】系列（三）：SQL排序的那些事【SQL開發(fā)實(shí)戰(zhàn)技巧】系列（四）：從執(zhí)行計(jì)劃討論UNION ALL與空字符串UNION與OR的使用注意事項(xiàng) 【SQL開發(fā)實(shí)戰(zhàn)技巧】系列
2023年04月09日
瀏覽(28)