国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

布隆過濾器詳解

這篇具有很好參考價值的文章主要介紹了布隆過濾器詳解。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

介紹

本文全部代碼地址

布隆過濾器是一種高效的數(shù)據(jù)結(jié)構(gòu),用于判斷一個元素是否存在于一個集合中.它的主要優(yōu)點是速度快,空間占用少,因此在需要快速判斷某個元素是否在集合中的場合得到廣泛引用.

布隆過濾器就是一個大型的位數(shù)組和幾個不一樣的無偏hash函數(shù).所謂無偏就是能夠把元素的hash值算的比較均勻.當(dāng)布隆過濾器說某個值存在時,這個值可能不存在;當(dāng)它說某個值不存在時,那就肯定不存在.

向布隆過濾器中添加key時,會使用多個hash函數(shù)對key進行hash算得一個整數(shù)索引值然后對應(yīng)位數(shù)數(shù)組長度進行取模運算得到一個位置,每個hash函數(shù)都會算得一個不同的位置.再把位數(shù)組的這幾個位置都置為1就完成了add操作.

向布隆過濾器詢問key是否存在時,跟add一樣,也會把hash的幾個位置都算出來,看看數(shù)組中這幾個位置是否都為1,只要有一個位為0,那么就說明布隆過濾器中這個key不存在.如果都是1,這并不能說明這個key就一定存在,只是極有可能存在,因為這些位置被置為1可能是因為其他的key存在所致.如果這個位數(shù)組長度比較大,存在概率就會很大,如果這個位數(shù)組長度比較小,存在的概率就會降低.
布隆過濾器詳解

這種方法適用于數(shù)據(jù)命中不高、數(shù)據(jù)相對固定、實時性低(通常是數(shù)據(jù)集較大) 的應(yīng)用場景,代碼維護較為復(fù)雜,但是緩存空間占用很少.

實現(xiàn)

初始化數(shù)據(jù)

DROP TABLE IF EXISTS `user`;
CREATE TABLE `user`  (
    `id` varchar(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL,
    `name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
    `address` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL,
    PRIMARY KEY (`id`) USING BTREE
    ) ENGINE = InnoDB CHARACTER SET = utf8mb4 COLLATE = utf8mb4_general_ci ROW_FORMAT = Dynamic;
INSERT INTO `user` VALUES ('be079b29ddc111eda9b20242ac110003', '張三', '北京市海淀區(qū)xx街道123號');
INSERT INTO `user` VALUES ('be079b53ddc111eda9b20242ac110003', '李四', '上海市徐匯區(qū)xx路456號');
INSERT INTO `user` VALUES ('be079b95ddc111eda9b20242ac110003', '王五', '廣州市天河區(qū)xx街道789號');
INSERT INTO `user` VALUES ('be079ba4ddc111eda9b20242ac110003', '趙六', '深圳市南山區(qū)xx路321號');
INSERT INTO `user` VALUES ('be079bb8ddc111eda9b20242ac110003', '周七', '成都市高新區(qū)xx街道654號');
INSERT INTO `user` VALUES ('be079bc5ddc111eda9b20242ac110003', '黃八', '武漢市江漢區(qū)xx街道234號');
INSERT INTO `user` VALUES ('be079bd4ddc111eda9b20242ac110003', '羅九', '南京市秦淮區(qū)xx路567號');
INSERT INTO `user` VALUES ('be079be2ddc111eda9b20242ac110003', '錢十', '重慶市渝北區(qū)xx街道890號');
INSERT INTO `user` VALUES ('be079befddc111eda9b20242ac110003', '周十一', '長沙市岳麓區(qū)xx路432號');
INSERT INTO `user` VALUES ('be079bfbddc111eda9b20242ac110003', '吳十二', '西安市雁塔區(qū)xx街道765號');

代碼實現(xiàn)

這里只展示關(guān)于布隆過濾器的核心代碼

public class BloomFilterHelper<T> {

    private int numHashFunctions;

    private int bitSize;

    private Funnel<T> funnel;

    public BloomFilterHelper(Funnel<T> funnel, int expectedInsertions, double fpp) {
        Preconditions.checkArgument(funnel != null, "funnel不能為空");
        this.funnel = funnel;
        // 計算bit數(shù)組長度
        bitSize = optimalNumOfBits(expectedInsertions, fpp);
        // 計算hash方法執(zhí)行次數(shù)
        numHashFunctions = optimalNumOfHashFunctions(expectedInsertions, bitSize);
    }

    public int[] murmurHashOffset(T value) {
        int[] offset = new int[numHashFunctions];

        long hash64 = Hashing.murmur3_128().hashObject(value, funnel).asLong();
        int hash1 = (int) hash64;
        int hash2 = (int) (hash64 >>> 32);
        for (int i = 1; i <= numHashFunctions; i++) {
            int nextHash = hash1 + i * hash2;
            if (nextHash < 0) {
                nextHash = ~nextHash;
            }
            offset[i - 1] = nextHash % bitSize;
        }

        return offset;
    }

    /**
     * 計算bit數(shù)組長度
     */
    private int optimalNumOfBits(long n, double p) {
        if (p == 0) {
            // 設(shè)定最小期望長度
            p = Double.MIN_VALUE;
        }
        return (int) (-n * Math.log(p) / (Math.log(2) * Math.log(2)));
    }

    /**
     * 計算hash方法執(zhí)行次數(shù)
     */
    private int optimalNumOfHashFunctions(long n, long m) {
        return Math.max(1, (int) Math.round((double) m / n * Math.log(2)));
    }
}
@Slf4j
@Configuration
public class BloomFilterConfig implements InitializingBean {


    @Autowired
    private StringRedisTemplate template;

    @Autowired
    private UserService userService;

    public static final String BLOOM_REDIS_PREFIX = "bloom_user";

    @Bean
    public BloomFilterHelper<String> initBloomFilterHelper() {
        return new BloomFilterHelper<>((Funnel<String>) (from, into) -> into.putString(from, Charsets.UTF_8)
                .putString(from, Charsets.UTF_8), 1000000, 0.01);
    }

    /**
     * 布隆過濾器bean注入
     *
     * @return
     */
    @Bean
    public BloomRedisService bloomRedisService() {
        BloomRedisService bloomRedisService = new BloomRedisService();
        bloomRedisService.setBloomFilterHelper(initBloomFilterHelper());
        bloomRedisService.setRedisTemplate(template);
        return bloomRedisService;
    }

    /**
     * 初始化方法,將數(shù)據(jù)庫中的id加入到布隆過濾器
     * 也可以不必實現(xiàn){@link InitializingBean}使用{@link javax.annotation.PostConstruct}注解
     *
     * @throws Exception
     */
    @Override
    public void afterPropertiesSet() throws Exception {
        List<String> idList = userService.getAllUserId();
        log.info("加載用戶id到布隆過濾器當(dāng)中,size:{}", idList.size());
        if (!CollectionUtils.isEmpty(idList)) {
            idList.forEach(item -> {
                bloomRedisService().addByBloomFilter(BLOOM_REDIS_PREFIX, item);
            });
        }
    }
}
public class BloomRedisService {

    private StringRedisTemplate redisTemplate;

    private BloomFilterHelper bloomFilterHelper;

    public void setBloomFilterHelper(BloomFilterHelper bloomFilterHelper) {
        this.bloomFilterHelper = bloomFilterHelper;
    }

    public void setRedisTemplate(StringRedisTemplate redisTemplate) {
        this.redisTemplate = redisTemplate;
    }

    /**
     * 根據(jù)給定的布隆過濾器添加值
     */
    public <T> void addByBloomFilter(String key, T value) {
        Preconditions.checkArgument(bloomFilterHelper != null, "bloomFilterHelper不能為空");
        int[] offset = bloomFilterHelper.murmurHashOffset(value);
        for (int i : offset) {
            redisTemplate.opsForValue().setBit(key, i, true);
        }
    }

    /**
     * 根據(jù)給定的布隆過濾器判斷值是否存在
     */
    public <T> boolean includeByBloomFilter(String key, T value) {
        Preconditions.checkArgument(bloomFilterHelper != null, "bloomFilterHelper不能為空");
        int[] offset = bloomFilterHelper.murmurHashOffset(value);
        for (int i : offset) {
            if (!redisTemplate.opsForValue().getBit(key, i)) {
                return false;
            }
        }
        return true;
    }
}
@Configuration
public class InterceptorConfiguration implements WebMvcConfigurer {

    @Override
    public void addInterceptors(InterceptorRegistry registry) {
        //注冊攔截器
        registry.addInterceptor(authInterceptorHandler())
                .addPathPatterns("/user/get/{id}");
    }

    @Bean
    public BloomFilterInterceptor authInterceptorHandler(){
        return new BloomFilterInterceptor();
    }
}
@Slf4j
public class BloomFilterInterceptor implements HandlerInterceptor {

    @Autowired
    private BloomRedisService bloomRedisService;

    @Override
    public boolean preHandle(HttpServletRequest request, HttpServletResponse response, Object handler) throws Exception {
        String currentUrl = request.getRequestURI();
        PathMatcher matcher = new AntPathMatcher();
        //解析出pathvariable
        Map<String, String> pathVariable = matcher.extractUriTemplateVariables("/user/get/{id}", currentUrl);
        //布隆過濾器存儲在redis中
        String id = pathVariable.get("id");
        if (bloomRedisService.includeByBloomFilter(BloomFilterConfig.BLOOM_REDIS_PREFIX, id)) {
            log.info("{}極有可能存在,繼續(xù)向下執(zhí)行;", id);
            return true;
        }
        /*
         * 不在本地布隆過濾器當(dāng)中,直接返回驗證失敗
         * 設(shè)置響應(yīng)頭
         */
        log.info("{}不存在,直接返回失敗;", id);
        response.setHeader(HttpHeaders.CONTENT_TYPE, MediaType.APPLICATION_JSON_VALUE);
        response.setCharacterEncoding(StandardCharsets.UTF_8.toString());
        response.setStatus(HttpStatus.NOT_FOUND.value());
        Result res = new Result(HttpStatus.NOT_FOUND.value(), "用戶不存在!", null);
        String result = new ObjectMapper().writeValueAsString(res);
        response.getWriter().print(result);
        return false;
    }
}

測試

存在的數(shù)據(jù)

布隆過濾器詳解

布隆過濾器詳解

不存在的數(shù)據(jù)

布隆過濾器詳解
布隆過濾器詳解文章來源地址http://www.zghlxwxcb.cn/news/detail-421097.html

到了這里,關(guān)于布隆過濾器詳解的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 算法~布隆過濾器

    布隆過濾器(Bloom Filter)是一種高效的概率數(shù)據(jù)結(jié)構(gòu),用于判斷一個元素是否存在于集合中。它基于位數(shù)組和多個哈希函數(shù),并具有以下特點: Bloom Filter 是一個基于概率的數(shù)據(jù)結(jié)構(gòu):它只能告訴我們一個 元素絕對不在集合內(nèi) 或 可能在集合內(nèi) 快速查詢:布隆過濾器具有快速

    2024年02月05日
    瀏覽(19)
  • 布隆過濾器及其應(yīng)用

    布隆過濾器是一種數(shù)據(jù)結(jié)構(gòu),具有快速插入和查找的特性,能確定某個字符串一定存在或者可能存在。布隆過濾器有著高效的空間利用率,它不存儲具體數(shù)據(jù),只存儲數(shù)據(jù)的關(guān)鍵標(biāo)識,所以占用的空間較小。它的查詢結(jié)果可能會存在一定誤差,但是誤差總體可控,同時不支持

    2024年02月03日
    瀏覽(17)
  • 布隆過濾器:原理與應(yīng)用

    布隆過濾器:原理與應(yīng)用

    本文已收錄至GitHub,推薦閱讀 ?? Java隨想錄 微信公眾號:Java隨想錄 原創(chuàng)不易,注重版權(quán)。轉(zhuǎn)載請注明原作者和原文鏈接 目錄 布隆過濾器簡介 fpp 布隆過濾器原理 布隆過濾器的特點 布隆過濾器使用 布隆過濾器中的數(shù)據(jù)可不可以刪除 布隆過濾器應(yīng)該設(shè)計為多大 布隆過濾器應(yīng)

    2024年02月08日
    瀏覽(20)
  • Redis布隆過濾器原理

    Redis布隆過濾器原理

    其實布隆過濾器本質(zhì)上要解決的問題,就是 防止很多沒有意義的、惡意的請求穿透Redis(因為Redis中沒有數(shù)據(jù))直接打入到DB 。它是Redis中的一個 modules ,其實可以理解為一個插件,用來拓展實現(xiàn)額外的功能。 可以簡單理解布隆過濾器的功能 :它就是記錄了一份DB數(shù)據(jù),然后

    2024年02月09日
    瀏覽(30)
  • 解釋一下布隆過濾器原理

    鎖屏面試題百日百刷,每個工作日堅持更新面試題。請看到最后就能獲取你想要的,接下來的是今日的面試題: 1.解釋一下布隆過濾器原理 在日常生活中,包括在設(shè)計計算機軟件時,我們經(jīng)常要判斷一個元素是否在一個集合中。比如在字處理軟件中,需要檢查一個英語單詞是

    2023年04月10日
    瀏覽(25)
  • Java實現(xiàn)布隆過濾器

    Java實現(xiàn)布隆過濾器

    背景: 為預(yù)防大量黑客故意發(fā)起非法的時間查詢請求,造成緩存擊穿,建議采用布隆過濾器的方法解決。布隆過濾器通過一個很長的二進制向量和一系列隨機映射函數(shù)(哈希函數(shù))來記錄與識別某個數(shù)據(jù)是否在一個集合中。如果數(shù)據(jù)不在集合中,能被識別出來,不需要到數(shù)據(jù)

    2024年02月01日
    瀏覽(25)
  • 哈希的應(yīng)用——布隆過濾器

    哈希的應(yīng)用——布隆過濾器

    上一篇文章,我們學(xué)習(xí)了位圖,位圖在某些場景下是非常適用的,非??旖莘奖?。 但是,在文章的最后,我們也提出了位圖的一些缺陷——比如位圖只能映射整型數(shù)據(jù),其它類型的數(shù)據(jù)則不行。 因為位圖里面的元素去映射的其實就是下標(biāo)嘛,而下標(biāo)的話都是整型啊。 那有沒

    2024年02月09日
    瀏覽(34)
  • 【C++】位圖應(yīng)用 | 布隆過濾器

    【C++】位圖應(yīng)用 | 布隆過濾器

    給40億個不重復(fù)的無符號整數(shù),沒排過序,給一個無符號整數(shù),如何快速判斷一個數(shù)是否在這40億個數(shù)中 正常思路: 1.排序 + 二分查找 2.放入 哈希表 或者 紅黑樹 10億字節(jié) 約等于 1GB 40億個整數(shù)約等于 16GB 如果使用上述的兩種方法, 內(nèi)存不夠 哈希 的 直接定址法 的 哈希映射

    2024年02月08日
    瀏覽(24)
  • 布隆過濾器(Bloom Filter)

    布隆過濾器(Bloom Filter)

    通常我們會遇到很多要判斷一個元素是否在某個集合中的業(yè)務(wù)場景,一般想到的是將集合中所有元素保存起來,然后通過比較確定。鏈表、樹、散列表(又叫哈希表,Hash table)等等數(shù)據(jù)結(jié)構(gòu)都是這種思路。但是隨著集合中元素的增加,我們需要的存儲空間也會呈現(xiàn)線性增長,

    2024年02月08日
    瀏覽(34)
  • 【C++】哈希與布隆過濾器

    【C++】哈希與布隆過濾器

    ??個人主頁:平凡的小蘇 ??學(xué)習(xí)格言:命運給你一個低的起點,是想看你精彩的翻盤,而不是讓你自甘墮落,腳下的路雖然難走,但我還能走,比起向陽而生,我更想嘗試逆風(fēng)翻盤 。 ?? C++專欄 : C++內(nèi)功修煉基地 家人們更新不易,你們的??點贊??和?關(guān)注?真的對我真

    2024年02月08日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包