首页 1 2 3 4 5 6 7

哈希函数英语单词_基于英文单词的快速HASH索引算法

基于英文单词的快速

HASH

索引算法

因为有项目需要，要做一个类似

ispell

的软件，其中会产生大量的对单词的查找操作，于是经过一翻研究，得出

以下

HASH

算法，

经过验证比一般的查表的

FNV HASH

算法产生的分布曲线基本没什么两样，

并且在大部分的不同

字典下，本算法要比查表的

FNV HASH

算法表现出速度更快，分布更均匀。但是因为是实验结果，所以暂时还没得

出有效的数学推论，但是从大量的不同的字典测试数据来看，此算法确实效率不错。

由于以前没有涉及过相关的纯算法的设计，所以刚刚开始的时候，打算随便选用一种

HASH

，比如说用

除大质数，

然后借此搭建一个比较强壮的测试环境，然后打算根据测试结果来改进

HASH

算法的模型。

最开始，我的

HASH

函数是这样的：

unsigned int hash_func(char *str, int len)

{

while(p - str

sum += *(p++);

return sum % MAX_PRIME_LESS_THAN_HASH_LEN;

}

非常简单，但是这是绝对不可取的，通过这个函数，我选取了一个

23w

词的字典做为测试，当

HASH SIZE=1024

的

时候，得到了以下的图象：

看得出震荡幅度相当大，那么如何来改进呢？首先想到可能产生的冲突的是这种情况：

abcd

和

acbd

，对于这两种单

词来说，如果用上面的

HASH

函数，就一定会发生碰撞，为什么呢？因为每个字符少了关于它自己的位置信息，于

是第一次改进版本的

HASH

函数就给每个字符加上了它的位置信息，将上面所描述的函数改进为：

unsigned int hash_func(char *str, int len)

{

while(p - str

sum += *(p++) * (p

–

str);

return sum % MAX_PRIME_LESS_THAN_HASH_LEN;

}

得到以下图象：

操作系统读写者问题实验报告_固态硬盘要不要做碎片整理？隐藏问题解释在最后...

maven 打包把依赖jar打进去

<build>  <finalName>netty_client</finalName> <!-- 使用shade打包可以把第三方依赖包都打包进jar 防止缺失依赖报错 --&g

python操作mysql_使用python操作mysql数据库

数据库的安装和连接 PyMySQL的安装 pip install PyMySQL python连接数据库 importpymysql db= pymysql.connect("数据库ip","用户","密码","数据库"

SpringBoot整合RabbitMQ

SpringBoot整合RabbitMQ 1、RabbitMQ核心概念

Date对象与字符串对象之间的相互转化

public static void main(String[] args) { //将Date对象转换为指定模式的字符串对象 Date date = new Date(); System.out.println(date); SimpleDateFormat sdf

【最优化算法】基于【MATLAB】的牛顿法【Newton Method】计算与推导

🚀个人主页：欢迎访问Ali.S主页 📆 最近更新：2022

JAVA的error访问不存在_调用WxMpService的临时素材下载方法无效,提示错误代码:99999,文件名不存在...

Caused by: me.chanjar.weixin.common.error.WxErrorException: 错误代码：99999, 错误信息：无法获取到文件名 at me.chanjar.weixin.common.util.http.HttpRespo

MariaDB 导入 SQL 文件报 ERROR 1366 (22007) Incorrect string value 错误解决过程

这次是在网上搜到的解决方案，不过感觉值得记录。刚开始我搜到了这篇文章：

80.android 简单的当前fragment页面判断显示隐藏的两种方式

//第一种是切换fragment页面使用： @Override public void setUserVisibleHint(bool

Linux下Docker安装几种NoSQL和MQ

注：本文中所有配置文件都是我用echo或者cat输入的，不全，最好用docker cp 如下面的diamagnetic就是将mysql-service容器内的配置文件复制到宿主机上然后在第二次运行的时候再挂载

哈希函数 英语单词_基于英文单词的快速HASH索引算法

哈希函数英语单词_基于英文单词的快速HASH索引算法