SAP C4C的客户主数据创建时的重复检查,基于底层HANA数据库的模糊查找功能,根据扫描数据库中已有的数据检测出当前正在创建的客户主数据是否和数据库中记录有重复。
在系统里开启重复检查的配置:
在此处配置主数据模型上每个字段对重复性检查结果共享的权值:
要理解权值的作用,就必须先理解C4C客户主数据重复性检查的算法Levenshtein algorithm。这个算法以开发者Vladimir Levenshtein命名,通过计算Levenshtein(莱文斯坦)距离来衡量两个字符串的相似度。
看个具体例子。
假设数据库里有一条主数据记录:
Name = Carl,
Email = jerry@sap.com
然后在C4C UI创建一个新的客户主数据:
Name = Corl,
Email = jerry@sap.com
其中Name字段的相似度为 1 - 1/4 = 75%,而Email字段相似度为100%。
然后在C4C里这两个字段的权值配置如下:
Name = 30
E-mail = 70
按照Levenshtein algorithm的公式计算重复度:
SIM = SQRT( (30² * 0.75² + 70² * 1²) / (30² + 70²) ) = 0.97 = 97%
到底重复度多少的待创建客户主数据被认为是真正的重复数据呢?可以在Business Configuration里配置:
‘Strong – Duplicate Check for Business Partners’:85%
‘Medium – Duplicate Check for Business Partners’: 80%
‘Weak – Duplicate Check for Business Partners’: 70%
要获取更多Jerry的原创文章,请关注公众号"汪子熙":
相关推荐
该gem实现了纯Levenshtein算法,即Damerau的改进算法(其中2个字符换位算作1个编辑距离)。 它还包括Boermer&Rees 2008对Damerau算法的修改,其中也考虑了大于1个字符块的转置 。 require "damerau-levenshtein...
Crystal语言的Damerau-Levenshtein算法实现。 安装 将其添加到Projectfile deps do github " suxxes/damerau-levenshtein " end 用法 require " damerau-levenshtein " DamerauLevenshtein .distance( " string " ...
levenshtein - 这是一个Go实现计算Levenshtein距离算法
开源项目-ferhatelmas-levenshtein.zip,Golang的Levenshtein距离
标签:airavata-levenshtein-distance-service-0.5.jar,airavata,levenshtein,distance,service,0.5,jar包下载,依赖包
快速编辑算法的 AngularJS 实现 基于hiddentao的fast-levenshtein包()的 fast-levenshtein 算法的简单 AngularJS 实现。演示依赖关系需要:angularjs 1.2.x 有关完整列表/更多详细信息,请参阅gh-pages分支中的...
前端项目-levenshtein,l-digity的javascript实现。
达默劳·莱文施泰因(Damerau Levenshtein) 获取与Damerau-Levenshtein距离的文本相似度。 要求 PHP 7.1.0或更高版本。 安装 composer require oefenweb/damerau-levenshtein 用法 $ pattern = 'foo bar' ; $ ...
标签:airavata-levenshtein-distance-service-0.9.jar,airavata,levenshtein,distance,service,0.9,jar包下载,依赖包
damerau-levenshtein-js NPM软件包,用于同步或异步计算字符串之间的Damerau-Levenshtein距离。 安装 npm i damerau-levenshtein-js 用法 调用“ distance”或“ distanceProm”函数将输出一个整数,即计算出的两...
标签:airavata-levenshtein-distance-service-0.7.jar,airavata,levenshtein,distance,service,0.7,jar包下载,依赖包
标签:airavata-levenshtein-distance-service-0.10.jar,airavata,levenshtein,distance,service,0.10,jar包下载,依赖包
标签:airavata-levenshtein-distance-service-0.6.jar,airavata,levenshtein,distance,service,0.6,jar包下载,依赖包
标签:airavata-levenshtein-distance-service-0.11.jar,airavata,levenshtein,distance,service,0.11,jar包下载,依赖包
标签:airavata-levenshtein-distance-service-0.8.jar,airavata,levenshtein,distance,service,0.8,jar包下载,依赖包
matlab实现应用levenshtein算法对两组字符串CH1,CH2相似度的识别,得到两组字符串的相似度,leventshtein算法是有效的模式识别算法,在结构模式识别中应用广泛。
速白蛋白 :rocket: Go中最快的levenshtein实现。测量两个琴弦之间的差异。注意:此实现当前不是线程安全的,并且假定符文最多只能达到65535。此问题将很快得到解决。下载$ go get github....
// Print levenshtein-distance between 'fast' and 'faster' console . log ( distance ( 'fast' , 'faster' ) ) //=> 2 // Print string from array with lowest edit-distance to 'fast' console . log ( ...
Levenshtein:快速计算编辑距离以及字符串的相似度
通用 Levenshtein 算法 k 有界 Levenshtein 距离算法(线性时间,恒定空间)。 信息:这是您只关心小于或等于给定k的距离(例如,测试两个单词之间的拼写差异是否最大为 1)。在这种情况下,算法运行得更快,同时...