传奇霸业7k:多数据库文件关联问题

来源:百度文库 编辑:查人人中国名人网 时间:2024/04/30 02:02:41
有一个文件检索系统,使用的是多个数据库,各数据库之间的字段设置不一样,但是有很多共同字段,比如“作者”,“所在单位”。在做“作者”的文件关联时,发现有很多的同名但不同人的作者也被关联进来。于是考虑综合核对作者的相关信息如“所在单位”、“从事行业”等信息来排除同名但不同人的作者,但是本身“所在单位”也存在这样的情况,而且“所在单位”经常会有不规范的书写方式,比如“东方贸易公司”可能为“北京东方贸易公司”。所以现在很麻烦,这个问题该怎么解决呢?请达人指教思路,谢谢!~
只有25分,都献出去了
回复一楼大哥(大姐):这个方法可考虑,但是原来数据库没有这些字段。
回复二楼大哥(大姐):能说具体点么?采用编码是指赋予每位作者唯一的标识符吧?能举个例子吗?谢谢两位

名称匹配是比较麻烦的
最好是找到两个数据库中的相同字段,比如都有姓名和出生日期,就选择姓名 + 出生日期作为比对的参照,要中文名称出现的越少越好

这种都是采用编码方式的,即使有一个可能性重复,也要设置编码
每个人,每个单位都设置编码