数据分析方法论有效性的评判关键是什么?
2021-01-11 10:25:24 阅读(229) 评论(0)
1、在数据集成项目中,最困难的过程是数据分析。数据分析过程位于数据集成项目的整个过程(准备早期研究)—–数据分析—–界面实现)的第二步为第三步界面实现提供了充分的准备,因此数据分析的正确性在很大程度上决定了数据集成的成功实现和完成。如何有效地进行数据分析,如何提前在数据分析中尽量避免出现问题,直到实现为止?这是判断数据分析方法论有效的关键。经过几个项目的经验,我反思了做这些项目时更有效的方法和错误的方法,总结了一套我认为可行的数据分析方法。该数据分析方法仅适用于数据库-文件-数据库或数据库-数据库的分析,以及接口集成(如调用对方的webservice、EJB接口等。)不适用,在这种数据分析方法中,指导数据分析的步骤和需要注意的问题,编写这个blog,希望有同行的同学多交流。2、数据分析方法论中涉及的术语的解释:目标数据源是指需要在数据集成中导入数据的数据源,可以是数据库或文件。2、该方法所涉及的术语的解释:目标数据源是指需要在数据集成中导入数据的数据源,可能是数据库或文件。源数据源是指在数据集成中获取数据的数据源,可能是数据库或文件。字典代码以代码的形式存储在数据库中(如数字、英文字母等)。)而不是中文意思,这些代码称为字典代码。2.1.步骤2.1.1.分析目标数据源数据结构目标数据源可能是数据库或文件,但无论如何,它都有数据结构,首先要做的是分析目标数据源数据结构,在分析目标数据源数据结构时,分析清楚:表目标数据源需要交换什么表,这些表的含义是什么。这些表中包含的字段、字段类型和长度。分析每个字段的含义,包括字段的中文含义、字段所涉及的字典代码和字段规则(如业务规则、生成规则)。在分析了上述表、字段和字段的含义后,形成了以下结构的文档:字典代码字段规则idnumber(10)主键流量-流量,unitcodevarchar2(19)单位编码字典-2.1.2.完成第一步后,分析目标数据源的表关系,然后分析目标数据源的表关系。分析表关系最重要的是分析每个表之间的关联关系(如一对一、一对多、主键和外键),其次,需要根据业务分析每个表之间的隐性关联,例如,只有当A表中的某个值为03时,才与B表相关。对目标数据源的表关系进行分析后,形成以下Rose图:2.1.3.数据源分析的数据结构方法与2.1相同.1.分析对象改为源数据源,分析后形成相同的2.1.1中的文档。对目标数据源的表关系进行分析后,形成以下Rose图:2.1.3.分析源数据源的数据结构方法与2.1相同.1.分析对象改为源数据源,分析后形成相同的2.1.文档1.2.1.4.分析源数据源的表关系方法与2.1相同.2.分析对象改为源数据源,分析后形成相同的2.1.2中的Rose图。2.1.5.根据目标数据源的表关系,根据目标数据源的表关系,分析其与源数据源表的对应关系。在这一步中,我们需要清楚地分析目标数据源的表数据来自源数据源,以及如何获取这些数据,分析后,可以形成一个标准来验证数据集成是否正确,也就是说,目标数据源的数据量应该与来源数据源的数据量一致。在分析过程中,仍然根据目标表的业务意义在源数据源的表中找到具有相同意义的表。在分析过程中,可能会遇到以下情况:意义相同的表通常使用一个表存储目标数据源和源数据源,意义相同的表通常是一对一的数据关系,例如,目标数据源中有一个表是常住人口的基本信息,源数据源中有一个常住人员的基本信息,两个表可以对应。当然,有时意义不一定相同,这需要从业务层面来判断。在这种情况下,目标数据源通常是一个表,源数据源是多个表。此时,形成多对一关系。例如,目标数据源中有一个表是项目表,源数据源中有几个表,如手机和证券。此时,您需要将手机和证券表对应于项目表。或者可能会遇到这样的现象,目标数据源是一个表,源数据源也是一个表,但源数据源每行记录包含两种类型的目标表记录,在这种情况下需要将源数据源记录分成两个进入目标表,如目标数据源是迁出表,其存储模式是单独记录存储,源数据源也是迁出表,但是,它的存储方式是在同一条记录中进行迁出和迁出。此时,将源数据源的迁出表的一行记录分为两条进行导入。具有包含意义的表与具有包含意义的表相反。含义表与上述含义表相反。根据业务的对应关系,这是最复杂的。例如,可能会遇到这样的现象。当源数据源中表的一个字段的值为多个时,需要将其分成两个记录并导入到目标表中。综上所述,目标数据源表和源数据源表可能存在一对一、一对多、多对一、多对多、条件对应几种关系,分析后形成以下文档:目标数据源数据源验证标准AAAA.数据量==A.数据量(变化(新增、编辑、删除)BB CB.数据量==B.数据量 C.数据量C DDC.数据量 D.数据量=D.数据量 C.数据量=D.数据量(D.wplx=’03’)D.数据量=D.数据量(D.wplx=’05’)EEE.数据量=E.数据量*2FFF.数据量=F.数据量/2(F.qrsj=F.qcsj)GGG.数据量=G.数据量 G.数据量(G.name包含,的总数-1)2.1.6.根据表的对应关系分析字段的对应关系和转换规则,根据表的单一对应关系(如目标数据源的B表对应源数据源的B表)、C表需要分为B对应B和B对应C两个步骤进行分析)来分析每个表中字段的对应关系和转换规则,相应的方法是:首先在相应的表中找到相应的字段,如果找不到相应的字段,需要从业务意义的角度推测字段是否需要合并多个字段或拆分字段,或根据某些业务规则生成字段的值。找到相应的字段后,首先根据类型和长度分析是否需要处理类型和长度,然后分析是否通过与其他表相关的字段获得,然后分析字段是否涉及字典代码。如果涉及,则需要比较两侧的字典代码是否一致,如果不一致,则需要形成两侧字典代码的对应关系,最后分析字段是否涉及业务意义,如果涉及,应注明如何处理。分析完成后,形成以下文档:idnumber(10)表名字段类型及长度源数据源字段类型及长度转换规则.idnumber(10)unitcodevarchar2(19).xzqh 表名.unitvarchar2(8) varchar2(20)单位代码字典映射contentvarchar2(100)Substr(表名.content,0,50、Varchar2(100)ifmonthVarchar2(1)If(表名.createdate.月份==系统时间的月份) Return‘1’;ElseReturn‘2’.unitnameVarchar2(100)UnitNames.unitNameVarchar2(100)表名.xzqh 表名.unit=UnitNames.UnitCode2.2.需要注意的问题是,数据集成是系统中最重要的基础,因此,在进行数据集成时,特别需要仔细考虑不会对数据产生破坏性影响,这也是数据分析过程中需要仔细考虑的问题。2.2.1.在进行数据分析时,需要考虑数据覆盖/混乱的问题,以便在集成数据后是否会非法覆盖或混淆现有数据。这个问题通常是由主键引起的,在进行数据分析时需要考虑。2.2.2.在进行数据分析时,需要考虑数据集成后可能出现的错误。对于这些可能出现的错误,需要制定相应的补偿方案,以避免数据的损坏。2.2.2.在进行数据分析时,需要考虑数据集成后可能出现的错误。对于这些可能出现的错误,需要制定相应的补偿方案,以避免数据的损坏。2.2.3.源数据源数据质量问题的解决方案需要考虑如何处理或避免源数据源本身的数据质量问题。2.2.4.在整个数据分析过程中,业务专家的支持可以看出,业务专家起着非常重要的作用。可以说,如果没有业务专家,数据分析很可能会失败,或者需要走很多弯路才能最终探索。可以肯定的是,在业务专家的支持下,整个数据分析过程将大大延长。从这个角度可以看出,在进行数据分析时,尽量得到业务专家的支持。3、总结上述方法对数据分析的过程和避免问题的方法进行了一定的描述。在实际的数据分析中,最重要的是负责数据分析的人对系统的理解。有系统设计经验的人成功进行数据分析的概率要高得多。一些非常专业的系统必须依靠有相应设计经验的人才来完成,比如流程系统的数据集成。在数据分析过程中,可以制定出判断数据集成是否成功的标准,也可以列为TDD的入口条件,J。在数据分析过程中,可以制定出判断数据集成是否成功的标准,也可以列为TDD的入口条件,J。方法论仍然是理论。我不是一个那么讲理论的人,但我不否认理论对实践有很好的指导作用。最好避免在实践过程中走太多弯路,将理论与实践相结合。理论指导实践,实践改进理论。
推荐阅读
- 专利使用的风险有哪些 专利使用的风险盘点
不少企业都会购买别人的专利来使用,生产而获得更大的经济价值。但就算是专利,在使用的过程中企业也存在很多的风险,预定到的利益并不一定是能够完全得到的下面*就给大家来详细介绍一下专利使用的风险有哪些 专利使用的风险盘点这一块的相关内容…查看详情
- 2021免费的餐饮收银软件大盘点,5款热门推荐
随着经济的不断发展,餐饮业也得到了前所未有的发展,对于餐饮业来说,餐饮收银是餐饮业经营的一个重中之重,如何进行规范化、高效化的收银,今天我就来给大家推荐一些免费的餐饮收银软件。 1.象过河郑州象过河软件技术有限公司是一家集软件开发、生产、销…查看详情
- 玩吃*/王者这类游戏用哪个安卓模拟器好?5款好用的模拟器推荐!
近年来,移动互联网发展迅猛,出现了很多手游,特别是一些竞技类手游如王者荣耀、和平精英等受到年轻人的喜爱,而一部分玩家为了追求更好的操作体验都会选择通过在电脑上安装安卓模拟器来玩手游,小万也整体了目前市场上比较好用的几款安卓模拟器,推荐各位试…查看详情
- 马来西亚注册公司费用
马来西亚开公司需要什么条件和手续? (1)三名董事(两名马来西亚公民;一名中国人):身份证,护照,费用;(2)一定要聘请公司秘书/律师事务所去处理(公司注册处Malaysia CompanyCommission);(3)请公司秘书去…查看详情
- windows10电脑屏幕亮度怎么调节
Windows 10是微软推出的最新操作系统,满意度很高,广泛应用于各种设备。其默认设置可以使屏幕调节。当用户在不同的环境中工作时,他们可能需要更改屏幕的亮度水平。例如,在光线较弱的室内环境下,用户可能需要将屏幕的亮度调低,以减少镜头…查看详情
- 中小企业流量的四个方向(你抓住了吗?)
在这个不进步就要被淘汰的时代,获客成本高,效果不稳定,人员招聘贵等因素下,中小企业该如何利用互联网全域流量实现变现成了时下创业者的难题,与资金雄厚、拥有庞大市场占有率,不依赖通过营销来实现增长的大型企业不同,中小企业若要取得良好的经营成…查看详情
- 想知道,开发的新软件可以登记版权吗?
知识产权行业都在说,版权登记要趁早,那么,企业开发的新软件可以登记版权吗?并不是所有计算机软件都可以进行版权登记,需要满足下文中4个登记条件的新软件才可以进行版权登记,有软著登记需要的企业可以了解一下。图片来源于网络◆ 开发的新软件进行登…查看详情
- 好用的手机点菜软件有哪些 好用的手机点菜软件排行榜
现在又很多餐饮店都可以实现自主点餐了,这些点餐软件也是很方便的,下面*就给大家来详细介绍一下好用的手机点菜软件有哪些 好用的手机点菜软件排行榜这一块的相关内容,希望能帮助到大家。 好用的手机点菜软件排行榜 1、《店内点菜系统》 …查看详情
- 独立站有哪些平台 免费独立站平台
目前在市面上有众多自建站平台可供选择,Magento、Shopify和WooCommerce就是其中的三大主流选择。那么从卖家的角度出发,三大平台有何不同又如何根据自己的业务需求选择呢?下面万商云集*就给大家来详细介绍一下这三大免费独立…查看详情
- 好用的图片分割软件app 免费图片分割器推荐
今天我们来分享什么呢?下面万商云集*就为大家分享一下比较好用的图片分割软件,希望下面的内容对你有所帮助, teorexphotoscisso1是一款非常容易使用超级简单的智能抠图工具 TeoreX PhotoScisso1是一款T…查看详情
- 2021适合中小企业的协同办公软件推荐,内附价格表。
随时互联网的发展,带动了很大一批年轻创业者的创业潮,在这个人人都想创业的时代,一家公司的规模不会很大,可能就10-20人左右;那么面对10-20人左右的团队有没有什么好的协调办公软件呢?小万整理了2021年比较受中小企业喜欢的5款协调办公软…查看详情
- 如何做好酒店宣传和推广 酒店营销推广怎么做?
许多酒店为了宣传营销在公共区域配置了电视机,利用电视*一些酒店宣传图或视频,但是使用U盘+电视的*方式费时费力,更换内容不方便,且*内容形式也十分单一,宣传效果不佳。实际上只需要在电视上安装知了知屏APP,无需U盘,用手机或电脑就可以远…查看详情
- 气体灭火系统规范及标准
气体灭火系统是一种常用的灭火装置,用于灭火和控制火灾。以下是关于气体灭火系统规范及标准的一些重要信息。1. 国际标准:- ISO 14520:这是国际标准组织(ISO)发行的标准,规定了自动灭火系统的设计、安装、操作和维护的要求。- NFP…查看详情
- 购买专利违法吗 购买专利是否违法
在平时很多的小伙伴都不知道购买专利违法吗的基本情况,而且对购买专利违法吗都不是很熟悉,下面万商云集*就为大家整理了购买专利违法吗这方面的相关内容,希望下面的内容能帮助到各位。 一、购买专利是否违法 专利的申请权和专利权可以转让…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的数字选用平台

400-0033-166
8:30-18:00















































注册有好礼



