服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

数据分析方法论有效性的评判关键是什么?

2021-01-11 10:25:24 阅读(220 评论(0)

1、在数据集成项目中,最困难的过程是数据分析。数据分析过程位于数据集成项目的整个过程(准备早期研究)—–数据分析—–界面实现)的第二步为第三步界面实现提供了充分的准备,因此数据分析的正确性在很大程度上决定了数据集成的成功实现和完成。如何有效地进行数据分析,如何提前在数据分析中尽量避免出现问题,直到实现为止?这是判断数据分析方法论有效的关键。经过几个项目的经验,我反思了做这些项目时更有效的方法和错误的方法,总结了一套我认为可行的数据分析方法。该数据分析方法仅适用于数据库-文件-数据库或数据库-数据库的分析,以及接口集成(如调用对方的webservice、EJB接口等。)不适用,在这种数据分析方法中,指导数据分析的步骤和需要注意的问题,编写这个blog,希望有同行的同学多交流。2、数据分析方法论中涉及的术语的解释:目标数据源是指需要在数据集成中导入数据的数据源,可以是数据库或文件。2、该方法所涉及的术语的解释:目标数据源是指需要在数据集成中导入数据的数据源,可能是数据库或文件。源数据源是指在数据集成中获取数据的数据源,可能是数据库或文件。字典代码以代码的形式存储在数据库中(如数字、英文字母等)。)而不是中文意思,这些代码称为字典代码。2.1.步骤2.1.1.分析目标数据源数据结构目标数据源可能是数据库或文件,但无论如何,它都有数据结构,首先要做的是分析目标数据源数据结构,在分析目标数据源数据结构时,分析清楚:表目标数据源需要交换什么表,这些表的含义是什么。这些表中包含的字段、字段类型和长度。分析每个字段的含义,包括字段的中文含义、字段所涉及的字典代码和字段规则(如业务规则、生成规则)。在分析了上述表、字段和字段的含义后,形成了以下结构的文档:字典代码字段规则idnumber(10)主键流量-流量,unitcodevarchar2(19)单位编码字典-2.1.2.完成第一步后,分析目标数据源的表关系,然后分析目标数据源的表关系。分析表关系最重要的是分析每个表之间的关联关系(如一对一、一对多、主键和外键),其次,需要根据业务分析每个表之间的隐性关联,例如,只有当A表中的某个值为03时,才与B表相关。对目标数据源的表关系进行分析后,形成以下Rose图:2.1.3.数据源分析的数据结构方法与2.1相同.1.分析对象改为源数据源,分析后形成相同的2.1.1中的文档。对目标数据源的表关系进行分析后,形成以下Rose图:2.1.3.分析源数据源的数据结构方法与2.1相同.1.分析对象改为源数据源,分析后形成相同的2.1.文档1.2.1.4.分析源数据源的表关系方法与2.1相同.2.分析对象改为源数据源,分析后形成相同的2.1.2中的Rose图。2.1.5.根据目标数据源的表关系,根据目标数据源的表关系,分析其与源数据源表的对应关系。在这一步中,我们需要清楚地分析目标数据源的表数据来自源数据源,以及如何获取这些数据,分析后,可以形成一个标准来验证数据集成是否正确,也就是说,目标数据源的数据量应该与来源数据源的数据量一致。在分析过程中,仍然根据目标表的业务意义在源数据源的表中找到具有相同意义的表。在分析过程中,可能会遇到以下情况:意义相同的表通常使用一个表存储目标数据源和源数据源,意义相同的表通常是一对一的数据关系,例如,目标数据源中有一个表是常住人口的基本信息,源数据源中有一个常住人员的基本信息,两个表可以对应。当然,有时意义不一定相同,这需要从业务层面来判断。在这种情况下,目标数据源通常是一个表,源数据源是多个表。此时,形成多对一关系。例如,目标数据源中有一个表是项目表,源数据源中有几个表,如手机和证券。此时,您需要将手机和证券表对应于项目表。或者可能会遇到这样的现象,目标数据源是一个表,源数据源也是一个表,但源数据源每行记录包含两种类型的目标表记录,在这种情况下需要将源数据源记录分成两个进入目标表,如目标数据源是迁出表,其存储模式是单独记录存储,源数据源也是迁出表,但是,它的存储方式是在同一条记录中进行迁出和迁出。此时,将源数据源的迁出表的一行记录分为两条进行导入。具有包含意义的表与具有包含意义的表相反。含义表与上述含义表相反。根据业务的对应关系,这是最复杂的。例如,可能会遇到这样的现象。当源数据源中表的一个字段的值为多个时,需要将其分成两个记录并导入到目标表中。综上所述,目标数据源表和源数据源表可能存在一对一、一对多、多对一、多对多、条件对应几种关系,分析后形成以下文档:目标数据源数据源验证标准AAAA.数据量==A.数据量(变化(新增、编辑、删除)BB CB.数据量==B.数据量 C.数据量C DDC.数据量 D.数据量=D.数据量 C.数据量=D.数据量(D.wplx=’03’)D.数据量=D.数据量(D.wplx=’05’)EEE.数据量=E.数据量*2FFF.数据量=F.数据量/2(F.qrsj=F.qcsj)GGG.数据量=G.数据量 G.数据量(G.name包含,的总数-1)2.1.6.根据表的对应关系分析字段的对应关系和转换规则,根据表的单一对应关系(如目标数据源的B表对应源数据源的B表)、C表需要分为B对应B和B对应C两个步骤进行分析)来分析每个表中字段的对应关系和转换规则,相应的方法是:首先在相应的表中找到相应的字段,如果找不到相应的字段,需要从业务意义的角度推测字段是否需要合并多个字段或拆分字段,或根据某些业务规则生成字段的值。找到相应的字段后,首先根据类型和长度分析是否需要处理类型和长度,然后分析是否通过与其他表相关的字段获得,然后分析字段是否涉及字典代码。如果涉及,则需要比较两侧的字典代码是否一致,如果不一致,则需要形成两侧字典代码的对应关系,最后分析字段是否涉及业务意义,如果涉及,应注明如何处理。分析完成后,形成以下文档:idnumber(10)表名字段类型及长度源数据源字段类型及长度转换规则.idnumber(10)unitcodevarchar2(19).xzqh 表名.unitvarchar2(8) varchar2(20)单位代码字典映射contentvarchar2(100)Substr(表名.content,0,50、Varchar2(100)ifmonthVarchar2(1)If(表名.createdate.月份==系统时间的月份) Return‘1’;ElseReturn‘2’.unitnameVarchar2(100)UnitNames.unitNameVarchar2(100)表名.xzqh 表名.unit=UnitNames.UnitCode2.2.需要注意的问题是,数据集成是系统中最重要的基础,因此,在进行数据集成时,特别需要仔细考虑不会对数据产生破坏性影响,这也是数据分析过程中需要仔细考虑的问题。2.2.1.在进行数据分析时,需要考虑数据覆盖/混乱的问题,以便在集成数据后是否会非法覆盖或混淆现有数据。这个问题通常是由主键引起的,在进行数据分析时需要考虑。2.2.2.在进行数据分析时,需要考虑数据集成后可能出现的错误。对于这些可能出现的错误,需要制定相应的补偿方案,以避免数据的损坏。2.2.2.在进行数据分析时,需要考虑数据集成后可能出现的错误。对于这些可能出现的错误,需要制定相应的补偿方案,以避免数据的损坏。2.2.3.源数据源数据质量问题的解决方案需要考虑如何处理或避免源数据源本身的数据质量问题。2.2.4.在整个数据分析过程中,业务专家的支持可以看出,业务专家起着非常重要的作用。可以说,如果没有业务专家,数据分析很可能会失败,或者需要走很多弯路才能最终探索。可以肯定的是,在业务专家的支持下,整个数据分析过程将大大延长。从这个角度可以看出,在进行数据分析时,尽量得到业务专家的支持。3、总结上述方法对数据分析的过程和避免问题的方法进行了一定的描述。在实际的数据分析中,最重要的是负责数据分析的人对系统的理解。有系统设计经验的人成功进行数据分析的概率要高得多。一些非常专业的系统必须依靠有相应设计经验的人才来完成,比如流程系统的数据集成。在数据分析过程中,可以制定出判断数据集成是否成功的标准,也可以列为TDD的入口条件,J。在数据分析过程中,可以制定出判断数据集成是否成功的标准,也可以列为TDD的入口条件,J。方法论仍然是理论。我不是一个那么讲理论的人,但我不否认理论对实践有很好的指导作用。最好避免在实践过程中走太多弯路,将理论与实践相结合。理论指导实践,实践改进理论。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

网站建设前提:如果不确定五件事,网站做得再好也不会有效果

转线上、建网站、引用户、促销售、获收益,其实并不简单,也不是企业随便建好一个网站,就能产生效果的。网站建设前提是确定5件事,搭建好的网站才能产生企业想要的效果。 图片来源于网络 ● 网站建设前提一:根据网站业务确定功能需求 了解企业的业务…查看详情

ps反向选区快捷键是什么

  Photoshop是一款广泛应用于图像编辑和设计领域的软件。在使用Photoshop进行图像编辑时,经常需要进行选区以便进行相关的操作。相信大部分用户都知道Photoshop中的快捷键可以提高工作效率,本篇文章将介绍Photoshop中…查看详情

拼车软件有哪些?这五款是不错的选择

如果大家的家里面自己买得有车的话,就会发现其实自己开车的机会并不多。因为大家每天都要上班,如果自己开车去公司上班的话,就需要找好比较合适的停车位。而有的时候,停车位有可能刚好离公司非常远,所以这是非常不方便的。而拼车出行逐渐成为…查看详情

现在加盟什么店比较火

  随着消费者需求的不断变化,加盟行业也在不断发展,一些行业因为技术进步或者市场供求关系的变化而随时变化,而一些行业则因为顾客偏好和经济环境的变化而成为热门。本文将从餐饮、教育、美容美发、生活服务四个方面介绍目前比较火的加盟店。  一、餐饮…查看详情

怎样通过财务软件来提升财务部门的工作效率

财务软件很多财务人员都不陌生,财务软件都能帮助企业提升财务部门的工作效率,财务软件主要是用于企业财务账目、资金账户以及企业收支情况等方面的管理,财务软件的用途非常明确,当然现在的很多财务软甲使用起来也很方便。那么通过财务管理关键是怎样提升财…查看详情

学习机品牌有哪些 学习机排行榜十强

  双减之后,学习机转变成为很多家庭教育的刚性需求,但是市场上学习机产品种类繁多,功能各异,家长们又该如何选出适合自己孩子的学习机呢?下面万商云集小编给大家来详细介绍一下学习机品牌有哪些 学习机排行榜十强这一块的内容,下面选择比较出名的3款…查看详情

解压缩软件哪个好 电脑常用解压软件

现在工作中解压缩文件都是很常见的事情,下面万商云集小编给大家介绍下比较好用的解压缩软件,希望能帮助到大家。  CisdemUnarchiverfor Mac是一款支持RAR,Zip,7-zip,ISO,Udf,Wim和TAR等文件格式的解…查看详情

如何办理公司注册 2022年公司注册流程

  现在很多的人都想着自主创业注册自己的公司,现在很多的人对公司注册都不是很清楚,下面小编就给大家来详细介绍一下如何办理公司注册 2022年公司注册流程这一块的内容,希望能帮助到大家了解到公司注册的相关流程!  如何办理公司注册  第一…查看详情

还没找到好用的分屏软件?这3款你一定要试试

一个手机想要同时运行两个软件,就必须要有分屏的软件,这样才可以保证运行系统的时候不会出现故障,那么,首先要看一下可以分屏的软件有什么,知道了软件名称才可以使用。 1、花生分屏 区分显示屏时可以保证主屏与分屏的特殊性,可以用鼠…查看详情

超越红牛,东鹏特饮要上市了!

功能饮料生意,红牛一直稳占“C位”,而东鹏特饮常年居于第二位,被业内成为“千年老二”。近日,东鹏特饮竟宣称已经完成了第一期上市督导工作,踏上了IPO上市之路。1年卖50亿,逆袭红牛上世纪的八九十年代,是功能饮料跟风辈出的时期。不过,红牛势头…查看详情

网站备案怎么办理?详细流程几步搞定!

  尽管我国早已启动了网站备案工作,但许多网站仍然处于未备案的状态,这就让不法分子钻到漏洞,对网站发起攻击。目前,所以使用国内服务器的网站都必须进行网站备案,备案不仅是为了保障网站经营者和网民的权益外,在一定程度上也能避免网站成为攻击者的目…查看详情

专利管理有主要有哪些内容

企业专利管理制度?企业专利管理部门职能: 1.制定开展专利工作的规划、计划和管理办法,并纳入到企业技术进步的规划中; 2.负责对职工进行专利法和专利知识的宣传培训工作; 3.支付企业职工的发明创造活动,为职工提供有关专利事务的咨询服务…查看详情

玄幻小说排行榜完本前十名,你最爱哪部?

相信很多人都有属于自己的英雄梦,而通过看玄幻小说,就能够很好的满足精神的需求,同时也可以放松身心,这也是玄幻小说之所以有很大吸引力的原因之一了,那么下面就针对于玄幻小说排行榜完结前十名,为大家进行相关介绍。 1、斗破苍穹 …查看详情

网站建设的常见问题 | 易导致用户体验差,甚至直接关闭网站

互联网时代几乎每个企业都拥有或是打算拥有一个属于自己的网站。但由于很多都是无互联网经验的线下企业,所以他们在建设自己网站时容易忽略一些导致用户体验差的网站建设的常见问题。 图片来源于网络 网站建设的常见问题有很多,都很容易导致用户体验差,甚…查看详情

手机作图软件有哪些 最火作图软件app

每个人所接触的工作和对应的工作岗位都不相同,工作岗位不一样,所负责的工作部分也不一样,如果你们在公司里面负责的是作图,这方面的工作的话,那么就需要提前了解一下作图软件都有哪些? 1、Pixso 它作为国内团体研发的在线设计a…查看详情

最新文章