如何使用元数据(大数据核心)

Robert S Sina(罗伯特) S. Seiner) 2018年6月6日 跨距译员

在过来的25年里,通讯技术的全局的早已使苍老了——我的职业。从半夜到大学计算机Lab,英国政治工党凿孔卡和野外,上网、电子事情、买卖智能、大数据、仿智……使住满人可能性会以为,他们看到了尽量的。。

人们最好的设想。,侵入25年,人们要面临什么?。二十一世纪较晚地,在可先见的侵入,办理数据、通讯和知的盘问和速(需要量责备)将相称买卖发动者首要的

“办理数据、通讯和知将是事情发动者首要的。”

需要量你还不知情,这事措词值当反复几次。。公司办理数据、通讯和知的性能将决定独一COM的成。,或许他们大概成。。

为了办理数据、通讯和知,公司必要知情他们拿什么数据。。公司必要精确地知情他们的数据。方法运用,也方法运用这些数据。墙角石竞赛优势。拘押这些通讯,公司必要办理和运用它的元数据。

元数据是在IT器中记载的通讯,它可以借款事情和技术对数据和数据的拘押。。(1)这事规定比人们这事使命的使住满人从一边至另一边运用的“向前数据的数据”规定要长得多。当你把这事规定重行计算成几个的部件时,它将告知人们是什么元数据,我在哪里能找到它?,它有益的吗?,这会对谁有所扶助。。

元数据在侵入几年将相当越来越要紧。元数据将不再是“周三的通讯处置体系之子”(2),就像数据仓库之父鸟嘴相接触 数据办理评论射中靶子Inmon(数据) Management 评论说。每个公司都有元数据。这是毫无疑问的。数据库排列在元数据突出物。数据用模子做扩展在元数据突出物。次、显示、报道、查询、数据转乘……通讯体系的迷住议会都是运用元数据排列的。这其就阐明了。,办理元数据很要紧。但如今责备左右。。

元数据的成绩

向前元数据的成绩依然在。元数据毕竟是什么?办理元数据要花很钱?方法证实对元数据的“值得买的东西”是有理的?谁运用元数据?方法开端办理元数据?这些都是非常要紧的成绩,在这些成绩中,答案将相称决定公司能否持续使生效元数据办理战略和使生效发射的关键首要的。

这些成绩一点儿也心不在焉不断地轻易回复——尤其地当使住满人的成绩颇脱每日排列的数据和技术架构以帮助连队的条款时——即人最有可能性持续地转变主张。专家们写了很多书来回复这些成绩。。这些成绩在本贴纸心不在焉议论。。

作为抵换,嗨人们选择清楚的的方法。。本文不再关怀元数据成绩的“答案”,另一方面关怀元数据可以回复的“成绩”。

成绩类别

元数据可以回复的“成绩”可分为十类。我选择这10类。,唯一的因它是独一好的应该的。。以及这是我先前运用过的元数据的逻辑重行计算那一边,心不在焉休息存款。需要量这些类别缺乏你的必要,你可以如本身的必要规划本身。。我选择的10个类别包罗

数据库元数据数据用模子做元数据数据去掉元数据事情经常地元数据数据办理元数据使用权议会元数据数据爆发/报道元数据有理化的元数据数据品种元数据使用权开刀元数据拘押类别当你读懂“元数据可以回复的成绩”列表时,问本身三个简略的成绩。在你电流的命运中我的公司能回复这些成绩吗?我的公司为回复这些成绩付了很钱?当人们无法回复这些成绩时,算是是什么?我猜度,需要量您在通行上述的向前元数据的三个成绩的答案时,您将感受元数据办理怎地这时简略的。差不多成绩分为多个类别。。譬如,数据转乘工艺流程中,从源到终点站的数据(决定)。对决定的开刀(估计使丧失)可以是人有代理人列表(或,这倚靠开始或多个开始。。当源数据少量或源值心不在焉详述的决定值(时而称为缺点经常地)时所采取的开刀可以尊敬数据转乘元数据或数据品种元数据。我列出了多数成绩。,需要量必要,你可以折叠它们中间的相干。。这些成绩不应被以为是应有尽有的。。相反,理所当然将元数据成绩尊敬独一“基础课器包”,它可以扶助你的公司拘押这点。这些成绩的答案很要紧。。这些成绩的答案一点儿也心不在焉不断地体现的。。需要量IT机关可以爆发此通讯,他们会体现得好转的。。“本钱解救”和“竞赛优势”与经过元数据办理数据涉及。元数据可以回复的成绩数据库元数据数据库元数据周转身体的数据。数据库元数据通常记忆在数据库编目录或copybook/segment规定中,开发人员和数据库办理员运用数据库或证明辅佐典型器T。数据躺在数据库(或倒转术/序号证明)中吗?哪一个数据库在?记忆数据的数据库的身体的著名的是什么?数据在哪里?(譬如,平台(或DBMS)、服务性的等。数据库射中靶子表的著名的是什么?平地层上有哪一个列?大调是什么?而且休息定量吗?表与休息表有什么相干?表格是视域的一部件吗?前番使更新数据库是什么时辰?谁终极使更新了数据?有很的倒转术证明和次证明?我的数据集的身体的著名的是什么?数据在哪里?、区域、数据集的著名的等。有很个数据版本?数据是在磁带或内存上设置的吗?哪一个正本表现文档射中靶子数据?哪一个次运用正本?业务流程发动者次是什么?方法处置、数据的结成和排序?数据用模子做元数据数据用模子做元数据周转数据的逻辑设计和从逻辑设计到身体的数据的有代理人。数据用模子做元数据还可以包罗事情经常地、本质相干、域值等。数据用模子做元数据通常在数据建模和情况器中找到,只管有些数据用模子做元数据依然可能性在其次的和电子表单器中其次的这些通讯。什么数据用模子做在?人们在哪里可以找到用模子做?有连队数据用模子做吗?谁墙角石了这事用模子做?,用于什么决定,签订协议/数据库等?谁一本正经使更新这些用模子做?规定了哪一个事情本质?,他们有什么塑造?数据库(表或体系)中表现的事情本质在哪里?连队本质的规定是什么?这些本质的特性是什么?属性的事情规定是什么?属性能否有限度局限域?每个属性的容许值是很?逻辑数据用模子做与身体的数据用模子做中间的相干是什么?身体的数据用模子做与逻辑数据用模子做同时性吗?身体的数据用模子做与身体的数据库同时性吗?本质与表、属性和列中间在哪一个有代理人?数据转乘元数据数据转乘元数据周转数据从源到决定的去掉。数据转乘元数据包罗数据的选择和拔出剑、有代理人、替换和数据负荷通讯。数据转乘元数据可以在ETL或数据转乘器、电子表单、在桌面数据库中找到,也可以在写数据去掉的法典逻辑中找到。。转乘数据是人哪里?它是独一体系还要休息数据库?填充物数据的担任外场员是什么?,它是派生担任外场员吗?数据是方法取得的?,需要量,还要二者兼具?派生工艺流程中,你运用什么数据?数据的值能否倚靠休息数据的值?,人们方法求助于这些数据?决定数据容许为空吗?需要量数据少量,会发作什么?当源数据缺乏品种问时会发作什么?当心不在焉为源值分派有代理人的决定值时怎地办?决定数据的使丧失是什么?这些值方法有代理人到先前的值?人们什么时辰转乘数据?数据不断地以这种方法转乘。,还要跟随工夫的不要而转变?在那时突然跳出转乘?事情经常地元数据事情经常地元数据周转事情方法运用其数据停止开刀。事情经常地元数据周转规定数据运用的本质相干、基数、担任外场员经常地等。。事情经常地元数据通常躺在数据建模或情况器中,或躺在器中。、文字处置、在电子表单或休息器那一边预防性维修的休息排队的文档。。逻辑数据用模子做中数据本质中间的相干是什么?这些本质中间的基数是什么?在什么需要量下?,数据参加能提供使具有特性的值吗?许多数据能承载什么使丧失?使丧失的意思是什么?方法墙角石、使更新和用力打数据?什么时辰,谁停下了经常地?数据办理元数据数据办理元数据周转规划中谁对运用数据所采取的行为一本正经。数据办理元数据规定规划射中靶子谁规定数据,规划中建立谁、预防性维修和用力打数据,也谁运用数据或整齐的运用数据或通讯在任务中。。数据办理元数据仍心不在焉被几个的公司采取(还心不在焉!),孤独地多数公司运用桌面数据库和电子表单。。需要量你对数据有疑问,你要呼唤给谁?谁一本正经规定?、建立、读取、使更新和用力打数据?我办理数据的性能和职责或任务是什么?有先行词数据家伙谁运用数据作为任务的一部件?公司内部可以共享哪一个通讯?谁应该约束力公布公司绝不是的报道?谁一本正经为数据分派可接受的值?办理工艺流程方法使用权于公司的通讯策略性通讯策略性在哪里可以找到?使用权议会元数据使用权议会元数据周转使用权次的迷住女朋友,从数据证明或表到次、本子与功用、显示等。使用权议会元数据是结合体系的迷住议会也议会方法共享和重用的穿插援用。穿插援用器和桌面器通常是用来记忆左右的器的使分开。。哪一个使用权议会被以为是基准的可重用女朋友?这事可重用女朋友是方法决定的?方法考验这些女朋友,谁预防性维修这些定约雇用?什么次(和数据)、显示等)是体系(或工艺流程或重大聚会)的一部件。哪一个任务(或工艺流程)、本子)表现次?次和开刀运用的数据是什么,数据是方法运用的?方法将数据从次投递到次、作业作业、体系到体系?数据求助于哪一个体系?哪一个体系求助于使具有特性数据?哪一个次和作业可以反复运用?它们在哪里可以反复运用?跟随工夫的不要,签订协议和任务有什么交换?谁写的次和作业?谁一本正经帮助和预防性维修次和开刀?哪一个次使更新数据?哪一个显示显示数据,哪一个页显示数据?数据爆发/报道元数据数据爆发和报道元数据周转了方法爆发数据,而且早已建立了哪一个报道可以被读取或重行建立。。数据爆发和报道元数据也可以周转应该采取的走近来取得批准的证书读取数据,方法解说数据周转,体现器,报道的阐明,附加物。数据爆发和报道元数据通常在报道器和会议典型的文档(如桌面数据库、搜索文字处置和电子表单。运用这些数据的报道是什么?报道的阐明什么?方法爆发日志?理所当然采取哪一个走近来取得运用数据的批准的证书?方法选择日志、规划/顺序、分类、数据的汇总和显示?报道运用什么数据?什么报道运用我的数据?报道的期末考试使更新是什么时辰?应该亲自报道。,或许算是早已体现了吗?人们在哪里可以找到算是?有理化的元数据有理化元数据周转了基准的“连队可接受”通讯参加,也方法将这些通讯参加表现或有代理人到。基准通讯参加可以是数据元素的选择列表。,这些数据元素具有可接受的意味着。、历史、连队数据用模子做射中靶子值和/或基准通讯参加。有理化元数据可以周转数据元素是同样通讯块的平稳的和特色。有理化元数据通常记忆智囊团团员库或会议文档中。公司的胸部首要的是什么?这些元素的买卖著名的和规定是什么?、由谁选择的?基准元素能否被断言以供重用?基准元素在哪里有代理人到存在数据?方法运用基准元素?数据品种元数据数据品种元数据周转数据的品种。数据品种元数据周转精确性塌实水平面、变动办理、数据值和规定的历史,也工夫交换方法星力数据拘押。。数据品种元数据还周转相遇“坏”数据、当数据少量或一份时必要停止的开刀。。运用数据品种器、记忆库和会议文档典型其次的数据品种元数据。数据的使丧失方法随工夫交换?可接受的使丧失在那时转变?数据的规定方法随工夫交换?数据的规定是什么时辰转变的?什么数据是坏数据?数据的品种反省是什么?品种检验次是什么?谁写并表现次谁剖析了算是?数据有多塌实?在数据被以为是低品种数据以前,是什么可接受的可信系数?计算开刀的元数据计算开刀元数据周转数据的敏捷度和调整果核。计算开刀元数据周转数据记忆、磁带运用、开刀和服务性的开刀、调整求助于、非常处置、支持性的和回复工艺流程等。。计算开刀元数据可以经过调整体系、记忆体系、开刀和服务性的体系被发现的事物。。发射在数据上表现哪一个开刀和开刀?有哪一个典型的数据支持性的和回复体现?我的数据是期末考试一次支持性的。、什么时辰回复和断言?支持性的和复原数据必要哪一个走近?谁一本正经支持性的和回复?谁拿运用数据的保险柜总督委任组成的法庭?、读取、使更新还要用力打?运转使具有特性数据的次/报道的最佳效果工夫是什么时辰?哪一个开刀求助于于是人另独一行进的数据?当开刀或体系生效或终止处时,理所当然采取什么行为?当开刀或体系降低价值时,我理所当然呼唤给谁?人们运转什么版本的软件?需要量容许的话,人们有很显露?,谁在运用它们?正当理由什么时辰文件、协议等失效?什么时辰装置软件的下一版本?在新的软件中对软件停止了哪一个转变和增强的力量有很磁盘空间体现?运用了很磁盘空间?数据增长的速是什么?谁分派记忆空间?,谁理所当然回复磁盘记忆成绩?方法规定磁带记忆头?

发表评论

电子邮件地址不会被公开。 必填项已用*标注