如何使用元数据(大数据核心)

Robert S Sina(罗伯特) S. Seiner) 2018年6月6日 更迭口译

在过来的25年里,通讯技术的全面的先前年龄段了——我的猛冲。从半夜到大学计算机Lab,英国政治工党凿孔卡和野外,上网、电子事情、事情智能、大数据、仿智……普通百姓的能够会以为,他们看到了一切的。。

朕产生却设想。,居后地25年,朕要面临什么?。二十一世纪晚年的,在可先见的居后地,能解决数据、通讯和知的需求量和全速前进(产生变动从而产生断层)将相称事情驾驶电阻丝

“能解决数据、通讯和知将是事情驾驶电阻丝。”

产生你还不晓得,这人措词值当反复几次。。公司能解决数据、通讯和知的资格将决定一任一某一COM的成。,或许他们愿意成。。

为了能解决数据、通讯和知,公司需求晓得他们有效什么数据。。公司需求精确地晓得他们的数据。方法运用,又方法运用这些数据。制造竞赛优势。逮捕这些通讯,公司需求能解决和运用它的元数据。

元数据是在IT器中记载的通讯,它可以进步事情和技术对数据和数据的逮捕。。(1)这人下定义比朕这人邀请的普通百姓的过头运用的“向前数据的数据”下定义要长得多。当你把这人下定义消退成分别的平衡时,它将通知朕是什么元数据,我在哪里能找到它?,它有帮忙的吗?,这会对谁有所帮忙。。

元数据在居后地几年将从事越来越要紧。元数据将不再是“周三的通讯处置体系之子”(2),就像数据仓库之父发酵饮料 数据能解决评论切中要害Inmon(数据) Management 评论说。每个公司都有元数据。这是毫无疑问的。数据库构成在元数据以上。数据构成者肉体美在元数据以上。挨次、显示、流言蜚语、查询、数据转乘……通讯体系的占有集会都是运用元数据构成的。这本身就阐明了。,能解决元数据很要紧。但现时变动从而产生断层因此。。

元数据的成绩

向前元数据的成绩依然在。元数据终究是什么?能解决元数据要花那么些钱?方法证实对元数据的“封锁”是有理的?谁运用元数据?方法开端能解决元数据?这些都是非常要紧的成绩,在这些成绩中,答案将相称决定公司即使持续履行元数据能解决战略和履行安排的关键电阻丝。

这些成绩哪儿的话始终轻易答复——特别当普通百姓的的成绩非常脱每日构成的数据和技术架构以供养客人的形势时——即人最有能够不住变奏主张。专家们写了很多书来答复这些成绩。。这些成绩在本纸不注意议论。。

作为代替,这边朕选择不同的的方法。。本文不再关怀元数据成绩的“答案”,只关怀元数据可以答复的“成绩”。

成绩类别

元数据可以答复的“成绩”可分为十类。我选择这10类。,最好的由于它是一任一某一好的积分的。。以及这是我先前运用过的元数据的逻辑消退超过,不注意另外理性。产生这些类别不一致你的需求,你可以基本原则本身的需求薄纸本身。。我选择的10个类别包含

数据库元数据数据构成者元数据数据稍微移动元数据事情正规军元数据数据能解决元数据适用集会元数据数据拜访/流言蜚语元数据有理化的元数据数据优质的元数据适用采取军事行为元数据逮捕类别当你理解“元数据可以答复的成绩”列表时,问本身三个复杂的成绩。在你通常的一带中我的公司能答复这些成绩吗?我的公司为答复这些成绩付了那么些钱?当朕无法答复这些成绩时,产生是什么?我猜度,产生您在到达是你这样的说的嘛!向前元数据的三个成绩的答案时,您将发展物元数据能解决怎样这样的复杂的。好多成绩分为多个类别。。比如,数据转乘程序中,从源到界限的数据(物镜)。对物镜的采取军事行为(委派)可以来自某处测绘列表(或,这安心起端或多个起端。。当源数据走慢或源值不注意装设的物镜值(时而称为自成一格正规军)时所采取的采取军事行为可以处置数据转乘元数据或数据优质的元数据。我列出了非常成绩。,产生需求,你可以折叠它们中间的相干。。这些成绩不应被以为是应有尽有的。。相反,被期望将元数据成绩处置一任一某一“初级课程器包”,它可以帮忙你的公司逮捕这点。这些成绩的答案很要紧。。这些成绩的答案哪儿的话始终可学到的的。。产生IT机关可以拜访此通讯,他们会体现得能力更强的。。“本钱挽救”和“竞赛优势”与经过元数据能解决数据关心。元数据可以答复的成绩数据库元数据数据库元数据描述方法自然的数据。数据库元数据通常内存在数据库列于表上或copybook/segment下定义中,开发人员和数据库能解决员运用数据库或提出申请辅佐典型器T。数据信赖数据库(或原文/序号提出申请)中吗?孰数据库在?内存数据的数据库的自然的称呼是什么?数据在哪里?(比如,平台(或DBMS)、服务等。数据库切中要害表的称呼是什么?嵌合上有孰列?大调是什么?剧照另外规范吗?表与另外表有什么相干?表格是看的一平衡吗?前番重行开始数据库是什么时分?谁终极重行开始了数据?有哪样的原文提出申请和挨次提出申请?我的数据集的自然的称呼是什么?数据在哪里?、区域、数据集的称呼等。有那么些个数据版本?数据是在磁带或内存上设置的吗?孰复本表现文档切中要害数据?孰挨次运用复本?加工流程驾驶挨次是什么?方法处置、数据的结成和排序?数据构成者元数据数据构成者元数据描述方法数据的逻辑设计和从逻辑设计到自然的数据的测绘。数据构成者元数据还可以包含事情正规军、材料相干、域值等。数据构成者元数据通常在数据建模和窥测器中找到,然而有些数据构成者元数据依然能够在拥护者和电子表单器中拥护者这些通讯。什么数据构成者在?朕在哪里可以找到构成者?有客人数据构成者吗?谁制造了这人构成者?,用于什么物镜,定约雇用/数据库等?谁主管重行开始这些构成者?下定义了孰事情材料?,他们有什么倒转术?数据库(表或体系)中表现的事情材料在哪里?客人材料的下定义是什么?这些材料的天性是什么?属性的事情下定义是什么?属性即使有限度局限域?每个属性的容许值是那么些?逻辑数据构成者与自然的数据构成者中间的相干是什么?自然的数据构成者与逻辑数据构成者同时存在的吗?自然的数据构成者与自然的数据库同时存在的吗?材料与表、属性和列中间在孰测绘?数据转乘元数据数据转乘元数据描述方法数据从源到物镜的稍微移动。数据转乘元数据包含数据的选择和作为精华产生、测绘、替换和数据负荷通讯。数据转乘元数据可以在ETL或数据转乘器、电子表单、在桌面数据库中找到,也可以在写信数据稍微移动的信号逻辑中找到。。转乘数据来自某处哪里?它是一任一某一体系最好还是另外数据库?配药数据的田是什么?,它是派生田吗?数据是方法学到的?,必需品,最好还是两者都兼具?派生程序中,你运用什么数据?数据的值即使安心另外数据的值?,朕方法信赖这些数据?物镜数据容许为空吗?产生数据走慢,会产生什么?当源数据缺乏优质的资格时会产生什么?当不注意为源值分派测绘的物镜值时怎样办?物镜数据的涵义是什么?这些值方法测绘到先前的值?朕什么时分转乘数据?数据始终以这种方法转乘。,最好还是跟随工夫的发生而变奏?在那时弹簧转乘?事情正规军元数据事情正规军元数据描述方法事情方法运用其数据举行采取军事行为。事情正规军元数据描述方法下定义数据运用的材料相干、基数、包围正规军等。。事情正规军元数据通常信赖数据建模或窥测器中,或信赖器中。、文字处置、在电子表单或另外器超过进行辩护的另外设计一个版式的文档。。逻辑数据构成者中数据材料中间的相干是什么?这些材料中间的基数是什么?在什么必需品下?,数据破碎能支撑假设的值吗?很数据能承载什么涵义?涵义的意思是什么?方法制造、重行开始和自成一格数据?什么时分,谁征募了正规军?数据能解决元数据数据能解决元数据描述方法薄纸中谁对运用数据所采取的行为主管。数据能解决元数据下定义薄纸切中要害谁下定义数据,薄纸中找到谁、进行辩护和自成一格数据,又谁运用数据或直的运用数据或通讯在任务中。。数据能解决元数据仍不注意被分别的公司采取(还不注意!),孤独地多数公司运用桌面数据库和电子表单。。产生你对数据有疑心,你要大声喊给谁?谁主管下定义?、找到、读取、重行开始和自成一格数据?私人的能解决数据的资格和责备是什么?谁数据主顾谁运用数据作为任务的一平衡?公司内部可以共享孰通讯?谁强制的同意宣布公司露天的流言蜚语?谁主管为数据分派可接受的值?能解决程序方法适用于公司的通讯保险单通讯保险单在哪里可以找到?适用集会元数据适用集会元数据描述方法适用挨次的占有情郎,从数据提出申请或表到挨次、本子与效能、显示等。适用集会元数据是结合体系的占有集会又集会方法共享和重用的穿插援用。穿插援用器和桌面器通常是用来内存因此的器的空白。。孰适用集会被以为是规范的可重用情郎?这人可重用情郎是方法决定的?方法测验这些情郎,谁进行辩护这些品?什么挨次(和数据)、显示等)是体系(或程序或行使职责)的一平衡。孰任务(或程序)、本子)器械挨次?挨次和采取军事行为运用的数据是什么,数据是方法运用的?方法将数据从挨次印象到挨次、作业作业、体系到体系?数据信赖孰体系?孰体系信赖假设数据?孰挨次和作业可以反复运用?它们在哪里可以反复运用?跟随工夫的发生,定约雇用和任务有什么变奏?谁写的挨次和作业?谁主管供养和进行辩护挨次和采取军事行为?孰挨次重行开始数据?孰显示显示数据,孰翻书页显示数据?数据拜访/流言蜚语元数据数据拜访和流言蜚语元数据描述方法了方法拜访数据,而且先前找到了孰流言蜚语可以被读取或重行找到。。数据拜访和流言蜚语元数据也可以描述方法强制的采取的使移近来学到批准读取数据,方法解说数据描述方法,可学到的器,流言蜚语的阐明,附加的人。数据拜访和流言蜚语元数据通常在流言蜚语器和习俗典型的文档(如桌面数据库、搜索文字处置和电子表单。运用这些数据的流言蜚语是什么?流言蜚语的阐明什么?方法拜访日记?被期望采取孰使移近来学到运用数据的批准?方法选择日记、薄纸/行列、集合、数据的汇总和显示?流言蜚语运用什么数据?什么流言蜚语运用我的数据?流言蜚语的最后的重行开始是什么时分?强制的亲自流言蜚语。,或许产生先前可学到的了吗?朕在哪里可以找到产生?有理化的元数据有理化元数据描述方法了规范的“客人可接受”通讯破碎,又方法将这些通讯破碎表现或测绘到。规范通讯破碎可以是数据元素的选择列表。,这些数据元素具有可接受的理性。、历史、客人数据构成者切中要害值和/或规范通讯破碎。有理化元数据可以描述方法数据元素是相同通讯块的学位和差别。有理化元数据通常内存智囊团团员库或习俗文档中。公司的核基础训练是什么?这些元素的事情称呼和下定义是什么?、由谁选择的?规范元素即使被认可以供重用?规范元素在哪里测绘到持续存在数据?方法运用规范元素?数据优质的元数据数据优质的元数据描述方法数据的优质的。数据优质的元数据描述方法精确性踏实超过、变卦能解决、数据值和下定义的历史,又工夫变奏方法压紧数据逮捕。。数据优质的元数据还描述方法对决“坏”数据、当数据走慢或复制的时需求举行的采取军事行为。。运用数据优质的器、内存库和习俗文档典型拥护者数据优质的元数据。数据的涵义方法随工夫变奏?可接受的涵义在那时变奏?数据的下定义方法随工夫变奏?数据的下定义是什么时分变奏的?什么数据是坏数据?数据的优质的反省是什么?优质的检验挨次是什么?谁写信并器械挨次谁辨析了产生?数据有多踏实?在数据被以为是低优质的数据优于,是什么可接受的可信系数?计算采取军事行为的元数据计算采取军事行为元数据描述方法数据的敏捷度和调整地核。计算采取军事行为元数据描述方法数据内存、磁带运用、采取军事行为和服务采取军事行为、调整信赖、非常处置、备份文件和回复程序等。。计算采取军事行为元数据可以经过调整体系、内存体系、采取军事行为和服务体系发展。。安排在数据上器械孰采取军事行为和采取军事行为?有孰典型的数据备份文件和回复可学到的?我的数据是最后的一次备份文件。、什么时分回复和鉴定?备份文件和复原数据需求孰使移近?谁主管备份文件和回复?谁有效运用数据的保安的许可权?、读取、重行开始最好还是自成一格?运转假设数据的挨次/流言蜚语的最佳效果工夫是什么时分?孰采取军事行为信赖于来自某处另一任一某一继续说的数据?当采取军事行为或体系作废或塞住时,被期望采取什么行为?当采取军事行为或体系使失望时,我被期望大声喊给谁?朕运转什么版本的软件?产生容许的话,朕有那么些专利?,谁在运用它们?默许什么时分逝世?什么时分使成为一部分软件的下一版本?在新的软件中对软件举行了孰变奏和变高有那么些磁盘空间可学到的?运用了那么些磁盘空间?数据增长的全速前进是什么?谁分派内存空间?,谁被期望答复磁盘内存成绩?方法下定义磁带内存头?

发表评论

电子邮件地址不会被公开。 必填项已用*标注