如何使用元数据(大数据核心)

Robert S Sina(罗伯特) S. Seiner) 2018年6月6日 熄灭被翻译

在过来的25年里,通知技术的全球性的早已成熟的了——我的急行。从半夜到大学计算机Lab,英国政治工党凿孔卡和野外,上网、电子事情、事情智能、大数据、仿智……亲戚能够会以为,他们看到了每个别的。。

朕不料设想。,下独身的25年,朕要面临什么?。二十一世纪过后,在可预报的下独身的,施行数据、通知和知的查问和急行(假定缺点)将适合事情车道代理人

“施行数据、通知和知将是事情车道代理人。”

假定你还不确信,如此说法值当反复几次。。公司施行数据、通知和知的性能将决议独身COM的成。,或许他们将成。。

为了施行数据、通知和知,公司必要确信他们承认什么数据。。公司必要精确地确信他们的数据。若何使用权,而且若何使用权这些数据。杜撰竞赛优势。懂这些通知,公司必要施行和使用权它的元数据。

元数据是在IT器中记载的通知,它可以放事情和技术对数据和数据的包含。。(1)如此限度局限比朕如此信念的亲戚过度的使用权的“忧虑数据的数据”限度局限要长得多。当你把如此限度局限下决定成数个切断时,它将通知朕是什么元数据,我在哪里能找到它?,它有益于吗?,这会对谁有所扶助。。

元数据在下独身的几年将成为越来越要紧。元数据将不再是“周三的通知处置零碎之子”(2),就像数据仓库之父发酵饮料 数据施行评论射中靶子Inmon(数据) Management 评论说。每个公司都有元数据。这是毫无疑问的。数据库构成在元数据伸突出。数据模仿引起在元数据伸突出。挨次、显示、举报、查询、数据使感动……通知零碎的财产子群都是使用权元数据构成的。这在本质上就阐明了。,施行元数据很要紧。但如今缺点为了。。

元数据的成绩

忧虑元数据的成绩依然在。元数据终究是什么?施行元数据要花总额钱?若何检验对元数据的“花费”是有理的?谁使用权元数据?若何开端施行元数据?这些都是非常要紧的成绩,在这些成绩中,答案将适合决议公司能够的选择持续器械元数据施行战略和器械地基的关键代理人。

这些成绩一点也不常常轻易答复——异乎寻常地当亲戚的成绩其中的部分地脱每日构成的数据和技术架构以支撑物进取心的情境时——即人最有能够持续地时装主见。专家们写了很多书来答复这些成绩。。这些成绩在本记录缺勤议论。。

作为撤换,这时朕选择明显的的办法。。本文不再关怀元数据成绩的“答案”,另一方面关怀元数据可以答复的“成绩”。

成绩分级

元数据可以答复的“成绩”可分为十类。我选择这10类。,正确的由于它是独身好的霉臭的。。以及这是我先前使用权过的元数据的逻辑下决定以及,缺勤剩余部分缘故。假定这些类别麻烦你的必要,你可以由于本人的必要规划本人。。我选择的10个类别包罗

数据库元数据数据模仿元数据数据进展元数据事情药典元数据数据施行元数据使用权子群元数据数据采访/举报元数据有理化的元数据数据大规模的元数据使用权推拿元数据包含分级当你调准瞄准器“元数据可以答复的成绩”列表时,问本人三个简略的成绩。在你一般的任务平台中我的公司能答复这些成绩吗?我的公司为答复这些成绩付了总额钱?当朕无法答复这些成绩时,总算是什么?我猜度,假定您在管辖的范围前述的忧虑元数据的三个成绩的答案时,您将以为元数据施行怎地为了简略的。大多数人成绩分为多个类别。。拿 … 来说,数据使感动手续中,从源到使具有特性的数据(挥向)。对挥向的推拿(作业)可以因为映照列表(或,这打开开始或多个开始。。当源数据降下或源值缺勤使具有特性的挥向值(偶然称为缺乏药典)时所采取的推拿可以计算总数数据使感动元数据或数据大规模的元数据。我列出了某个成绩。,假定必要,你可以排好队伍它们暗中的相干。。这些成绩不应被以为是应有尽有的。。相反,得将元数据成绩计算总数独身“字母表器包”,它可以扶助你的公司包含这点。这些成绩的答案很要紧。。这些成绩的答案一点也不常常进展的。。假定IT机关可以采访此通知,他们会表现得反而更。。“本钱浪费”和“竞赛优势”与经过元数据施行数据参与。元数据可以答复的成绩数据库元数据数据库元数据代理体格反省数据。数据库元数据通常贮藏在数据库记入名单内或copybook/segment限度局限中,开发人员和数据库施行员使用权数据库或记录附带典型器T。数据信赖数据库(或说法/序号记录)中吗?什么数据库在?贮藏数据的数据库的体格反省名声是什么?数据在哪里?(拿 … 来说,平台(或DBMS)、服役等。数据库射中靶子表的名声是什么?任务台上有什么纵队?大调是什么?不断地剩余部分派额吗?表与剩余部分表有什么相干?表格是视域的一切断吗?前番补充数据库是什么时辰?谁终极补充了数据?有什么的说法记录和挨次记录?我的数据集的体格反省名声是什么?数据在哪里?、区域、数据集的名声等。有总额个数据版本?数据是在磁带或内存上设置的吗?什么正本表现文档射中靶子数据?什么挨次使用权正本?业务流程车道挨次是什么?若何处置、数据的结成和排序?数据模仿元数据数据模仿元数据代理数据的逻辑设计和从逻辑设计到体格反省数据的映照。数据模仿元数据还可以包罗事情药典、实在相干、域值等。数据模仿元数据通常在数据建模和侦查器中找到,憎恨有些数据模仿元数据依然能够在认为和电子表单器中下列这些通知。什么数据模仿在?朕在哪里可以找到模仿?有进取心数据模仿吗?谁杜撰了如此模仿?,用于什么挥向,放映/数据库等?谁认真负责的补充这些模仿?限度局限了什么事情实在?,他们有什么典型?数据库(表或零碎)中表现的事情实在在哪里?进取心实在的限度局限是什么?这些实在的天理是什么?属性的事情限度局限是什么?属性能够的选择有限度局限域?每个属性的容许值是总额?逻辑数据模仿与体格反省数据模仿暗中的相干是什么?体格反省数据模仿与逻辑数据模仿同步的吗?体格反省数据模仿与体格反省数据库同步的吗?实在与表、属性和列暗中在什么映照?数据使感动元数据数据使感动元数据代理数据从源到挥向的进展。数据使感动元数据包罗数据的选择和渗出、映照、替换和数据装填通知。数据使感动元数据可以在ETL或数据使感动器、电子表单、在桌面数据库中找到,也可以在结合数据进展的加密逻辑中找到。。使感动数据因为哪里?它是独身零碎温柔的剩余部分数据库?步行数据的在实地任务的是什么?,它是派生在实地任务的吗?数据是若何得到的?,前提,温柔的两者都兼具?派生手续中,你使用权什么数据?数据的值能够的选择打开剩余部分数据的值?,朕若何信任这些数据?挥向数据容许为空吗?假定数据降下,会产生什么?当源数据不足大规模的想要时会产生什么?当缺勤为源值分派映照的挥向值时怎地办?挥向数据的等值的是什么?这些值若何映照到先前的值?朕什么时辰使感动数据?数据常常以这种方法使感动。,温柔的跟一直期的形成而时装?那时撞使感动?事情药典元数据事情药典元数据代理事情若何使用权其数据停止推拿。事情药典元数据代理限度局限数据使用权的实在相干、基数、接药典等。。事情药典元数据通常信赖数据建模或侦查器中,或信赖器中。、文字处置、在电子表单或剩余部分器以及防守的剩余部分模型的文档。。逻辑数据模仿中数据实在暗中的相干是什么?这些实在暗中的基数是什么?在什么前提下?,数据分岔能随身携带指定的值吗?一张数据能承载什么等值的?等值的的意思是什么?若何杜撰、补充和剪下数据?什么时辰,谁折叠了药典?数据施行元数据数据施行元数据代理规划中谁对使用权数据所采取的举动认真负责的。数据施行元数据限度局限规划射中靶子谁限度局限数据,规划中引起谁、防守和剪下数据,而且谁使用权数据或直线部分使用权数据或通知在任务中。。数据施行元数据仍缺勤被数个公司采取(还缺勤!),但是多数公司使用权桌面数据库和电子表单。。假定你对数据有疑问,你要下令给谁?谁认真负责的限度局限?、引起、读取、补充和剪下数据?个别的施行数据的性能和责任感是什么?谁数据顾客谁使用权数据作为任务的一切断?公司内部可以共享什么通知?谁霉臭归因于释放令公司在远处的举报?谁认真负责的为数据分派可接受的值?施行手续若何使用权于公司的通知策略性通知策略性在哪里可以找到?使用权子群元数据使用权子群元数据代理使用权挨次的财产物体,从数据记录或表到挨次、本子与效能、显示等。使用权子群元数据是结合零碎的财产子群而且子群若何共享和重用的穿插援用。穿插援用器和桌面器通常是用来贮藏为了的器的地区。。什么使用权子群被以为是规范的可重用物体?如此可重用物体是若何决定的?若何尺寸这些物体,谁防守这些以协议约束?什么挨次(和数据)、显示等)是零碎(或手续或作用)的一切断。什么任务(或手续)、本子)执行遗产管理人的职责挨次?挨次和推拿使用权的数据是什么,数据是若何使用权的?若何将数据从挨次去世到挨次、作业作业、零碎到零碎?数据信任什么零碎?什么零碎信任指定数据?什么挨次和作业可以反复使用权?它们在哪里可以反复使用权?跟一直期的形成,放映和任务有什么更衣?谁写的挨次和作业?谁认真负责的支撑物和防守挨次和推拿?什么挨次补充数据?什么显示显示数据,什么年史显示数据?数据采访/举报元数据数据采访和举报元数据代理了若何采访数据,而且早已引起了什么举报可以被读取或重行引起。。数据采访和举报元数据也可以代理霉臭采取的过程来得到归因于读取数据,若何解说数据代理,进展器,举报的阐明,慢走。数据采访和举报元数据通常在举报器和经外传说典型的文档(如桌面数据库、搜索文字处置和电子表单。使用权这些数据的举报是什么?举报的阐明什么?若何采访日记?得采取什么过程来得到使用权数据的归因于?若何选择日记、规划/超群的、字组分类、数据的汇总和显示?举报使用权什么数据?什么举报使用权我的数据?举报的上个补充是什么时辰?霉臭亲自举报。,或许总算早已进展了吗?朕在哪里可以找到总算?有理化的元数据有理化元数据代理了规范的“进取心可接受”通知分岔,而且若何将这些通知分岔表现或映照到。规范通知分岔可以是数据元素的选择列表。,这些数据元素具有可接受的感觉。、历史、进取心数据模仿射中靶子值和/或规范通知分岔。有理化元数据可以代理数据元素是类似通知块的度和不同。有理化元数据通常贮藏智能库或经外传说文档中。公司的激励基本是什么?这些元素的事情名声和限度局限是什么?、由谁选择的?规范元素能够的选择被检验以供重用?规范元素在哪里映照到目前的数据?若何使用权规范元素?数据大规模的元数据数据大规模的元数据代理数据的大规模的。数据大规模的元数据代理精确性塌实对准、变动施行、数据值和限度局限的历史,而且时期更衣若何侵袭数据包含。。数据大规模的元数据还代理遭遇“坏”数据、当数据降下或完全一样的东西时必要停止的推拿。。使用权数据大规模的器、贮藏库和经外传说文档典型下列数据大规模的元数据。数据的等值的若何一直期更衣?可接受的等值的那时时装?数据的限度局限若何一直期更衣?数据的限度局限是什么时辰时装的?什么数据是坏数据?数据的大规模的反省是什么?大规模的检验挨次是什么?谁结合并执行遗产管理人的职责挨次谁辨析了总算?数据有多塌实?在数据被以为是低大规模的数据在前方,是什么可接受的置信概率?计算推拿的元数据计算推拿元数据代理数据的活的度和调整激励。计算推拿元数据代理数据贮藏、磁带使用权、推拿和服役推拿、调整信任、非常处置、伴奏的和回复手续等。。计算推拿元数据可以经过调整零碎、贮藏零碎、推拿和服役零碎发觉。。地基在数据上执行遗产管理人的职责什么推拿和推拿?有什么典型的数据伴奏的和回复进展?我的数据是上个一次伴奏的。、什么时辰回复和认同?伴奏的和复原数据必要什么过程?谁认真负责的伴奏的和回复?谁承认使用权数据的无损的解放?、读取、补充温柔的剪下?运转指定数据的挨次/举报的最佳效果时期是什么时辰?什么推拿信任于因为另独身审阅的数据?当推拿或零碎失灵或堵塞时,得采取什么举动?当推拿或零碎倒闭时,我得下令给谁?朕运转什么版本的软件?假定容许的话,朕有总额显然?,谁在使用权它们?执照什么时辰成熟?什么时辰嵌入软件的下一版本?在新的软件中对软件停止了什么时装和向上推起有总额磁盘空间进展?使用权了总额磁盘空间?数据增长的急行是什么?谁分派贮藏空间?,谁得答复磁盘贮藏成绩?若何限度局限磁带贮藏头?

发表评论

电子邮件地址不会被公开。 必填项已用*标注