不仅仅是文字:阐明数据术语混乱

不仅仅是文字:阐明数据术语混乱

我们需要 XYZ。 确实。 它出现在所有分析报告中,它的趋势超出了图表,我们的竞争对手也有。 因此,让我们找到一个拥有它的供应商,然后让我们自己投资。 应该这样做。

听起来有点熟? 希望贵公司的技术投资决策不是以这种方式做出的。 但是随着技术的发展比以往任何时候都快,很难跟上所有的术语。 不幸的是,有些人将术语视为混淆层,意在美化提出它的人炒作产品,并让乱用术语的人显得聪明。

这可能有些道理,但这并不意味着术语没有用。 相反,术语是为了满足真正的需求,即描述快速发展领域中的新兴概念。 理想情况下,共享词汇表应有助于理解不同的概念、细分市场和产品。

恰当的例子:数据和元数据管理。 您以前听说过数据管理、数据可观察性、数据结构、数据网格、DataOps、MLOps 和 AIOps 等术语吗? 但是,您知道它们每个的确切含义以及它们之间的关系吗? 这是你找出答案的机会。

数据层
尽管我们作为分析师活跃在更广泛的数据领域,但我们承认并非上述所有内容对我们来说都是完全清楚的。 所以当我们遇到 Maarten Masschelein 和 Tom Baeyens 时,我们想我们会征求他们的意见。 Masschelein 和 Baeyens 是 Soda 的联合创始人,这家初创公司刚刚获得 Gartner 颁发的“数据管理领域的优秀供应商”称号。

除了被官方宣布很酷之外,他们可能知道一两件事还有另一个原因:他们一直在身边。 Masschelein 是 Collibra 的第五名员工,用他的话说,他是第一个向首席数据官销售软件的人——在那之前甚至还没有出现。 Baeyens 是 jBPM 的创始人和项目负责人,jBPM 是一个传奇的业务流程管理 (BPM) 开源项目。

让我们从数据结构开始。 Masschelein 将其视为按比例组织数据的框架——一个元层,用于以统一的方式访问与组织相关的所有数据,无论它们位于何处。

数据结构侧重于这种统一数据访问的技术方面。

数据网格是一个类似的概念,但在关注组织方面的意义上有所不同。 Masschelein 发现数据网格类似于数据治理原则的现代化版本,适用于更广泛的数据团队。 目标是构建和组织,消除过去的一些瓶颈,例如对数据仓库团队的依赖。 马斯谢林说:

“对于数据网格,它从根本上是关于构建数据产品和数据服务。所以它是数据产品思维。在数据治理中,我们谈论将数据作为资产进行管理。当我们谈论将数据作为产品进行管理时,这更具体,最终 .这是我们应该有核心服务的概念。但除此之外,我们需要围绕数据领域、领域、业务、专业知识和知识建立结构,使它们能够自助服务。我认为这就是 钥匙”。

Masschelein 继续补充说,数据管理是一个已经存在了几十年的术语。 数据管理协会对此进行了广泛的描述,该协会围绕如何管理数据做了很多工作。 最终,其中一部分是元数据管理,它衍生出数据编目软件和数据沿袭功能。

Masschelein 将数据监控、数据可观察性和数据测试视为更广泛的数据管理框架内质量管理的专门子域。 Baeyens 添加了有关数据可观察性的上下文:

“你有工程师构建数据管道。他们准备用于数据产品的数据,例如机器学习模型。有一群工程师定期开发新产品。一旦这些产品投入生产,那就是可观察性的开始。这就是那里 数据实际上可能会变坏。如果使用数据的模型没有注意到数据是坏的,这将导致各种代价高昂和危险的后果“。

数据监控、测试、健身和协作
至于 DataOps,它是关于使用与数据相关的功能,在最佳实践流程中组织起来,以更快的速度交付数据产品,所有这些都具有更高的可靠性。 Masschelein 说,许多小流程需要到位并标准化,以便更好地处理数据,类似于我们在软件工程中对 DevOps 所做的工作。

MLOps 似乎可以与 AIOps 互换使用,它依赖于良好的 DataOps 基础但更专业。 例如,在 DataOps 中,我们不会监控预测准确性。 这特定于数据产品,也特定于数据产品的生命周期。 Masschelein 从生命周期的角度来思考它:

“这是两件独立的事情,因为数据集的生命周期最终与机器学习或数据产品的生命周期并没有紧密耦合。也有不同的人在做这件事。在管理数据和 DataOps 方面,我们有数据 可以是组织外部的生产者,并且您有内部生成的数据。

另一种看待它的方式是工具领域。 如果你看一下监控和可观察性软件堆栈,我们在底部有基础设施。 所以首先,我们编写应用程序,然后现在我们使用数据和机器学习作为两种新层”。

两人指出,我们刚刚开始使用软件和来帮助监控这些相对较新的层,而其他层已经存在了很长时间。 这就是 Soda 自己的发挥作用的地方。 这个名字的出现是因为创始人喜欢无声数据问题冒出来的想法,就像汽水一样。 所以 soda 涵盖了监控、测试、数据适配和协作。

监控是关于自动监控数据集的问题。 这意味着要弄清楚落入您环境中的数据集是否存在异常。 例如,您这次大约处理了多少条记录? 与上周同一天相比,是否异常? 例如,Soda 可以使用机器学习来发现异常。

但是监控只涵盖了您可能遇到的数据问题类型的一小部分。 这就是下一步要进行数据测试和验证的原因。 这是您启用数据工程师和主题专家的地方。 在这里可以指定诸如“我们在此列中只能有 X% 的缺失数据”、“我们需要参照完整性”或“一组允许的值”等规则。

这一切都很好,但是如果你有一个用于发现数据问题的系统,它会产生很多警报,所以问题是:你如何处理这些警报? 您经历的业务流程是什么? 这就是数据适应性仪表盘的用武之地。它支持 SLA 跟踪,让数据所有者了解整个组织对数据的所有期望以及围绕问题解决的工作流程。

最后但同样重要的是,协作是一个跨领域的问题。 具有协作功能使对问题具有不同知识的人(通常拥有隐性的、未记录的知识)能够一起工作并解决问题。 Baeyens 提到,这还涉及传统上不被认为是协作的功能,例如使分析师能够在没有数据工程师参与的情况下自行管理领域知识。

肥皂水和苏打水
Baeyens 为 Soda 带来的 BPM 专业知识已被用于构建,特别是不同模块如何在工作流进程中组合在一起。 Soda 使用 SQL 源,Spark 集成几乎就绪。 目标是能够覆盖尽可能多的数据环境。

根据 Gartner 的定义,Soda 可能无法涵盖综合数据结构的所有关键支柱,但话又说回来,很难想出很多解决方案。 然而,它确实增加了数据目录,专注于 DataOps。 此外,汽水针对不同的用户群,这也反映在其产品中。

有一个针对数据工程师的开源层。 Baeyens 认为用户群不一定对 SaaS 产品感兴趣。 根据 Baeyens 的说法,开源 Soda SQL 的目标是简单并使用其目标受众喜欢使用的技术——SQL 和 YAML。

Soda SQL 的发展和采用情况良好,这是人们了解 Soda 的一种方式。 但是,如果他们喜欢他们所看到的并且他们的需求增长到包括分析师和 CDO 等人员,那么是时候转向付费的 SaaS 版本的 Soda 了。

该公司最近获得了 1150 万欧元的 A 轮融资,加上他们之前的种子资金,总计约 1400 万欧元。 这应该为 Soda 提供一条良好的跑道来开发其产品,目的是发展工程和上市团队。

如果没有别的,Soda 的创始人似乎对他们经营的环境有着坚定的把握。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66455.html 聚才发 母婴好物

(0)
上一篇 2023年12月28日 上午4:45
下一篇 2023年12月28日 上午4:53

相关推荐

  • 赵秉忠的考试卷为何是一级文物

    赵秉忠是明朝万历年间状元,他高中状元时,年仅25岁,此后正式开启了自己的仕途之路。不过今天我们打算跟各位重点讲讲,赵秉忠参加科举时的考试卷,很幸运我们将赵秉忠的状元卷保存了下来,而且现在是国家一级文物。赵秉忠状元卷具有非常高的研究价值,是明史的重要文献,从这份简答的试卷中能给我们带来很多意想不到的东西。其实光从赵秉忠的字迹来看,这份考卷就拥有十足的含金量。 …

    2024年2月7日
    43
  • 新人如何学习网络营销,有什么妙招?(网络营销)

    我想做管件网络销售应学习管 恩 我也是做管件的。其实学管件的时候掌握好方法就OK了。我感觉学习管件主要军要有几点。一,首先茶烟要知道你所在的单位生产什么管件。然后文字与图结合,知道大概的一些管件的用途。二,你们所经营管件的主要标准及标准中想对应的材质。三,管件的规格。四,如何计算重量。刚刚接触的时候也就是这样系统的学习一下,这样才能准确的发布产品信息,并且月…

    2024年1月24日
    109
  • 正月不能剪头发吗为什么(正月剪头发有什么讲究吗)

    俗话说:没出正月都是年。 我国拥有几千年的悠久历史文化,光是过年,从大年三十那天开始,各种新春讲究和民俗,就会层出不穷。 这其中,有一些是老一辈人口口相传下来的,也有一些,是受到整体文化氛围的潜移默化的影响。 当然,这其中还有个别的讲究和民俗,大家怎么想也觉得很奇葩,让人无法理解。 比如说“正月里不能剃头”,民间的说法是如果正月里剪头发了,就会对舅舅不利,于…

    2023年8月12日
    187
  • 瑞幸咖啡加盟费及加盟条件2024(官网加盟费用多少钱)

    luckin coffee (瑞幸咖啡)总部位于厦门,以“创造幸运时刻,激发美好生活热望为使命,瑞幸咖啡充分利用移动互联网和大数据技术的新零售模式,与各领域优质供应商深度合作,打造高品质的消费体验,为顾客创造幸运时刻。 luckin coffee (瑞幸咖啡)加盟条件1、年满18周岁以上,拥有足够的创业热情,并得到家人的大力优势。 2、认同、认知“瑞幸咖啡”…

    2023年11月29日
    200
  • 港台男歌手排名(港台男歌手排名前十)

    香港乐坛作为华语乐坛的重要组成部分,在四十多年的发展时间里,涌出了一大批脍炙人口的经典歌曲和知名歌手。自九十年代港乐步入黄金期,由“四大天王”领衔的一大批男歌手成为了香港乐坛的中流砥柱,在内地风靡一时。接下来就来给大家盘点九十年代以来在内地爆火的十位香港男歌手。 第一位:张学友。张学友作为“歌神”,无疑是“四大天王”中唱功排在第一位的存在。他的《饿狼传说》、…

    2023年7月30日
    409
  • 苹果、谷歌、微软和 Mozilla 旨在打造更加一致的网络

    Apple 正在与浏览器开发商 Google、Microsoft 和 Mozilla 合作,使网页设计技术更加一致,无论用户依赖哪种浏览器。 标准什么时候不是标准?问题在于某些浏览器以不同的方式处理网络技术。 这可能会引出一句格言,“什么时候标准不是标准? 当它成为网络标准时。” 但是,当涉及到开发人员,尤其是试图跨、产品和浏览器创建一致的 Web 界面的企…

    2024年1月8日
    132
  • 李元芳与虎敬晖是什么人:唐朝的两位英勇卫士

    一、序言 在中国的历史长河中,唐朝无疑是一个繁荣昌盛的时代。在这个时代里,有无数的英勇卫士为国家的安全和人民的幸福而奋斗。今天,我们要讲述的就是两位唐朝的英勇卫士——李元芳与虎敬晖的故事。 二、李元芳:忠诚勇敢的卫士 李元芳,唐朝著名的将领和侦探,他的事迹在《神探狄仁杰》系列小说中被广泛传播。他聪明机智,勇敢善战,是唐朝的一位杰出的卫士。在狄仁杰的帮助下,李…

    2024年2月27日
    35
  • 什么兼职副业能赚钱啊(电脑或者手机上弄什么东西一天可以赚30块钱左右的?)

    兼职副业可以做些什么八大可以赚钱副业介绍 【导语】现在很多的上班族下班后都不知道怎么消遣时间,因刻印府继奏脸德属军波此有很多的人选择兼职一话稳据跟千脸容告工地些副业来充实自己,这样既育能赚钱,还能合理的利用下班的时间。那么,兼职副业可以做些什么? 兼职副业现在很多的人基本上都是有兼职副业的,因为如穿精球位质销呼抓政果只是安安心心的做一个上班族,财形置善材息财…

    2024年1月30日
    115
  • 毕业送老师什么礼物最实用更适合(7间实用便宜的礼物推荐)

    首先说老师从事教育事业不是为了索取礼物,也不能为了谋私利才去当一名教师。他们是老师,因为他们关心孩子,他们喜欢看着孩子学习,他们想帮助学生完成知识储备。老师们对假期没有期待,他们想要把每一分钟都花到教学育人的伟大使命中。 但每个学生都可以用一点点小礼物去感谢他们的付出。 如果你想用礼物感谢你的老师,你可能有兴趣知道老师真正欣赏的东西是什么。 老师真正不需要的…

    2023年8月12日
    160
  • 宋仁宗按身高发军饷是真的吗

    相信很多小伙伴都知道,关于军队里面发军饷一般情况下都是全都一样,不然总会有些人觉得不公平。但是觉得很离谱的是,在宋朝的宋仁宗,他发军饷是怎么发的呢?谁的身高高,谁就发的多一点,相反身高矮的就少发一点,这是为什么呢?下面就和小编一起来来看看吧! 1、宋仁宗按身高发军饷是真的吗 确实是真的。虽然事情比较奇葩让人笑掉大牙,但是事情既然做了,那应该还是有他的道理的。…

    2024年2月26日
    27

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注