您需要知道和理解的 10 个最重要的 Hadoop 术语源代码

您需要知道和理解的 10 个最重要的 Hadoop 术语源代码

大数据是海量结构化非结构化或半结构化数据的响亮名称,众所周知难以捕获、存储、管理、共享、分析和可视化,至少使用传统数据库和软件应用程序是如此。 这就是大数据技术具有有效管理和处理海量数据的潜力的原因。 Apache Hadoop 提供框架和相关技术,以分布式方式跨计算机集群处理大型数据集。 因此,为了真正理解大数据,您需要对 Hadoop 有所了解。 在这里,我们将了解您会听到的有关 Hadoop 的最常见术语 – 以及它们的含义。

但首先,看看 Hadoop 是如何工作的
在进入 Hadoop 生态系统之前,您需要清楚地了解两件基本的事情。 第一个是文件在 Hadoop 中的存储方式; 第二个是如何处理存储的数据。 所有与Hadoop相关的技术都主要在这两个方面进行工作,使其更加人性化。 (在 Hadoop 如何帮助解决大数据问题中获取 Hadoop 工作原理的基础知识。)

现在,关于条款。

Hadoop通用
Hadoop 框架具有用于不同功能的不同模块,并且这些模块可以出于各种原因相互交互。 Hadoop Common 可以定义为一个通用的实用程序库,以支持 Hadoop 生态系统中的这些模块。 这些实用程序基本上是基于 Java 的归档 (JAR) 文件。 这些实用程序主要由程序员和开发人员在开发期间使用。

Hadoop 分布式文件系统 (HDFS)
Hadoop 分布式文件系统 (HDFS) 是 Apache 软件基金会下的 Apache Hadoop 的一个子项目。 这是 Hadoop 框架中存储的支柱。 它是一个分布式、可扩展和容错的文件系统,跨越多个称为 Hadoop 集群的商品硬件。 HDFS 的目标是通过对应用程序数据的高吞吐量访问可靠地存储大量数据。 HDFS 遵循主/从架构,其中主节点称为 NameNode,从节点称为 DataNode。

MapReduce
Hadoop MapReduce 也是 Apache 软件基金会的一个子项目。 MapReduce实际上是一个纯Java编写的软件框架。 它的主要目标是以完全并行的方式在分布式环境(由商品硬件组成)上处理大型数据集。 该框架管理所有活动,如作业调度、监控、执行和重新执行(在任务失败的情况下)。

数据库
Apache HBase 被称为 Hadoop 数据库。 它是一个列式、分布式和可扩展的大数据存储。 它也被称为一种 NoSQL 数据库,不是关系数据库管理系统。 HBase 应用程序也是用 Java 编写的,构建在 Hadoop 之上并在 HDFS 上运行。 当您需要实时读写和随机访问大数据时,使用 HBase。 HBase 是基于 Google 的 BigTable 概念建模的。

蜂巢
Apache Hive 是一个开源数据仓库软件系统。 Hive 最初由 Facebook 开发,然后才归入 Apache 软件基金会并成为开源软件。 它有助于在分布式 Hadoop 兼容存储上管理和查询大型数据集。 Hive 通过使用称为 HiveQL 的类似 SQL 的语言来执行其所有活动。 (在 Apache Hive 和 Pig 简介中了解更多信息。)

阿帕奇猪
Pig 最初由 Yahoo 发起,用于在大量分布式数据上开发和执行 MapReduce 作业。 现在它已经成为 Apache 软件基金会下的一个开源项目。 Apache Pig 可以定义为一个以高效方式分析超大型数据集的。 Pig 的基础设施层生成用于执行实际处理的 MapReduce 作业序列。 Pig 的语言层称为 Pig Latin,它提供类似 SQL 的功能来对分布式数据集执行查询。

阿帕奇星火
Spark 最初是由加州大学伯克利分校的 AMPLab 开发的。 它于 2014 年 2 月成为 Apache 顶级项目。Apache Spark 可以定义为一个开源的、通用的、集群计算框架,可以使数据分析更快。 它建立在 Hadoop 分布式文件系统之上,但未与 MapReduce 框架链接。 与 MapReduce 相比,Spark 的性能要快得多。 它在 Scala、Python 和 Java 中提供高级 API。

阿帕奇卡桑德拉
Apache Cassandra 是另一个开源 NoSQL 数据库。 Cassandra 广泛用于管理跨越多个数据中心和云存储的大量结构化、半结构化和非结构化数据。 Cassandra 是基于“无主”架构设计的,这意味着它不支持主/从模型。 在此架构中,所有节点都是相同的,并且数据自动且平等地分布在所有节点上。 Cassandra 最重要的特性是持续可用性、线性可扩展性、内置/可定制复制、无单点故障和操作简单性。

Yet Another Resource Negotiator(YARN)
Yet Another Resource Negotiator (YARN) 也称为 MapReduce 2.0,但它实际上属于 Hadoop 2.0。 YARN 可以定义为作业调度和资源管理框架。 YARN 的基本思想是用两个负责资源管理和调度/监控的独立守护进程取代 JobTracker 的功能。 在这个新框架中,将有一个全局 ResourceManager (RM) 和一个称为 ApplicationMaster (AM) 的特定于应用程序的主控器。 全局 ResourceManager (RM) 和 NodeManager(每个节点从属)构成了实际的数据计算框架。 现有的 MapReduce v1 应用程序也可以在 YARN 上运行,但这些应用程序需要使用 Hadoop2.x jar 重新编译。

黑斑羚
Impala 可以定义为具有大规模并行处理 (MPP) 能力的 SQL 查询引擎。 它在 Apache Hadoop 框架上本地运行。 Impala 被设计为 Hadoop 生态系统的一部分。 它与其他 Hadoop 生态系统组件共享相同的灵活文件系统 (HDFS)、元数据、资源管理和安全框架。 最重要的一点是要注意,与 Hive 相比,Impala 在查询处理方面要快得多。 但我们还应该记住,Impala 用于对一小组数据进行查询/分析,主要设计为一种分析工具,用于处理经过处理的结构化数据。

Hadoop 是 IT 中的一个重要话题,但有些人对其长期可行性持怀疑态度。 阅读什么是 Hadoop? 愤世嫉俗者的理论。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/68114.html 聚才发 母婴好物

(0)
上一篇 2024年1月14日 上午12:04
下一篇 2024年1月14日 上午12:17

相关推荐

  • seo有哪些技术培训(seo怎样赚钱)

    怎么利用SEO技术来赚钱 展开全部 您好,很高兴为您回答: 利妈脸写受民用SEO技术赚钱的方式有如下几种: 第一 、用SEO打造高流量站点 如果自己有做到主流搜索引擎前几名的技术,就可以发挥你的S360问答EO水平制作站点,一段时间另子九后获取非常高的流量,然后加入信誉好、口碑好的广告联盟,要求广告代码放到网站上,赚取广告费。或者出租广告位。 第二、SEO培…

    2024年1月31日
    117
  • 南唐为什么认李恪为祖先?身世是什么样的?

    南唐,一个充满传奇色彩的王朝,其皇室成员与李恪的渊源更是令人津津乐道。那么,南唐为何认李恪为祖先呢?本文将带您揭开这段神秘的历史故事。 一、李恪的身世之谜 李恪,字靖叔,唐朝著名文学家、政治家,他的一生充满了传奇色彩。然而,关于他的身世却一直众说纷纭,甚至有人认为他是南唐皇室的后裔。这究竟是怎么回事呢? 据史书记载,李恪生于唐朝贞元年间,他的父亲是唐朝著名的…

    2024年2月15日
    35
  • 苹果需要对虚假的应用程序隐私承诺采取行动

    在 App Store 中销售应用程序时,Apple 需要更加积极地监管它。 与此同时,企业用户可以做些什么来保护自己和他们的用户? 有什么问题?一些开发者继续滥用苹果 App Store 隐私规则的精神。 这扩展到在应用程序隐私标签上发布误导性信息,以及公然违反不跟踪设备的承诺。 一些开发人员继续忽略不跟踪请求以泄露设备跟踪信息。 最近推出了自己的数字广告…

    2024年1月6日
    123
  • 寇准是一个什么人?他是好人还是坏人?

    在中国历史上,有许多杰出的政治家和文学家,他们的生平事迹和贡献影响了历史的进程。其中,北宋时期的政治家、文学家寇准,以其卓越的才华和深思熟虑的政策,赢得了人们的广泛赞誉。那么,寇准是一个什么样的人呢?本文将带您了解这位北宋名臣的生平和特点。 首先,寇准是一个多才多艺的人。他在政治、文学和艺术等多个领域都有着出色的表现。在政治方面,他曾担任过多个重要的职务,如…

    2024年2月28日
    33
  • 如何群发微信消息给所有人(群发所有好友祝福详细教程)

    vx聊天工具已被广泛使用,深受公众喜爱。vx可以通过视频聊天和语音通话连接,非常方便。特别是在节日期间,亲戚朋友需要发送节日祝福,但太多的人一个接一个地发送太慢和麻烦。此时,他们将使用vx的群发助手,但如何使用呢?分享如何在vx上大规模发送。 如何发送vx群发消息? 1.打开手📱机中的vx软件,点击“我”,点击“设置”。 2.然后点击“通用” 3.继续点击“…

    2023年12月15日
    239
  • 石达开去世后,他的儿子是什么结局?

    在中国近代史上,石达开是一位备受尊敬的将领。他在太平天国运动中担任重要职务,为推翻清朝腐朽统治做出了巨大贡献。然而,在1863年的大渡河之战中,石达开不幸牺牲,留下了年仅12岁的儿子石镇吉。那么,在石达开去世后,他的儿子石镇吉的结局如何呢?本文将根据真实资料,为您揭示石镇吉的命运。 首先,我们要了解石镇吉在父亲去世后的遭遇。据史料记载,石达开去世后,石镇吉被…

    2024年2月16日
    41
  • 有氧运动有哪些项目(每天进行多长时间容易减肥增强体质)

    肥胖一直困扰着很多人。众所周知,肥胖不仅会引起各种疾病,还会打击一个人的自信心。因此,如何减肥一直是人们关心的问题。 我们大致分为两种减肥方式,一种是节食,另一种是运动。 众所周知,过度的饮食会使身体的新陈代谢紊乱,运动不仅能锻炼身体,还能减肥,所以很多人都会通过运动来减肥。 要通过运动减肥,首先要知道哪些运动是减肥的最佳选择。 1、游泳 游泳是一种传统的有…

    2023年12月11日
    150
  • 关于车企的抖音营销,这里有6句大实话

    怎样利用抖音 随着移动互联网的发展,传播形式日益多元化,文字、图片、声音、视频等等都可以作为内容传播的载体,但短视频形式有着天然的优势,更加直观、能够准确地将信息传播出去,营销效果更好。 因此,现在越来越多格极律拿企业在抖音上进行营销推广,希望用更低的成本得到更好的营销效果。 1.账号定位 在开通抖音企业号来自的时候,品牌就应该有一个明确定位,包括头像、名称…

    2024年1月18日
    133
  • 李隆基和太平公主为何会反目成仇 李隆基为何一定要太平公主死

    最近很多人也都在说这个李隆基和太平公主的事情,那么很多人也都说了,这个太平公主和李隆基也非常的有意思,他们自己本来是姑侄关系,但是最后却反目成仇了,而且李隆基非要这个太平公主死了,所以很多人要问了,这到底是为什么呢?为什么会出现这样的情况呢?下面我们就一起来简单的分析揭秘看看了,感兴趣的一定别错过了。 提到太平公主和唐玄宗李隆基的恩怨,可能很多人会联想到电视…

    2024年2月22日
    30
  • 泰坦巨蟒真的存在吗图片(史前巨蟒详细解析)

    #头条创作挑战赛# 1997年美国上映一部丛林探险电影《狂蟒之灾》,影片描述偷猎者在亚马逊森林设计陷阱捕捉一条40英尺(12米)的巨大蟒蛇,但是偷猎者低估了巨蟒的威力,最后反被巨蟒一口吞下! 泰坦巨蟒模型 泰坦巨蟒脊椎骨骼对比 蛇类真的能长这么大吗?现在世界上最大的蛇类是森蚺或者网纹蟒,体长6-9米,体重600-700公斤,体长12米或者更大的蛇类真的存在吗…

    2023年12月13日
    243

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注