大数据下最新的文章 - 极术社区 - 连接开发者与智能计算生态

大数据

大数据（Big Data）是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

关注标签

关注数

0

内容数

546

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

实时计算 · 2019年09月29日

Hbase入门(二)——安装与配置

本文讲述如何安装，部署，启停HBase集群，如何通过命令行对Hbase进行基本操作。并介绍Hbase的配置文件。在安装前需要将所有先决条件安装...

0 阅读 1.9k
kocdaniel · 2019年09月28日

浅谈HDFS（三）之DataNote

一个数据块在DataNode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及...

0 阅读 2.5k
超神经HyperAI · 2019年09月28日

马云不在云栖大会的第一年，想他

场景描述：2019 云栖大会于昨日落幕。在这三天里，阿里围绕「数·智」主题，进行了多场技术分享和交流。和以往不同，作为马云卸任后的首...

0 阅读 2.1k
kocdaniel · 2019年09月27日

浅谈HDFS（二）之NameNode与SecondaryNameNode

假设存储在NameNode节点的硬盘中，因为经常需要随机访问和响应客户请求，必然效率太低，所以是存储在内存中的

0 阅读 2.3k
sutao · 2019年09月27日

Hive之行转列与列转行

行转列原始数据：需求： {代码...} 实现： {代码...} 列转行原始数据：需求： {代码...} 实现： {代码...}

0 阅读 1.7k
CREATE_17 · 2019年09月26日

实操：No beans of 'FastDFS Client' type found 的解决方法

前言：今天接手了同事之前做的一个小项目，里面涉及到了 FastDFS 的使用。但是当我在本地运行项目的时候，却报了 Could not autowire No...

0 阅读 2k
lixiaobao · 2019年09月26日

linux 磁盘挂载

1、磁盘的格式化1.1、查看当前文件目录使用 df -h 命令来查看当前已经挂载的磁盘以及磁盘的信息： {代码...} 1.2、磁盘分区查找已经安装...

2 阅读 3.4k
先荐 · 2019年09月25日

机器学习过程中，我们该如何分析数据集？

在正式开始前，千万不要把这一步与数据可视化或数据结果统计混淆——数据可视化或数据结果统计意味着结果。

0 阅读 4k
kocdaniel · 2019年09月25日

Hadoop之完全分布式集群

集群环境：centOs6.8：hadoop102，hadoop103，hadoop104jdk版本：jdk1.8.0_144hadoop版本：Hadoop 2.7.2

0 阅读 2.7k
CREATE_17 · 2019年09月24日

Kylin配置Spark并构建Cube

HDP版本：2.6.4.0Kylin版本：2.5.1机器：三台 CentOS-7，8G 内存Kylin 的计算引擎除了 MapReduce ，还有速度更快的 Spark ，本文就以 Ky...

0 阅读 2.7k
实时计算 · 2019年09月24日

Hbase入门(一)——初识Hbase

本文将介绍大数据的知识和Hbase的基本概念，作为大数据体系中重要的一员，Hbase弥补了Hadoop只能离线批处理的不足，支持存储小文件，随...

0 阅读 2.1k
先荐 · 2019年09月23日

流式计算的三种框架：Storm、Spark和Flink

我们知道，大数据的计算模式主要分为批量计算(batch computing)、流式计算(stream computing)、交互计算(interactive computing)、图计...

0 阅读 4.7k
实时计算 · 2019年09月20日

Flink1.9整合Kafka

我们知道可以自己来开发Source 和 Sink ，但是一些比较基本的 Source 和 Sink 已经内置在 Flink 里。

0 阅读 2.1k
实时计算 · 2019年09月18日

Flink入门宝典（详细截图版）

本文基于java构建Flink1.9版本入门程序，需要Maven 3.0.4 和 Java 8 以上版本。需要安装Netcat进行简单调试。

0 阅读 2.3k
实时计算 · 2019年09月17日

Kafka常见错误整理（不断更新中）

原因分析：producer向不存在的topic发送消息，用户可以检查topic是否存在或者设置auto.create.topics.enable参数

0 阅读 3.2k
每天晒白牙 · 2019年09月16日

[译]Zookeeper的优点与局限性

在学习了Zookeeper（后文都简称zk）的介绍和功能后，您已经很好地理解了zk。现在，在这个zk教程中，我们将讨论zk的优点和局限性。 zk有...

0 阅读 1.8k
每天晒白牙 · 2019年09月15日

广告倒排索引架构与优化

在广告系统中倒排索引起着至关重要的作用，当请求过来时，需要根据定向信息从倒排索引中匹配合适的广告。我们的倒排索引采用的是Elastic...

0 阅读 1.9k
每天晒白牙 · 2019年09月15日

KafkaProducer源码分析

Broker：Kafka的服务端即Kafka实例，Kafka集群由一个或多个Broker组成，主要负责接收和处理客户端的请求

0 阅读 1.6k
每天晒白牙 · 2019年09月15日

Kafka服务端之网络连接源码分析

上次我们通过分析KafkaProducer的源码了解了生产端的主要流程，今天学习下服务端的网络层主要做了什么，先看下 KafkaServer的整体架构图

0 阅读 2k
实时计算 · 2019年09月12日

Storm VS Flink ——性能对比

Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm（以下简称“Storm”）在美团点评实时计算...

0 阅读 2.1k

上一页
1
…
19
20
21
22
23
下一页

本月贡献榜

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息