数据挖掘下最新的文章 - 极术社区 - 连接开发者与智能计算生态

数据挖掘

数据挖掘（英语：data mining）是一个跨学科的计算机科学分支。它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。

关注标签

关注数

0

内容数

341

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

程序员夏天 · 2019年12月21日

python爬虫入门，8分钟就够了，这是我见过最简单的基础教学

从技术层面来说就是通过程序模拟浏览器请求站点的行为，把站点返回的HTML代码/JSON数据/二进制数据（图片、视频）爬到本地，进而提取...

0 阅读 10.7k
大数据技术进阶 · 2019年10月19日

数据存储检索之B+树和LSM-Tree

作为一名应用系统开发人员，为什么要关注数据内部的存储和检索呢？首先，你不太可能从头开始实现一套自己的存储引擎，往往需要从众多现...

0 阅读 2.9k
大数据技术进阶 · 2019年10月16日

Kylin构建Cube过程详解

在使用Kylin的时候，最重要的一步就是创建cube的模型定义，即指定度量和维度以及一些附加信息，然后对cube进行build，当然我们也可以根...

0 阅读 2.5k
大数据技术进阶 · 2019年10月14日

Apache Kylin 概述

今天，随着移动互联网、物联网、AI等技术的快速兴起，数据成为了所有这些技术背后最重要，也是最有价值的“资产”。如何从数据中获得有价...

0 阅读 1.8k
SAMshare · 2019年10月13日

😆 机器学习采样方法大全

🚙 Index数据采样的原因常见的采样算法失衡样本的采样采样的Python实现📚 数据采样的原因其实我们在训练模型的过程，都会经常进行数据采样...

0 阅读 3.3k
SAMshare · 2019年10月12日

分享8点超级有用的Python编程建议

我们在用Python进行机器学习建模项目的时候，每个人都会有自己的一套项目文件管理的习惯，我自己也有一套方法，是自己曾经踩过的坑总结...

0 阅读 1.8k
大数据技术进阶 · 2019年10月12日

苏宁 OLAP 引擎发展之路

在 QCon 北京 2019 大会上，赵云讲师做了《苏宁 OLAP 引擎发展之路》主题演讲，主要内容如下。

0 阅读 1.9k
大数据技术进阶 · 2019年10月12日

知名大厂如何搭建大数据平台&架构

今天我们来看一下淘宝、美团和滴滴的大数据平台，一方面进一步学习大厂大数据平台的架构，另一方面也学习大厂的工程师如何画架构图。通...

0 阅读 2.7k
一休 · 2019年10月04日

华为云·垃圾分类亚军方案分享

结束比赛有几天了，这几天一直在处理前段时间堆积的工作，今天得空对自己的方案进行梳理总结。今年7月多结束魔镜杯后，将之前的内容整理...

0 阅读 2.7k
一休 · 2019年10月04日

第四届拍拍贷魔镜杯冠军方案分享

资金流动性管理迄今仍是金融领域的经典问题。在互联网金融信贷业务中，单个资产标的金额小且复杂多样，对于拥有大量出借资金的金融机构...

0 阅读 2.1k
先荐 · 2019年09月25日

机器学习过程中，我们该如何分析数据集？

在正式开始前，千万不要把这一步与数据可视化或数据结果统计混淆——数据可视化或数据结果统计意味着结果。

0 阅读 4k
先荐 · 2019年08月14日

推荐系统：协同过滤及其利弊

与基于内容的过滤（CBF）不同，协同过滤（Collaborative Filtering）技术独立于域，适用于无法利用元数据充分描述的项目，如电影、音乐等。

0 阅读 2.6k
zhisheng · 2019年08月13日

Flink 源码解析 —— Flink JobManager 有什么作用？

JobManager 的作用[链接]博客1、Flink 从0到1学习 —— Apache Flink 介绍2、Flink 从0到1学习 —— Mac 上搭建 Flink 1.6...

1 阅读 2.5k
zhisheng · 2019年08月11日

Flink 源码解析 —— 深度解析 Flink 是如何管理好内存的？

如今，许多用于分析大型数据集的开源系统都是用 Java 或者是基于 JVM 的编程语言实现的。最着名的例子是 Apache Hadoop，还有较新的框架...

0 阅读 2.9k
zhisheng · 2019年08月10日

Flink 源码解析 —— 源码编译运行

更新一篇知识星球里面的源码分析文章，去年写的，周末自己录了个视频，大家看下效果好吗？如果好的话，后面补录发在知识星球里面的其他...

1 阅读 2.8k
zhisheng · 2019年08月04日

Flink 从0到1学习—— 分享四本 Flink 国外的书和二十多篇 Paper 论文

之前也分享了不少自己的文章，但是对于 Flink 来说，还是有不少新入门的朋友，这里给大家分享点 Flink 相关的资料（国外数据 pdf 和流处...

1 阅读 4.9k
zhisheng · 2019年08月04日

Flink 从0到1学习 —— Flink 中如何管理配置？

如果你了解 Apache Flink 的话，那么你应该熟悉该如何像 Flink 发送数据或者如何从 Flink 获取数据。但是在某些情况下，我们需要将配置...

1 阅读 3.2k
超神经HyperAI · 2019年08月02日

浙大博士 130 页论文，教你用人工智能挑西瓜

要问什么水果和夏天最搭，答案一定是西瓜。作为西瓜生产与消费大国，中国在 2018 年以全世界 20% 的人口消耗掉全世界 70% 的西瓜，人均 ...

3 阅读 2.7k
读芯术 · 2019年07月30日

哪些最重要因素造就了伟大的数据科学家？

数据科学就业市场变化迅速。以前，只有少数卓越的科学家才有能力创建机器学习模型。但如今，仅有基本编码经验的人也可以按照步骤训练简...

2 阅读 1.7k
JackLi · 2019年07月23日

图解：机器学习、人工神经网络、深度学习、数学基础、深度学习之外的人工智能、深度学习框架下的神经网络

图解：机器学习、人工神经网络、深度学习、数学基础、深度学习之外的人工智能、深度学习框架下的神经网络

55 阅读 11.1k

上一页
1
…
11
12
13
下一页

本月贡献榜

超神经HyperAI

贡献 70 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息