徐九 头像

徐九

935 声望
饮水机の守护神,朝阳区金城武,我爸我妈的儿子,深夜撰稿者,统领一猫一... 展开

SegmentFault 思否社区首席编辑

饮水机の守护神,朝阳区金城武,我爸我妈的儿子,深夜撰稿者,统领一猫一狗的国王,公司脸面担当(曾徒脸接柜子并坚持数十秒)。

收起
关注了
0
粉丝数
4
最新动态
  • 发布了文章 ·
    Pandas的apply, map, transform介绍和性能测试

    apply函数是我们经常用到的一个Pandas操作。虽然这在较小的数据集上不是问题,但在处理大量数据时,由此引起的性能问题会变得更加明显。虽然apply的灵活性使其成为一个简单的选择,但本文介绍了其他Pandas函数作为潜在的替代方案。

  • 发布了文章 ·
    MixMIM 创建混合图像,提出新型掩码方案

    商汤和港中文联合提出一种简单但有效的掩码图像建模(MIM)方法 MixMIM,通过创建混合图像利用BEiT和MAE的优点,又避免了它们的局限性。MixMIM 可以有效地学习高质量的视觉表示,也能被广泛应用于预训练的层次化视觉 Transformer,比如 Swin Transformer、PVT 等。MixMIM 还探索了轻量级架构,将 Swin Transformer 修改...

  • 发布了文章 ·
    深度学习中高斯噪声:为什么以及如何使用

    在数学上,高斯噪声是一种通过向输入数据添加均值为零和标准差(σ)的正态分布随机值而产生的噪声。 正态分布,也称为高斯分布,是一种连续概率分布,由其概率密度函数 (PDF) 定义:

    摘要图
  • 发布了文章 ·
    论文推荐:谷歌Masked Generative Transformers

    基于文本提示的生成图像模型近年来取得了惊人的进展,这得益于新型的深度学习架构、先进的训练范式(如掩码建模)、大量图像-文本配对训练数据的日益可用,以及新的扩散和基于掩码的模型的发展。

    摘要图
  • 发布了文章 ·
    28个数据可视化图表的总结和介绍

    数据可视化本身就是一种通用语言。我们这里通用语言的意思是:它能够向各行各业的人表示信息。它打破了语言和技术理解的障碍。数据是一些数字和文字的组合,但是可视化可以展示数据包含的信息。

    摘要图
  • 发布了文章 ·
    PyTorch 2.0 推理速度测试:与 TensorRT 、ONNX Runtime 进行对比

    PyTorch 2.0 于 2022 年 12 月上旬在 NeurIPS 2022 上发布,它新增的 torch.compile 组件引起了广泛关注,因为该组件声称比 PyTorch 的先前版本带来更大的计算速度提升。

    摘要图
  • 发布了文章 ·
    Milvus 2.1.x 到 Milvus 2.2.x 升级实践

    近日,Milvus 2.2.0 发布,新版本里支持了许多激动人心的功能,包括:磁盘索引(DiskANN)、从文件中批量导入数据(bulk_insert)、基于角色的访问控制(RBAC)、集合生存时间(TTL)等。不少社区的小伙伴对新版本都已经跃跃欲试。不过与以往版本直接升级镜像的简单操作相比,由于 2.2 和 2.1 的元数据发生了变化,以及...

    摘要图
  • 发布了文章 ·
    PyTorch的Dataset 和TorchData API的比较

    深度神经网络需要很长时间来训练。训练速度受模型的复杂性、批大小、GPU、训练数据集的大小等因素的影响。

  • 发布了文章 ·
    变分自编码器VAE的数学原理

    变分自编码器(VAE)是一种应用广泛的无监督学习方法,它的应用包括图像生成、表示学习和降维等。虽然在网络架构上经常与Auto-Encoder联系在一起,但VAE的理论基础和数学公式是截然不同的。本文将讨论是什么让VAE如此不同,并解释VAE如何连接“变分”方法和“自编码器”。

    摘要图
  • 发布了文章 ·
    汽车之家基于 Milvus 的向量检索平台实践

    随着计算机技术及机器学习技术的发展,特征向量作为一种多媒体数据(文本、语音、图片、视频)的描述方式,逐渐成熟起来,而向量检索(向量相似计算)也逐渐成为一种通用的需求。

    摘要图
  • 发布了文章 ·
    基于Vision Transformers的文档理解简介

    文档理解是从pdf、图像和Word文档中提取关键信息的技术。这篇文章的目标是提供一个文档理解模型的概述。

  • 发布了文章 ·
    手把手搭建视频去重系统

    如今,短视频平台对各类搬运视频的检测力度和精确度越来越高了。无论是影视号的剪辑,还是从油管搬运,即使做了各类复杂的视频变换,都很容易被检测出来。作者都会收到提醒,严重的甚至被封号。 乔布斯演讲原始视频 搬运的视频,加了字幕遮盖

    摘要图
  • 发布了文章 ·
    基于SARIMA、XGBoost和CNN-LSTM的时间序列预测对比

    本文将讨论通过使用假设测试、特征工程、时间序列建模方法等从数据集中获得有形价值的技术。我还将解决不同时间序列模型的数据泄漏和数据准备等问题,并且对常见的三种时间序列预测进行对比测试。

    摘要图
  • 发布了文章 ·
    为机器学习模型设置最佳阈值:0.5是二元分类的最佳阈值吗

    对于二元分类,分类器输出一个实值分数,然后通过对该值进行阈值的区分产生二元的相应。例如,逻辑回归输出一个概率(一个介于0.0和1.0之间的值);得分等于或高于0.5的观察结果产生正输出(许多其他模型默认使用0.5阈值)。

  • 发布了文章 ·
    我们又重写了一个关键服务

    QueryCoord 是 Milvus 中查询集群的中心调度节点,在用户将一个 Collection Load 到内存中时,QueryCoord 负责将该 Collection 的 Segment 调度到 QueryNode 集群中,以支持后续的查询。

    摘要图
  • 发布了文章 ·
    自回归滞后模型进行多变量时间序列预测

    一种常见的方法是将该变量其视为单变量时间序列。这样就有很多方法可以用来模拟这些系列。比如 ARIMA、指数平滑或 Facebook 的 Prophet,还有自回归的机器学习方法也可以使用。

    摘要图
  • 发布了文章 ·
    使用马尔可夫链构建文本生成器

    本文中将介绍一个流行的机器学习项目——文本生成器,你将了解如何构建文本生成器,并了解如何实现马尔可夫链以实现更快的预测模型。

    摘要图
  • 发布了文章 ·
    经典CNN设计演变的关键总结:从VGGNet到EfficientNet

    一般来说,分类问题是计算机视觉模型的基础,它可以延申解决更复杂的视觉问题,例如:目标检测的任务包括检测边界框并对其中的对象进行分类。而分割的任务则是对图像中的每个像素进行分类。

    摘要图
  • 发布了文章 ·
    时间序列分析中的自相关

    在时间序列分析中,我们经常通过对过去的理解来预测未来。为了使这个过程成功,我们必须彻底了解我们的时间序列,找到这个时间序列中包含的信息。

    摘要图
  • 发布了文章 ·
    Notebook在复现数据科学研究成果中的丝滑使用

    对于数据科学和AI科研人员而言,研究成果的复现至关重要。成果复现既是一种研究算法的方式,也有助于科研人员找到研究的新途径。

    摘要图
认证与成就
获得 187 次点赞
2019年07月23日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息