2025年4月19日,第75期DataFunSummit:大模型时代数据科学的变与不变将在DataFun线上社区举办,数据科学主题峰会已经连续举办5届,是国内少数关注数据科学主题和数据科学从业者的专业会议之一。本次会议继续由DataFun社区主办,计划邀请30+位重量级数据科学家同台分享交流,深入辩证的探讨大模型时代数据科学在技术与应...
2025年4月19日,第75期DataFunSummit:大模型时代数据科学的变与不变将在DataFun线上社区举办,数据科学主题峰会已经连续举办5届,是国内少数关注数据科学主题和数据科学从业者的专业会议之一。本次会议继续由DataFun社区主办,计划邀请30+位重量级数据科学家同台分享交流,深入辩证的探讨大模型时代数据科学在技术与应...
大模型落地到当前这个阶段,核心关注点还是领域大模型,而领域大模型落地的前提在于两点:需求端,对当前应用的降本增效以及新应用的探索;供给端,训练技术已经有较高的成熟度。
企业数字化的进程,由数据库的发展轨迹主导,而数据库本身的演进又受制于硬件的技术瓶颈。简单来说,数据库需要一个强大的计算机来支撑,但单块CPU显然没有这个能力,因此通过网络连接多块CPU、磁盘的分布式技术成为数据库发展的主要推动力,但相关硬件技术的发展速度有所差异,“在多年以前,数据库的硬件瓶颈主要在于磁...
在当前行业形势下,降本增效已经是公认的命题,粗放扩张的时代已经过去,接下来是在从业务到技术都需要精细化管理的时代。但在这个命题下,往往未被提及的一点是用户价值。如果为了降本增效,而牺牲了用户价值,激烈竞争下,企业是否还能留住用户?
由于大模型的成功经验,整个 AI 领域纷纷转向,要么是将模型架构换为 Transformer,要么是将小模型换为大模型,要么是将建模方式换为自监督、自回归范式等等。
导读:上一篇《》中我们阐述了四大体系之数据架构体系,解释了云原生大数据实践、国产数据库创新变革、湖仓一体落地实践、OLAP 发展趋势四个论坛的架构思路。
上一篇《这届技术人都爱挂在嘴边的“数智化”,我们用八个字拆解了》所说,我们经历了严格的议题筛选和内容打磨,对每个选题进行了市场调研、用户访谈等,同时还邀请业内专家作为顾问,以确保权威性。历经9版迭代,确定了4大体系,希望将体系化的知识,带到用户的面前。
7 月 21-22 日,第四届DataFunCon将在北京举行,活动主题为“新基建 · 新征程”,本次线下大会旨在分享数据智能领域最前沿的技术和实践经验。
开始筹备 DataFunCon 线下大会后,我们整理了很多数据智能相关的内容点,这些点子像星星一样散落在天空,对于数据从业者来说都值得听。
随着预训练大模型不断展现出一统AI的潜力,整个行业都在大胆假设其无所不能,将其扩展到图像、视频等新的数据模态,近期OpenAI发布的多模态大模型 GPT-4 就是代表。
导读:在数据分析的过程中,最耗时间的是数据采集、清理、转换等大量底层工作,而最有价值的是上层的分析和决策环节。
在人类历史上,可能没有哪个方向的技术能在如此短的时间内吸引如此多的人投入其中,也没有哪个技术在如此短的时间被应用在如此多的场景。
导读:本文将分享图算法在风控中的应用。今天的介绍会围绕下面四点展开:图算法和风控简介图算法在风控的演化相应平台的心得展望未来分享嘉宾|汪浩然 互联网行业资深风控和图计算专家编辑整理|戴杰 永辉超市出品社区|DataFun01/图算法和风控简介1. 什么是图算法——图论算法图算法最早来源于图论和组合优化相关算法,在...
《广告算法实践》电子书的内容比较综合,从这本资料中,可以对阿里在用户增长方面,微博在广告策略工程架构体系演进方面,凤凰新媒体在提升平台收益方面的实践,有清晰的了解。另外,哈啰出行的高级算法工程师,还从广告主视角,分享了信息流广告投放现状、广告主侧的算法优化方案。
导读:由于大数据时代的发展,知识呈指数级增长,而知识图谱技术又在近年来逐步火热,因此诞生了利用知识图谱技术进行智能创作的新想法。本文将分享基于知识图谱的多模内容创作技术及应用。主要包括以下四大部分:
联邦学习自2016年首次由谷歌(Google)提出、2018年由微众银行引入国内并率先在 B端进行创新应用以来,逐渐成为一种解决合作中数据隐私与数据共享矛盾的新路径,被大量应用于金融、安防、医疗、在线推荐系统等领域。近年来联邦学习技术得到了飞速的发展,其研究和应用的发展动向和趋势备受关注。
导读:今天为大家介绍京东零售大数据的云原生平台化实践,主要包括以下几大方面内容:云原生的定义和理解云原生相关技术的演化京东大数据在云原生平台化上的实践云原生应用平台的发展分享嘉宾:刘仲伟 京东 架构师编辑整理:张明宇 广州某银行出品社区:DataFun01/云原生的定义和理解1.云原生的定义云原生这个概念大家已...
导读:随着业务调整和集群资源整合需求,大数据系统中集群数据迁移复杂混乱。本文将以京东大数据平台为例,介绍京东近一年在数据分布式存储和分层存储上的探索和实践。
分享嘉宾:霍昱光 建信金科 资深算法研究员编辑整理:松烨 博瑜科技出品社区:DataFun导读:本次分享主要聚焦于行业应用方面,介绍建信金科在隐私保护计算领域所做的一些探索和尝试。--01/背景介绍随着数据规模持续上涨,根据中国大数据市场的预测,预计2025年的数据量会将从2018年的7.6ZB增至2025年的48.6ZB,超过美国...