极术社区
注册
首页
Top 专栏
开发平台
阿里云倚天
AVH on 百度云
龙蜥操作系统
Arm STEM 教育
星辰教学平台
读书
专题
问答
公开课
活动
注册 · 登录
▲
思否AI
SegmentFault 思否旗下人工智能领域产业媒体,专注技术与产业,一起探索人工智能。
关注专栏
管理
关注数
4180
内容数
843
最新文章
V
· 4月25日
开源向量数据库比较:Chroma, Milvus, Faiss,Weaviate
0
阅读 2.1k
V
· 4月24日
使用ORPO微调Llama 3
2
阅读 1.9k
V
· 4月23日
Barnes-Hut t-SNE:大规模数据的高效降维算法
0
阅读 1.5k
V
· 4月22日
5种搭建LLM服务的方法和代码示例
1
阅读 1.4k
V
· 4月19日
提高 RAG 应用准确度,时下流行的 Reranker 了解一下?
3
阅读 1.8k
V
· 4月18日
Moirai:Salesforce的时间序列预测基础模型
1
阅读 1.9k
V
· 4月17日
PyTorch小技巧:使用Hook可视化网络层激活(各层输出)
1
阅读 1.7k
V
· 4月16日
ORPO偏好优化:性能和DPO一样好并且更简单的对齐方法
0
阅读 1.6k
V
· 4月15日
时空图神经网络ST-GNN的概念以及Pytorch实现
1
阅读 1.4k
V
· 4月12日
PiSSA :将模型原始权重进行奇异值分解的一种新的微调方法
9
阅读 2.2k
V
· 4月11日
10个大型语言模型(LLM)常见面试问题和答案解析
4
阅读 2.2k
V
· 4月10日
推测解码:在不降低准确性的情况下将LLM推理速度提高2 - 3倍
3
阅读 2.2k
V
· 4月9日
高维解码|Redis 收紧许可证!开源软件公司如何在云时代生存?
0
阅读 1.9k
V
· 4月8日
为什么大型语言模型都在使用 SwiGLU 作为激活函数?
1
阅读 2.2k
V
· 4月7日
归一化技术比较研究:Batch Norm, Layer Norm, Group Norm
2
阅读 1.6k
V
· 4月3日
大模型中常用的注意力机制GQA详解以及Pytorch代码实现
8
阅读 2.6k
V
· 4月2日
SiMBA:基于Mamba的跨图像和多元时间序列的预测模型
5
阅读 2.2k
V
· 4月1日
大语言模型中常用的旋转位置编码RoPE详解:为什么它比绝对或相对位置编码更好?
4
阅读 2.2k
V
· 3月29日
如何开始定制你自己的大型语言模型
5
阅读 2.3k
V
· 3月28日
Chronos: 将时间序列作为一种语言进行学习
1
阅读 2.3k
V
· 3月27日
BurstAttention:可对非常长的序列进行高效的分布式注意力计算
0
阅读 1.5k
V
· 3月26日
8个常见的数据可视化错误以及如何避免它们
0
阅读 1.6k
V
· 3月25日
使用GaLore在本地GPU进行高效的LLM调优
1
阅读 1.2k
V
· 3月22日
文生图的基石CLIP模型的发展综述
1
阅读 1.1k
V
· 3月21日
Moment:又一个开源的时间序列基础模型
0
阅读 809
V
· 3月20日
多项式朴素贝叶斯分类器
2
阅读 673
V
· 3月19日
在16G的GPU上微调Mixtral-8x7B
1
阅读 752
V
· 3月18日
时间序列预测的零样本学习是未来还是炒作:TimeGPT和TiDE的综合比较
0
阅读 564
V
· 3月15日
LoRA及其变体概述:LoRA, DoRA, AdaLoRA, Delta-LoRA
7
阅读 991
V
· 3月14日
MADQN:多代理合作强化学习
3
阅读 970
上一页
1
…
3
4
5
6
7
…
下一页
专栏作者
SegmentFault思否
3020 声望 · 4226 粉丝
徐九
1320 声望 · 5 粉丝
高阳Sunny
6 声望 · 15 粉丝
Nadia
2 声望 · 3 粉丝
V
4245 声望 · 3 粉丝
关注极术微信号
实时接收点赞提醒和评论通知
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
关注安谋科技招聘
实时获取安谋科技中国职位信息
用户指南
·
用户协议
·
隐私政策
关于我们
·
联系合作
粤ICP备18004469号
粤公网安备 44030502008014号
版权所有 © 2024 极术社区
由
SegmentFault
提供技术支持
友情链接
安谋科技
安创空间
开源中国
InfoQ
边缘计算社区
21IC 电子网
HarmonyOS 技术社区
电子芯吧客
CSDN
全志在线
芒果派
深度强化学习实验室
LiveVideoStack
智东西