CSDN技术社区 · 2023年03月13日 · 北京市

李沐被曝离职亚马逊,投身大模型创业!网友:“AI 已成创业致富新思路?”

横空出世的 ChatGPT 在火爆出圈之后,硅谷巨头、各大互联网大厂可谓是上演了一场群雄逐“ChatGPT”……在 AIGC 新风口之下,人才无疑成为这场“硬仗”的主力军。

近日,据公众号“亲爱的数据”,2023 年 2 月,亚马逊机器学习部门原杰出科学家、“参数服务器之父”的 Alex Smola 离职,随后公布了新的创业项目 —— Boson.ai,担任首席执行官兼联合创始人。

随后,又有消息爆出,亚马逊首席科学家李沐已从亚马逊离职,投身大模型方向创业。

李沐与 Alex Smola 师徒的联手会做出哪些新的动作,想必很让人期待。

1.png
(图源:领英截图)

据悉,两人合伙成立的新公司 Boson.ai ,目前公开资料不多,网站显示还在建设中,但其目标已经明确:在搞通用大模型。

微信图片_20230313114119.png

(图源:boson.ai 网站截图)

但在 Boson.ai 的 GitHub 的项目主页中,已经能看见李沐的身影。

目前,李沐并没有官宣加入的消息,网友们只能凭借新公司的 GitHub 项目中找到一些信息。

微信图片_20230313114158.png
(图源:GitHub 截图)

深度学习“大神”开挂般的过去

提到李沐,大家一定会先联想到的是:MXNet 深度学习框架的主要贡献者之一、深度学习“大神”。

初入亚马逊时,人工智能部门才刚刚成立,对深度学习框架需求很强烈。那时,李沐就已经明白需要通过框架来更好地服务用户的道理。2016 年 11 月,MXNet 被亚马逊选为官方开源平台。它的速度、接口灵活性、节省内存,和分布式效率等特点成为可圈可点的优势,获得大家的一众好评,而 MXNet 的“获胜”也成为李沐职业生涯中精彩的一笔。

其实回头来看,不止于 MXNet 的成绩,李沐的每一份经历都是耀眼的存在:

  • 2007 年,还在上学的李沐就已经开始在微软亚洲研究院实习;
  • 2008 年,李沐从上海交通大学计算机系(计算机系 ACM 班)毕业;
  • 2009 年 - 2010 年,李沐担任香港科技大学研究助理;
  • 2011 年 4 月 - 2012 年 8 月,李沐又在百度担任高级研究员,创建了一套分布式机器学习广告系统;
  • 2011 年,收到美国卡内基梅隆大学(CMU)的 offer;
  • 2012 年 - 2017 年,赴美深造,攻读博士学位。

其实,在李沐担任百度高级研究员时,就已经拥有外人看来“光鲜亮丽”的工作。但他仍表示:“在百度的经历让我学到了很多,也更清楚地发现了自己的短板。但是当时国内做系统方向的人比较少,所以我还是选择了去美国继续攻读博士。”

他也曾收到来自谷歌的橄榄枝,但由于考虑 MXNet 的后续发展,依旧坚定的选择了亚马逊。

与“参数服务器之父”Alex Smola 结缘

或许人生从来没有白走的路,每一步,都算了数。

在百度工作期间,李沐通过利用广告数据训练能够预测用户点击广告率的模型,从中积累了不少工业界经验,为他之后开发机器学习系统的长久事业奠定了好的基础。

而在 CMU 的经历,让李沐结识了两位导师:机器学习大师 Alex Smola 和 分布式系统教授 Dave Andersen,在他们的辅助之下得到更好的成长,就此开启了一段对他今后人生都影响颇深的博士生涯。

导师之一的 Alex Smola ,除了曾是美国卡内基梅隆大学(CMU)的教授,李沐的博士导师,他还是国际机器学习的知名科学家,机器学习畅销著作《动手学深度学习》的主要作者。

并且,Alex Smola 在分布式深度学习框架领域具有极高地位,曾提出并行 LDA(Latent Dirichlet Allocation)的框架,这也是参数服务器概念的最早来源。

他的过往经历,同样能用“开挂”来形容:

  • 1996 年,在慕尼黑工业大学获得硕士学位;
  • 1998 年,获得柏林工业大学的计算机科学博士学位;
  • 2004 年,在NICTA的统计机器学习项目中担任高级首席研究员和项目负责人;
  • 2008 年,入职雅虎研究院;
  • 2012 年春 - 2014年底,在谷歌研究院工作;
  • 2013年起,他开始担任 CMU 的教授;
  • 2015年,创立了马里亚纳群岛实验室。
  • 2016 年 7 月,Alex Smola 重返工业界,选择加入亚马逊云科技,致力于构建 AI 和机器学习工具。随后,李沐带着 MXNet 以兼实习的身份加入亚马逊。
  • 2017 年,李沐博士毕业后正式加入亚马逊,和团队继续做 MXNet 的开发和深度学习的应用,并直接向 Alex Smola 汇报工作。

师徒再联手,投身大模型

AI 大模型赛道已吸引无数厂商和技术人蜂拥而至,很多人会提出质疑:是否超大模型领域是昙花一现的存在,随着时间的流逝又会回到最初的位置?

阿里巴巴副总裁贾扬清在《新程序员》杂志的采访中曾表示:“追求大模型,并不是一件坏事,因为模型越大,对底层支撑的模型算法也会提出更高的要求,同样有助于推动系统上很多创新的诞生。”

如今,这两位大神的“舍亚马逊,入大模型”,不少前排吃瓜网友纷纷表示:“人家又开辟了新的道路啊!”还有网友调侃道:“看来 AI 真是创业致富新思路了。”

未来,Boson.ai 会给我们什么新惊喜,值得我们拭目以待。对此,你怎么看?可以在评论区留言和讨论。

参考资料:

https://www.163.com/dy/articl...
https://github.com/boson-ai/h...
https://zhuanlan.zhihu.com/p/...
https://www.leiphone.com/cate...
https://alex.smola.org/
https://mp.weixin.qq.com/s/e4...

推荐阅读
关注数
1858
内容数
103
本栏目由中国开发者社区 CSDN 发起,报道人工智能领域的热点资讯,帮助开发者全方位了解前沿 AI 技术,勾勒 AI 产业全景图。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息