AI教父辛顿出生天才家庭，却是辍学惯犯，年过七旬接连斩获图灵奖与诺奖

2012 年 12 月，AI 教父杰弗里·辛顿 (Geoffrey Hinton) 踏上了前往哈拉斯赌场之路，他此行的目的是卖掉刚刚成立的深度学习公司 DNNresearch，这家只有 3 名员工、没有产品、没有业务、成立仅几个月的「空壳公司」究竟能卖多少钱，辛顿也不知道，但他必须要筹集一大笔钱给他的儿子治病，这次拍卖会是他最好的机会了。

与此同时，百度、谷歌、微软、DeepMind 这 4 家科技公司也纷纷派其代表前往，醉翁之意不在酒，他们此行的目的可不单单是为了抢夺这家「新到不能再新」的公司，而是为了「打包收购」这家公司背后的 3 个员工——辛顿和他的两个学生 Ilya Sutskever、Alex Krizhevsky。

在这里插入图片描述

从左至右：Ilya Sutskever、Geoffrey Hinton、Alex Krizhevsky

就在拍卖会的前 2 个月，辛顿团队提出的深度卷积神经网络 AlexNet 在 ImageNet 图像识别挑战赛中一举夺冠， 与之前大家常用的浅层学习不同，AlexNet 构建了一种类似大脑的神经网络，可以通过分析海量数据学习诸如图像分类等新技能，辛顿将其称为「深度学习」。令人震惊的是，AlexNet 的出现直接让图像分类错误率降低 9.4%（2011 年的冠军相比 2010 年仅降低 1.4%），这项技术不仅会改变计算机视觉，聊天机器人、自动驾驶、智能推荐、实时翻译，甚至是药物设计、医疗诊断、材料开发、气象预测等领域，都将受其影响。

在这里插入图片描述

ImageNet 图像

敏锐意识到这个成果背后的巨大潜力，这 4 家公司汇聚于此。DeepMind 彼时刚刚成立 2 年，无法与科技巨头们竞争，很快就退出了竞拍。随着竞标价格的不断攀升，微软也退出了。当价格达到 4,400 万美元时，辛顿叫停了出价，他是一个学者，并不是企业家，目前的价格已经远远超出了他的预期，为自己的研究找到一个合适的归宿，才是他更应该考虑的问题。最终，他决定将公司卖给谷歌，与此同时，师徒三人也加入了谷歌。

「在此之前，深度学习还是在象牙塔里进行纯学术研究，并不被众多科技公司重视，这场秘密竞拍事件正式扣响了深度学习产业变革的发令枪」。地平线创始人兼 CEO、前百度深度学习实验室主任余凯，也就是当时代表百度参与竞拍的亲历者，这样评价道。

初探神经网络，挑战 AI 权威明斯基

现如今，大众普遍认为我们正在经历的人工智能热潮起始于深度学习技术的重大突破，而在这个过程中，辛顿无疑是最受大众认可的「AI 教父」。毕竟，很少有人能像他那样，以其个人研究为核心，直接引领一个时代的科技发展，辛顿做到了，尽管这个过程耗费了近 60 年时间，人生一甲子，他收获了创时代的成就。

辛顿于 1947 年 12 月出生于英国伦敦的一个「天才家庭」。 他的外曾祖父 George Boole 是数理逻辑学的先驱，布尔代数、布尔逻辑便是以他命名；他的曾祖父 Charles Hinton 除了是数学家外，还是一位著名的科幻小说作家；他的父亲 Howard Hinton 曾当选英国皇家学会院士、是一位著名的昆虫学家；他的表姐 Joan Hinton 是第一位获得中国绿卡的国际友人，也是制造美国第一枚原子弹的女核物理学家之一。

在这里插入图片描述

8 岁的辛顿

在这种家庭出生的辛顿，理所当然的聪明机智，但也许就是因为他的心里有太多自己的想法和主张，传统的教育体系让辛顿很难适应，他的求学生涯显得一波三折。

本科时期，辛顿进入剑桥大学国王学院攻读物理、化学，但一个月后就退学了。一年后，他在建筑系上了一天课，决定转读物理学和生理学，再次退学。随后，他改读哲学，又一次半途而废。最后，他选择研读心理学，1970 年，辛顿终于获得实验心理学学士学位。

这段教育经历对于如今的学术泰斗来说实在不算光彩，以至于辛顿也曾自嘲：「我可能有一种教育上的多动症，无法安安静静学习」。然而，对于 18 岁的年轻人来说，敢于试错也是一种勇气，在筛选过不适合自己的学科后，辛顿终于定下了自己的未来方向——让机器模拟人类大脑，此后几十年，就算是面对无数人的质疑，也再也没有变过。

辛顿对大脑的兴趣源于他的高中时期：「我的一位朋友曾告诉我，大脑就像全息图一样工作，并通过神经元网络储存记忆片段，这让我很兴奋」。然而，在当时那个年代，没有人对大脑了解多少，即使是剑桥大学的老师也不能给他答案。或许是对研究感到迷茫，大学毕业后，辛顿选择成为一名木匠。「我一直很喜欢木工活，我经常想，如果我成了一名建筑师，是不是会更快乐。在科学研究上，我总是不得不强迫自己，家庭的原因让我必须取得成功，这其中有快乐，但更多的是焦虑」。

在这里插入图片描述

辛顿（右侧）和朋友 Terry Sejnowski（左侧）讨论网络视觉模型

「但当我遇到一名真正出色的木匠，我很快就意识到自己不适合这个行业了。当时一家煤炭公司让这位木匠给阴暗潮湿的地下室做一扇门，考虑到环境特殊，他就将木料以反方向排列，以此抵消因潮湿膨胀而导致的木料变形，我此前从未想过这种方式，他还可以用手锯将一块木料切成正方形，跟他相比，我差得太远了！我或许还是更适合回学校研究人工智能」。多年后，当被问及为何重返学术圈，辛顿这样回答。

值得一提的是，在成为木匠的那段日子里，辛顿始终没有放弃探索大脑的想法，他每周都会去图书馆自学大脑的工作原理，最后确定神经网络才是自己应该追求的「道」。随后，辛顿在父亲任教的大学接受了一份短期的心理学工作，并以此为跳板，于 1972 年进入英国爱丁堡大学的人工智能项目，他的导师 Christopher Higgins 对大脑和人工智能这个新领域很兴趣，这与辛顿的想法不谋而合。

但就在他入学之前，Christopher Higgins 突然「叛变」了。使用人工神经网络让计算机去模拟人类的大脑储存和思考，这在当时被认为是不可思议的，辛顿的导师认为神经网络完全不堪大用，究其原因，是因为人工智能的奠基人之一明斯基 (Marvin Lee Minsky) 当时写了一本关于神经网络的书——《感知机》，并在其中给神经网络判了死刑。 他指出：单层神经网络表达能力有限，只能解决简单问题；多层神经网络或能解决复杂问题，但又无法训练，两者都是死路一条。

在这里插入图片描述

明斯基

Christopher Higgins 被说服了，但辛顿仍然坚持自己的观点：「其他人都错了，大脑就是一个巨大的神经网络，神经网络一定是可行的，因为它在我们的大脑中起作用。」单层神经网络的能力不足已经被明斯基用数学证明出来了，这改变不了，但多层神经网络无法训练的问题真的无法解决吗？辛顿决定从这里找出一条新路。遗憾的是，直到 1978 年从爱丁堡大学博士毕业，他依旧没有找到这个问题的解决办法。

「我和导师每周见一次面，有时会以一场大喊大叫的争论结束。他曾多次告诉我不要再浪费时间研究神经网路了，我会跟他说再给我 6 个月，我一定会证明神经网络是有效的，6 个月过后，我会再跟他说一模一样的话，直到我毕业。」多年后被采访时，辛顿笑谈。

深度学习的崛起

「毕业即失业」，这一点在辛顿身上得到了深刻体现。当时，人工智能正处于寒冬时期，英国相关人员对人工智能研究进展进行调查后发现，大多数人工智能都没有实现最初的承诺——即该领域的任何成果都没有产生所谓的重大影响。于是，政府开始减少投资，与此同时，神经网络只是人工智能中的一部分，理所当然的被边缘化。

于是，辛顿开始放眼国外，他惊讶地发现，美国的加利福尼亚南部，有一小群和他同样想法的人。「美国学术界可以允许不同观点的存在，在这里，如果你告诉其他人正在研究神经网络，他们会听。」

在这里插入图片描述

辛顿

1981 年，在一次学术会议中，卡内基-梅隆大学的一位教授 Scott Fahlman 与辛顿结识，并萌生了招募辛顿的想法，Fahlman 认为，神经网络是一个「疯狂的想法」，但人工智能领域正在进行的其他研究同样疯狂。无论如何，辛顿终于为自己的「非正统研究」找到了落脚点。

入职之后，辛顿有了更好、更快的计算机硬件，这让他的很多想法都能被实践。1986 年，他在 Nature 上发表了著名论文「通过反向传播误差学习表征」，终于解决了多层神经网络如何训练的问题。 反向传播被认为是深度学习的基础，这篇论文现在已经被引用超 5.5 万次，但当时并没有掀起什么水花。「我们完全猜错了需要的计算资源和样本数量。」辛顿在一次采访中表示。多层神经网络能够从大量训练样本中学习到规律，并对未知事情做出预测，但当时的计算机还不能处理如此庞大的数据，难以在具体应用中得到实践，同领域的其他学者没多久便将注意力转向神经网路之外的其他替代方案。
论文原文「Learning representations by back-propagating errors」：
https://www.nature.com/articles/323533a0

由于对美国当时政治环境的担忧，他的妻子 Ros 提议他们搬到加拿大，1987 年，辛顿离开卡内基-梅隆大学，加入了多伦多大学，不久之后，两人收养一儿一女。1994 年，Ros 因卵巢癌不幸去世，但他无暇过度悲伤，一边是科研重压，一边是 2 个不满 6 岁的孩子无人照看，雪上加霜的是，儿子患有注意力缺陷多动症 (ADHD)，辛顿本人还患有腰椎疾病。

「有很多次我都觉得我不会继续这项工作了。」

但辛顿最终还是坚持下来了，在加拿大政府的资助下，辛顿每年为那些仍然坚持神经网络的研究人员举办「神经计算和适应性感知」研讨会，希望可以大家可以在这里碰撞想法，值得一提的是，杨立昆和本吉奥也是其中的成员，他们 3 人被称为「深度学习三巨头」，共获 2018 年图灵奖。

在这里插入图片描述

本吉奥、辛顿、杨立昆

此后很长一段时间，辛顿专注于神经网络研究，连续发表论文百余篇，逐渐成长为人工智能领域的大拿，却始终没有办法广泛改变大众心里对神经网络的偏见，他明白，如果不解决多层神经网络训练难的问题，就无法扭转人们认为神经网络没有前途的看法。
辛顿的 Google Scholar：
https://scholar.google.com/citations?user=JicYPdAAAAAJ&hl=en

2006 年，辛顿发表论文「一种基于深度信念网络的快速学习方法」，由于当时很多杂志期刊拒稿题目中含有神经网络字眼的论文，于是辛顿用深度学习代替多层神经网络，文章才得以刊登。论文中提到的深度信念网络每一层都是用「受限玻尔兹曼机」堆叠而成，辛顿对其经过无监督学习的逐层预训练后发现，随着网络深度增加，模型性能随之提高。当应用效果与网络层数呈正相关时，多层神经网络的潜力终于被人认可。
论文原文「A Fast Learning Algorithm for Deep Belief Nets」：
https://direct.mit.edu/neco/article-abstract/18/7/1527/7065/A-Fast-Learning-Algorithm-for-Deep-Belief-Nets

经过 6 年的酝酿，2012 年，辛顿携手两名学生，开创性地设计了深度神经网络 AlexNet。 该网络在 ImageNet 图像识别竞赛中首次亮相便直接碾压所有对手，更让人震惊的是，在为期一周的训练中，团队只用了 4 颗英伟达 GPU。自此，深度学习的 3 个短板——算法、算力、数据终于被补全， 浅层学习算法也在这个竞赛中销声匿迹。值得一提的是，谷歌团队亦参与了这届竞赛，所以才会在前面提到的拍卖会中不计成本地招揽辛顿。

辛顿的父亲曾对他说，「只要你足够努力，也许你的年龄到我的两倍时，就能实现我的一半成就了。」所以现在，辛顿也常说，AlexNet 论文的引用次数远远超过父亲的任何一篇论文。毫无疑问，AlexNet 是计算机史上最有影响力的论文之一，它的出现不仅是深度学习的转折点，更是全球科技行业的转折点。这次事件之后，以谷歌、微软、苹果、英伟达为首的科技巨头加大对深度学习的战略投入，并将其用于智能推荐、图像识别、实时翻译，甚至是药物设计、医疗诊断、材料开发、气象预测、海洋环境建模等，AI 技术开始在各个行业中产生深远的影响。

从学术走向企业，关注深度学习在医疗领域的应用

值得一提的是，辛顿加入谷歌后，仍然保留多伦多大学的教授职位，他不想离开他的学生们。 「我非常幸运，有许多比我还聪明的学生，他们真正让事情运转起来了，后来也都取得了很大成就。」在今年的诺奖感言中，辛顿这样说。前 OpenAI 首席科学家 Ilya Sutskever、前苹果 AI 总监 Ruslan Salakhutdinov、Meta 首席科学家杨立昆、斯坦福教授吴恩达，都是辛顿的得意门生。他的学生 George Dahl 曾表示，每次看到一篇重要论文或者研究人员，都会发现与辛顿有直接或间接的联系，「我不知道是辛顿选择了那些成功的人，还是他让那些人成功，但当我经历过后，我认为是后者。」

事实证明，辛顿加入谷歌无疑是一次正确的选择，在担任谷歌副总裁及研究员期间，除了不用再为研究经费发愁之外，开放的平台终于给了他广阔的发挥空间。与此同时，在大厂的「人才抢夺」战中，谷歌再度出手，收购 DeepMind，并于 2014 年发布 AlphaGo，迅速确定其在 AI 领域的领导者地位。
*AlphaGo 将先进的树搜索与深度神经网络结合，首次在围棋游戏中击败人类职业棋手

在这里插入图片描述

中国的世界顶尖围棋手柯洁与 AlphaGo 对阵

此外，除了将前沿的技术应用于谷歌已有的产品（搜索引擎、图像识别、语言处理、个性化推荐等），深度学习也被应用于解决人们日常生活中最被困扰的问题，比如，在医疗健康领域，谷歌推出用于检测糖尿病、乳腺癌、肺病和心血管疾病的 AI 系统，这些技术的应用不仅有望提高疾病的早期诊断率，还能为患者提供更个性化的治疗方案。

毫无疑问，深度学习可以通过处理大量数据，加速基础科研的发展。但对于辛顿而言，AI 在医疗健康领域的应用尤其吸引他， 在他的个人成果中，大多数内容是推出新的算法或模型，利用 AI 预测疾病是他少数直接涉及的应用之一。这或许源于他的个人经历——首任妻子 Ros 因卵巢癌离世，而现任妻子 Jackie 也被诊断出患有胰腺癌。他认为：「提前诊断并不是一个微不足道的问题，我们可以做的更好，为什么不让机器来帮助我们？」

在这里插入图片描述

现如今，我们所称的人工智能大多是深度学习，普林斯顿计算心理学家 Jon Cohen 认为，所有深度学习的基础都是反向传播，这一点遭到了辛顿的质疑。2017 年 10 月，辛顿曾在多伦多的一场 AI 会议上公开表示，反向传播算法并不是大脑的运作方式，一举推翻自己过去几十年的研究，并随之提出全新的神经网络架构——胶囊网络 CapsNet。
论文原文「Dynamic Routing Between Capsules」：

https://arxiv.org/abs/1710.09829

与深度网络相比，胶囊网络的优势是，训练更快、更精准、所需数据量更少。尽管 Capsule 的理论研究仍处于早期阶段，还有许多问题需要解决，但辛顿仍然相信自己：「Capsule 理论一定是对的，不成功只是暂时的。」他的论文《胶囊之间的动态路由》已经被公开，这一次，胶囊网络是否还会经历几十年冷遇，这位 AI 教父能否再次改写深度学习历史，我们拭目以待。

AI 或将操控人类

自 ChatGPT 横空出世以后，全球范围内掀起了一股学习和研究 AI 的热潮。各大网站上 AI 相关的内容肉眼可见地增加，成百上千的初创企业也涌入市场，致力于开发基础模型、构建 AI 工具等。

以英伟达为例，作为 AI 芯片及基础设施的主要供应商，因为其研发的 GPU 在训练 AI 模型中至关重要，它的市值甚至一度超越苹果和微软，这正是 AI 技术快速发展的一个直观体现。

然而，当外界在持续「吹捧」AI 可赋能万物的时候，辛顿又成为了那个例外——「AI 将会威胁人类的安全。」

在这里插入图片描述

在二战期间领导了曼哈顿计划的「原子弹之父」J. Robert Oppenheimer 曾苦涩地表示：「我现在是死神，是这个世界的破坏者。」科学家们在追求真理的同时，也希望可以改善人类生活，但原子弹显然偏离了这一目标。当亲眼见证首次原子弹试爆那宛如世界末日般的场景时，他们心中更多的是对未来的恐惧和不安，而不仅仅是成功的喜悦。

类似的忧虑也出现在了辛顿的身上。2024 年，在诺贝尔奖颁布的现场连线时，他曾说：「我感到愧疚和后悔，我担心比我们更聪明的 AI 系统最终会掌控一切。」
在这里插入图片描述

辛顿获得诺贝尔物理学奖

通过学习各种书籍和政治阴谋，AI 可能会变得极其擅长说服人，如果没有充分的监管，它或许会通过「操控」人类做出难以预料的行为，这是辛顿最担心的问题。比如，当人类向 AI 下达遏制气候变化的指令时，AI 可能会为了实现这一目标，采取将人类清除的措施。辛顿认为：「许多人说只要切断电源就能阻止 AI 失控，但是超越人类智慧的 AI 可以通过语言操纵我们，试图说服我们不要关闭电源。」

为了更自由地讨论 AI 安全问题，2023 年 5 月，辛顿离开了谷歌。 「Jeff Dean 尝试挽留我，但我还是拒绝了他的提议。即使不会有明确的限制，但如果我还是谷歌的一员，发言时也不得不考虑公司的利益。」

作为最早意识到 AI 安全风险的人之一，辛顿曾苦恼于怎么让更多的人关注这件事。他的同事和学生建议他利用媒体平台，借助自己的影响力呼吁公众重视 AI 安全。因此，从谷歌离职后，这位低调的学者开始频繁接受媒体采访，并在社交平台上积极发声。 有趣的是，一些媒体为了吸引更多人的关注，故意夸大辛顿的言论，甚至试图诱导他说出谷歌的一些负面信息。对此，辛顿选择直接在社交媒体上公开回应，主打一个「叛逆」。

在这里插入图片描述

图源：辛顿社交平台

但好在，辛顿的一番努力没有白费。现如今，许多专家对辛顿的担心表示支持，一些科技公司也开始探索 AI 的透明度和可解释性，国际社会也在积极合作，希望为 AI 设定合理的规则。

除了关注 AI 的潜在风险外，辛顿还特别重视大模型训练的能耗问题。 众所周知，训练 AI 大模型通常会消耗大量电力，特别是在依赖化石燃料的地区，这种消耗会产生显著的碳排放，甚至危及人类社会。今年 6 月，辛顿宣布加入 CuspAI，这是一家成立于 2024 年 4 月的人工智能初创公司，专注于利用生成式 AI 开发新型材料以应对气候变化。辛顿表示：「CuspAI 致力于通过 AI 加快新材料设计，以遏制气候变化的使命让我印象深刻。」

在这里插入图片描述

图源：辛顿社交平台

从高中时期萌生探索大脑工作原理的想法，到实际研究时面临无数人的质疑，辛顿在学术界边缘位置徘徊 30 多年，却始终坚持自己的想法，最终凭借在神经网络方面的开创性成果荣获图灵奖、诺贝尔物理学奖等。然而，这位被称为深度学习之父、AI 教父的科学家，在职业生涯即将达到「顶峰」之际，突然开始质疑自己，公开表达对 AI 安全的担忧，倡导人类社会的可持续发展。

现如今，辛顿已经 77 岁了，仍然奔走在科学前沿，呼吁我们在推动 AI 发展的同时，关注技术创新、伦理道德与社会责任之间的平衡关系，他的经历不仅是科学史上的一段传奇，更激励着无数后来者不断前进。

初探神经网络，挑战 AI 权威明斯基

深度学习的崛起

从学术走向企业，关注深度学习在医疗领域的应用

AI 或将操控人类

推荐阅读

超神经HyperAI

目录