一场在学者、创业者、投资人之间展开的“关于未来的辩论”。
2024年5月15日,由中国科技产业智库「甲子光年」主办、中关村东升科学城协办的「AI创生时代——2024甲子引力X科技产业新风向」大会在北京举办。
在当天下午的“通往AI创生时代:硬币的两面”圆桌论坛中,北航机器人研究所名誉所长、中关村智友研究院院长王田苗,始智Al wisemodel创始人兼CEO、清华校友总会AI大数据专委会副秘书长刘道全,亦心科技董事长刘昌伟,心资本合伙人吴炳见,RPGGO联合创始人、产品负责人李嘉英与鲸海拾贝CEO、人工智能头部博主李艮基进行了一场“关于未来的辩论”。
在这一环节,每位嘉宾需要先对每个问题用“Yes”或“No”表达态度。主要内容围绕人工智能的多个方面进行,包括但不限于开源模型的发展、具身智能的未来、AI在艺术创作中的作用、AI合成数据的重要性等。
来自不同领域的嘉宾分享了他们对于AI发展的专业见解,在AI与社会、法律、伦理和哲学的交叉问题中,提供了全面而多元的视角。
王田苗分享了机器人技术中的专有性问题。他指出,“机器人的控制器即‘小脑’是无法直接共享给其他机器人的,这是因为尽管许多机器人技术是基于开源模型发展而来,但每个机器人都是基于独特的运行环境、硬件配置和训练数据进行开发和调整的,使其具有独特性。”这表明,尽管开源为技术创新提供了肥沃的土壤,但真正的应用落地往往需要专有的调整和优化。
刘道全深入讨论了AI创作和版权的问题。他认为,AI创作内容是历史数据训练与人的经验和创意相结合的产物。“AI产生的内容可能是因为有很多历史数据的训练,然后结合人的一些经验,形成了一些新的东西。”这引发了关于AI作品版权归属的讨论,刘道全倾向于认为,人类在AI创作过程中的贡献应当得到版权上的认可。
刘昌伟对AI的快速发展持乐观态度。他将当前AI的迭代速度与人类历史上的工业时代相比较,认为AI的发展速度是惊人的。“AI目前的迭代速度跟我们过去几千年或者工业时代的几百年来比,是非常惊人的。”他预见,站在人类智慧肩膀上的AI预示着创生时代可能在不久的将来到来。
吴炳见将AI行业的发展与半导体行业联系在一起,强调了技术进步对应用领域解锁的重要性。“AI这个行业会跟移动互联网特别不一样,它跟半导体行业特别像,随着算力的提升,逐渐解锁不同的应用。”他认为,随着技术的不断进步,AI将逐步展现出其在各个领域的潜力。
李嘉英表示,AI创生时代的到来与人们对AI作为有生命存在的认可密切相关。“当3-5年之后,大家越来越知道用户怎么是跟模型和这些智能体去交互的,大家认为它是一个有生命的东西,这个时代其实就已经到了。”她认为随着技术的发展和普及,人们对AI的认知和接受度将不断提高。
李艮基在讨论中提到了达芬奇的好奇心。他认为,在现今充满答案的世界中,人工智能的出现使我们有机会回归到问题的本质上,即从答案回归到提问。“我们世界充满了答案,我们接受的应试教育在教我们答案之书。但是人工智能的出现,都让我们重新回到了prompt,也就是一个好的问题,让我们真正关注人最主观、最本质的那个东西,就是从答案回归到问题。”
在科技发展的长河中,人类正站在一个特殊的历史交汇点,「甲子光年」期待与大家共同探索通往AI创生时代的无限可能。正如张一甲在报告解读中所说:“在AI创生时代,我们关注技术范式如何收敛,关注技术跃进如何重塑千行百业,更关注此刻的每一个决定对未来社会经济结构的深远影响。”
以下为本场圆桌论坛实录,经「甲子光年」整理,有删改。
李艮基:感谢大家!这是今天最后一场的圆桌论坛,我们希望带来些新意。我们会采用辩论的形式,每位嘉宾针对问题都有明确的“是”或“不是”的立场。首先,有请各位简单介绍一下自己。
王田苗:大家好,我是王田苗。我长期从事服务机器人和医疗机器人的研发,最近我也参与了智友科学家基金的孵化和投资工作,重点关注人工智能和机器人方面的相关创业项目。
刘道全:各位好,我是刘道全,自2015年以来,就开始负责清华校友AI大数据生态建设工作,一直追踪国内外AI大数据领域的新趋势。目前,我们正在建设一个名为wisemodel的中国AI开源社区平台,类似于Hugging Face。我们的目标是从中国出发,逐步扩展到全球。我们的平台最近推出了模型一键部署功能,已有30多个主要的大语言模型可供一键部署,无需编写任何代码。未来,我们还计划开放更多的API能力。
刘昌伟:大家下午好,我是刘昌伟。亦心科技专注于图像处理和AIGC图像生成类技术和产品研发,我们开发了国内首款专业图像处理软件“悟空图像”,也是国内首款AI实时渲染创新产品“AI闪绘”的开发者。我们还开发了一个功能最全面的AIGC图像生成服务平台,希望利用AI提高效率和降低成本,重塑设计流程,重新定义图像处理,让每个人都成为设计大师、艺术家,让专业选手作品可以封神。
吴炳见:大家好,我是吴炳见。心资本是一家早期风险投资机构,我们团队曾在A轮投资过小鹏汽车、满帮、百川智能等项目。对于当前的AI浪潮,我们非常积极地参与,除了投资百川智能这样的大模型企业,我们在AI应用、AI基础设施上也有部署。我们认为AI是一场十年以上的长跑,随着模型能力提升,会解锁不同的应用,当下我们正处在行业极早期。
李嘉英:下午好,我是李嘉英。RPGGO主要希望通过生成式AI,为下一代UGC(用户生成内容)从文生游戏方面带来突破。我们开发了一个端到端的平台,用户可以在此平台上创作并转换内容为互动型游戏。我们正在开发新版本,将融入多模态生成技术以提升用户体验。我们期待在快速发展的AI环境中,看到用户如何与我们的产品进行更深入的互动和融合,创造全新的互动体验。
李艮基:我是李艮基,一名AI领域的创业者,同时也是自媒体博主,在B站genji同名账号有250多万粉丝,在微信公众号也有数百万订阅者。我们科技部分专注于AI与元宇宙结合的独立场景,我认为AI是连接万物的优秀载体。
1.开源模型会越来越落后吗?
李艮基:你是否认同开源模型会越来越落后?
刘道全:当前,尽管商业模型在某些评测中表现较好,但实际上商业模型广泛地依赖于开源技术,并且基于这些技术构建。特别是在过去一两个月,开源模型发展迅速,开始赶上甚至超过商业模型。因此,随着时间的推移,开源模型很可能会超过商业模型。
吴炳见:我们在投项目时,我注意到,一些做深度AI应用的创业者最初尝试使用OpenAI的API和其他闭源模型,完全基于提示词工程构建产品,结果并不理想,主要是因为模型对齐的太厉害了,有时候讲话像机器人。他们转而采用开源模型,基于用户使用的数据做模型微调,才有了不错的效果。我预见未来开源模型的性能或许会达到闭源模型的80%,但市场份额将会更大。此外,我们要看是谁在做开源模型,每家模型产商手里都有多个版本的模型,新版本闭源,老版本开源,会是常态。另外的一些模型厂,认为自己的模型无法进入第一梯队了,索性自始至终开源,比如Llama,这使得开源成为一个源源不断的力量。
刘道全:炳见的观点很有启发性。在ToB领域,我认为至少60%的应用将基于开源模型或其衍生开发。开源和闭源模型都能满足大多数应用需求,但直接将任务交给模型处理往往无法解决问题,还需要融合更多业务流程和行业知识。
王田苗:开源模型提供了基础设施,特别是在数据和开发工具方面。然而大部分落地应用都在特定垂直领域,这些领域的商业模型往往采取非开源策略。例如在机器人领域,虽然控制器的训练数据是基于开源模型发展而成,但这些数据是专有的,并不会对外开放。
刘昌伟:AI从开源发展而来,依赖开源生态。因此它不可能落后于闭源模型。开源是AI发展的核心部分。
2.具身智能是AI的终极形态吗?
李艮基:王田苗教授提到,具身智能被视为AI的重要发展方向,他强调AI系统通过物理身体与环境交互实现感知、学习和决策。请问你们认为具身智能会是AI的最终形态吗?
王田苗:我认为通用人工智能的终极形态是多样化的,涵盖了精神层面的智能、深度的人机交互以及物理世界的操作能力。我们不能简单地认为只有具身智能,也就是那些能够与物理世界互动的智能才是AI的终极目标。情感交互同样关键,但并不一定要具身化。如果把通用AI看作连接数字世界和物理现实的桥梁,那么确实需要通过机器人这样的具身形式来实现,以便在物理世界中执行我们的想法和愿望。
吴炳见:在我看来,AI的终极形态应该反映人类的多种功能,比如语言、思维、行动。现在的大语言模型正在模拟我们的语言和思维功能;如果具身智能可以准确预测下一串动作序列,那就跑通,能够与真实世界互动了。未来,或许会有蛋白质大模型,预测蛋白质序列,从而加速药物研发。或许还会有帮助我们做出决策的慢思考模型。所以,具身智能只是AI可能的形态之一。
李嘉英:讨论具身智能时,我们应该基于它满足人类需求的特定形态。有些人可能会讨论是否应该采用类似人类的形态,因为这样的形态可能会带来更多的快乐和愉悦。然而,也有很多需求可以通过不具有具体物理形态的方式得到满足。因此,具身智能不一定是AI的最终目标,它的速度和其他表现形式也可以有效地服务于人类。
刘道全:具身智能是AI应用的一种形式,通常被视为端侧应用。在端侧,大型模型很难直接部署或应用,通常以语音加端的形式存在。尽管我们看到的是具身智能的形式,但实际上决策的核心可能在云端,而端侧只处理一些简单的感知或任务。
刘昌伟:科学精神告诉我们没有绝对。以视频为例,如果视频中间断了,diffusion模型会尝试根据前后内容来修复缺失的部分,而具身模型则会考虑如何逻辑上衔接前后内容。这种逻辑生成实际上需要依赖大型模型的规律来总结。因此,具身智能和其他模型类型是相互依存的,未来可能还会出现更好的模型。我们不能现在就断定具身智能就是未来终极形态或者唯一的模型形式。
3.人形机器人是具身智能的最佳选择吗?
李艮基:我们已经讨论了具身智能和人形机器人。从人类进化角度,我们为适应环境,从四肢行走演化为直立行走,优化了大脑发展,但牺牲了速度和稳定性。大家认为人形机器人是具身智能的最佳选择吗?
王田苗:我对具身智能的理解包括两个方面:首先,它是一个发展中的概念,基于大模型的数据驱动在线学习,从而增强机器人的交互和操作能力。其次,从应用角度看,人形机器人并非在所有场景下都是最佳选择。例如在汽车工业,我们更倾向于使用GDB和AGV,而不是人形机器人,后者更适合复杂、非标准化和小批量生产任务。
刘道全:机器人的需求非常多样。我们在科幻电影中看到的机器人并非都是人形的。人们对机器人的期望不同,有的希望机器人具备陪伴功能,有的希望其作为助手。宠物在一定程度上满足了人们的内心需求,提供了亲切感,因此,具身智能的形态可以是动物形状或其他任何形态,最终取决于个人偏好。
吴炳见:在讨论具身智能时,我们的目标是开发能完成99%任务的通用机器人。由于人类社会的设计围绕人形展开,从人形入手可能是开发通用机器人的最佳途径。但当机器人能完成几乎所有任务时,其是否需要保持人形就不那么重要了。比如,手机已经是我们身体的一部分了,但人类的身上并没有长出个手机支架,那么未来的机器人是不是应该有个手机支架呢?
李艮基:我同意各位的看法。人工智能的基础涉及脑神经科学,大脑思维是无序的电子流。DNA双螺旋结构的发现者是物理学家,他们在研究生命科学时,考虑到生命的宏观稳定性和微观随机性。这引发了对人工智能与真人之间区别的思考,以及人形机器人和未来机器人的最终形态。人类大脑结构经过长时间演化,可能有助于产生更多随机性,这可能是人形机器人与人类之间的连续性的一个方面。这个话题很深奥,值得我们未来进一步探讨。
4.你会接受大厂的收购吗?
李艮基:今年3月,硅谷AI独角兽公司Inflection AI的关键领导层被微软“收编”,同时该公司计划将其技术授权给微软。据媒体报道,微软将向Inflection AI支付了6.5亿美元。关于AI独角兽的未来,也引发了一些讨论。如果有互联网大厂要收购你们的公司,或者与你们相关的公司,你会接受吗?
刘道全:我们做的是开源社区平台,属于生态基础设施。我们不会接受带有特定标签属性的资本,因为我们需要保持中立和开放,这样才能团结更多的开源领域合作伙伴。在国内,如果被贴上某个标签,可能很多人就不愿意合作了。我们必须走中立、开放、独立的路线。如果我们发展壮大,可以接受一些产业资本,但我们不会被某个机构控股,我们需要始终保持中立开放的身份。
刘昌伟:我们对并购持开放态度。有句老话说得好,不管是黑猫还是白猫,能抓到老鼠就是好猫。如果并购能加速提高生产力工具的技术性能,我们非常支持,无论是并购还是其他合作方式。在这个快速发展、技术快速迭代的时代,开放合作是非常重要的。
李嘉英:我们是一家早期创业公司,我们希望更多人使用我们的产品,让更多创意变成满意的游戏作品。并购可以带来资源和战略上的合作和信任,对产品的发展是正向的。我们的目标是让生成式人工智能改变创作和游戏。
李艮基:我认为创业本质上有三种逻辑:入场券、现金奶牛和叙事型故事。最后一种更适合并购。前两种更倾向于与AI领域的人一起快速赚钱,可能不愿意被并购。我们团队做科技和教育相关内容,创业就像“走钢丝”,风险越高收益越大。但有些团队已经在AI领域取得了成果,可以助力我们,我们不需要再用“走钢丝”的风险模式,希望补充大厂在某些能力上的不足。
王田苗:收购和独立在商业上始终存在。这与创业者的心态有关,包括赚钱的目的和使命。有时在与大厂的并购过程中,可能会先接受大厂的资源,然后变成另一个大厂,然后逐渐去大厂化,是有这种情况的。
5.AI合成数据能拯救模型训练吗?
李艮基:大模型企业已经基本搜刮了所有能够找到的数据。研究机构Epoch发布报告称,在未来两年内,AI训练将用尽互联网上包含音视频在内的高质量数据格式,而现存(包括未来生成的)数据集或将在2030年至2060年之间耗尽。面对数据匮乏的窘境,你认为AI合成数据,会是模型训练的救命稻草吗?
王田苗:从具身智能的角度看,其包括底层和高层智能行为。底层行为,如骑自行车或洗碗,是基于条件反射的,这些技能不可能仅通过观看互联网视频学习获得。目前的训练方法不仅限于操作实物,还包括生成数据。看起来,使用生成数据进行训练的效果可能更优。例如,英伟达已经展示了利用生成数据训练机器人手指转动铅笔和模拟魔方操作的可能性。然而,为了确保训练效果最优化,实际应用中仍需要使用真实数据进行校正。
刘道全:我认为AI生成的数据只是多种数据来源之一。数据的生成本质上并无区别,无论是人类还是AI生成的。随着社会和技术的发展,数据将持续产生。所以,数据耗尽的观点有待商榷。未来,真实世界数据和AI生成的数据可能会共同用于训练,形成多种数据形式的结合。
李嘉英:很多产品的使用过程中可以产生数据。例如,生成虚拟环境内容本质上是人类操作的结果。如果我们能通过快速生成的AI方法复制人的行为去使用产品,那么通过产品使用生成的数据也是有价值且准确的。这种数据通常用于端到端的生成,如直接从文本或其他模态生成内容。因此,如果这些数据属于合成数据,我认为它是一种有效的用于AI训练的数据获取方法。
6.是否愿意实现数字永生?
李艮基:我们现在来讨论一个更普遍的问题,即大家是否能接受数字永生的概念,也就是将来把自己的记忆和意识上传到数字世界中永久保存。请问各位老师,你们是否愿意自己实现数字永生?
王田苗:在回答是否选择数字永生之前,我认为这个决定权应该交给个人。尤其是那些有思想的人,他们也许更倾向于将自己的见解如同分享小说、电影或观点一样,广泛传播于世间。如果这些思想对人类文明有价值,那么将它们上传并永久保存,供他人参考,无疑是一件积极的事情。
而关于“永生”的定义,我们或许也需要重新审视。一个人的思想、书籍或音乐作品,若能在各种媒体和公众之间流传,便已经实现了某种意义上的永生。如果一个人的永生需要付费来维持,那么它实际上已经失去了意义,当付费停止时,那么这个人的永生就已经被时代遗忘了。所以我认为,永生可能涉及到一定的经济成本,类似于我们储存基因的需求。如果你想让自己的永生被他人知道,那可能需要通过永久付费才能实现,这谁都无法确保。
刘道全:关于永生的概念,我认为对大多数人来说,所谓的永生并没有那么大的价值。思想的传递和传播可以有很多种形式。数字永生可能是一种形式,但纵观历史,许多有价值的思想一直持续到今天,并不是因为某个人永生,而是因为这些思想本身具有价值。这些有价值的思想能否持续传播下去才是重要的,而不是这个人是否永生。因此,从个人角度来说,数字永生的重要性其实并不大。
李艮基:我个人的观点是同意数字永生。我觉得这是一个见仁见智的问题,因为数字永生本质上是一种高级版的传记,它记录了你的故事、知识、见识和经验。所以我认为这是一个非常开放的问题。
7.AI能否提供情感上的安慰和帮助?
李艮基:现在我们讨论一个有趣的话题,不考虑个人的婚姻状况,当AI发展到一定程度时,我们是否会向AI寻求情感上的帮助和安慰?你们觉得AI能否提供情感上的安慰和帮助?
王田苗:我认为,生活中的很多事情在反复向AI求助几次后往往会变得乏味和枯燥,难以再带来新的安慰。而真正让人感到情感上的满足,我认为约有三分之一来源于自然环境,如漫步于林间、攀登巍峨的山脉,因为这些体验越接触越有趣。像ChatGPT这样的工具,虽然能高效提供一些信息,但它往往只揭示了答案的一半,剩下的一半还需要我们自己去探索。这恰恰说明,如果某些AI工具不能激发我们的兴趣或好奇心,如果它的功能不能提高到有效程度,那么即便其具备一定的功能,也很快就容易被忘记。
刘昌伟:我认为人类是有好奇心的动物,想知道是否有其他存在能够完全理解我们。人还追求精神世界,一方面通过个人实现来满足精神需求,另一方面在现代社会,许多人在寻找知己,一个真正理解、认可自己并进行精神交流的人。在好奇心的驱使下,我个人会选择同意AI可以提供情感帮助。
刘道全:这个问题与个人的成长阶段有关。如果在10年前问我,我可能会选择同意,但现在我选择反对,因为人的成长有关。年轻时,可能会寻求外界的支持,但当自我提升到一定程度,有了独立的人格和思想后,就不再需要外界的支持,更愿意按照自己的方式去创造和实践。
王田苗:我补充一下,创造性的工作往往来自于冥想和独处,而不是靠外界的刺激和交流。人和人之间的交流也分层次。
刘道全:这实际上与个人有关,比如E人(外向型人格)可能需要在交流中创造火花,而有些人可能更倾向于独立思考。所以这因人而异。
李艮基:是的,人类作为万物之灵长,有一些特殊性。在整个人类演化过程中,大脑中有一些区域专门对人有天然的强印象。关于AI是否能提供情感上的安慰,我认为人类具有不可替代性。我们的大脑有许多基于演化的能力,使我们对人际关系和情感寄托有强烈的依赖。
8.AI创生时代是否会在3年内到来?
李艮基:今天上午,甲子光年创始人、CEO张一甲在报告中提到:“AI创生时代”是一个新的历史阶段,生产力变革与生产关系变迁同时发生,AI技术从数字世界渗透到物理世界,逐渐逼近并超越人类的生产活动行为边界。从AI for science到生产制造,从人形机器人到世界模型,AI将逐渐突破以人类为主语的创造范畴,形成人类智慧之外的“第二智慧体系”。这意味着AI将不再仅仅是人类的工具或助手,而是成为与人类并驾齐驱的重要力量。我们今天大会的主题也是“AI创生时代”,那么,让我们讨论一个关键问题:“AI创生时代”是否会在3年内到来?我个人认为会。让我们从王教授开始谈谈看法。
王田苗:我认为“AI创生时代”可能在3到5年内到来。目前,我接触的人形机器人和ChatGPT等还远未达到我们期望的效果,成本和功能还有一定差距。所以从现实角度来看,我觉得还有些距离。
刘道全:我认为AI作为新的生产力工具,已经开始改变社会,创造价值,这毫无疑问。未来几年,AI和大模型将继续作为主力推动社会发展。但如果说“AI创生时代”是新的生命形态,我持保留意见。
刘昌伟:我认为AI的迭代速度非常快,它建立在人类数千年积累的智慧之上。我们不能以传统互联网或工业时代的视角来看待AI的发展。在算力、算法和数据条件具备的情况下,我认为“AI创生时代”的到来可能性很高。
吴炳见:这里有个关键信号,OpenAI等第一梯队的模型厂商何时发布第一个真正的Agent,这个Agent有理解任务、规划、和行动的能力,这说明模型的推理能力突破一个临界值了。这将是“AI创生时代”的重要一步。AI行业的发展与半导体行业类似,随着模型能力的提升,将逐步解锁不同的应用,是个长跑,不是百米冲刺。
李嘉英:作为应用产品的开发者,我们在使用模型时有时会感到惊讶。当人们开始认为模型或agent是有生命的,这种认知将带来“AI创生时代”。我认为这不仅仅是技术节点的问题,而是人们的认可。未来3到5年,随着技术发展和普及,人们与模型和智能体的互动将增加,“AI创生时代”到来的概率将提升。
李艮基:最后,我想总结一下。我非常喜欢达芬奇的传记,他临终前的最后一句话是关于啄木鸟舌头的形状,这体现了他对世界的好奇心。好奇心是人类独有的能力,是与计算机和AI的根本区别。AI的出现让我们重新关注好问题,从答案回归到问题。让我们拥抱好奇心,探索未知。这是我们今天圆桌会议的最后一个问题和答案,感谢大家的分享。