操作系统级ChatGPT,微软还没搞出来,被开源项目先实现了——
支持Windows、Mac、Linux三大系统,相当于直接和你的电脑对话。
指定文件夹下打开终端,一句话,所有Word文件秒变PDF。
与单个文件互动,直接拖拽进来就行。
与应用程序互动也不在话下,一句话读取系统日历、整理日程并发到指定邮箱。
甚至从头写一个本不存在的番茄钟应用,写好直接就能用上了。
这个神器,就是开源版代码解释器Open Interpreter,一经发布就冲上过GitHub热榜第一,到现在已累积1.8w星。
现在更是开启了桌面版的提前排队,这下不熟悉终端操作的朋友也能轻松在图形界面下使用了。
(作者透露已排队500+,感兴趣的抓紧了)
开源版GPT-4代码解释器
作者Killian Lucas,初衷是利用GPT-4 API做一个开源的极简版代码解释器。
通过本地运行,来绕过OpenAI官方版的诸多不便之处,例如:
- 3小时只能发25/50条消息
- 预安装的Python包有限,不能联网安装新的
- 上传文件不能超过100MB,运行时间限制120秒
- 会话环境无法长时间保留,文件将会被清除
以上这些限制在Open Interpreter这里通通不存在了,只需一个API Key就能把GPT-4的强大与本地开发环境的灵活结合在一起。
有GPU的更是可以在本地跑Code-Llama等开源大模型。
作者最近就演示了在断网情况下用Falcon-180B做数据可视化,还是可交互的。
现在Killian对Open Interpreter的愿景是“让人人都能编程”,而且是用自然语言代替写编程语言。
如果想尝试一下,如果有装Python只需“pip install open-interpreter”就可以开始了。
当然实际情况下,还是建议在虚拟环境中安装,避免复杂的包依赖问题。
首次运行,会提示输入OpenAI API Key,
或直接回车选择免费的Code-Llama,有7B、13B、34B三个版本可选(会自动到Hugging Face上下载)。
接下来就可以开始使用了,比如整理一下乱糟糟的桌面。
为了安全起见,执行代码之前要输入y同意,同意之前可以先看一眼。
如果AI干活你确实放心,也可以启动时添加 -y参数 ,后面所有代码默认直接执行。
不过涉及删除等操作时还是要小心,已经有人想删一个目录下的所有json文件,结果把电脑里所有json文件都删了。
--fast则是使用gpt-turbo-3.5的意思,不然默认会使用GPT-4。
GPT-4虽然强,但API价格还是很高的,有网友就分享了一不注意玩掉20多美元的经历。
相比之下gpt-turbo-3.5就便宜的多,刚刚反复测试了半天,也就花掉8美分。
哦对了,还记得刚才的虚拟环境是怎么设置的吗?
没记住也没关系,以后再也不用记了,只需要让Open Intepreter帮你设置就行了。
作者:目标新型操作系统
自7月中旬立项以来,Open Interpreter更新密集,也有更多玩法被开发出来。
比如在MacOS,可以用AppleScript来操作系统设置,一句话把系统改成深色模式。
甚至有网友开发出通过手机浏览器打开Colab的方式,让它变相运行在iPhone上。
搞出这么厉害的开源项目,作者Killian也不是名校博士也不是大厂工程师,本科毕业于西华盛顿大学教育学,学习科学教育。
他目前的状态是在这个项目上“自我雇佣”,同时还开着一家搞AI Agents的一人公司。
可以看出Killian野心不小,后来上线的网站都是学着OpenAI官网样式做的。
现在Open Interpreter还计划推出桌面端,填写邮箱就能加入排队。
有网友表示,这个项目让他想起科幻电影《她》中的AI伴侣Samantha。
从Killian的回复中,也能看到他更大的目标,把Open Interpreter开发成完整的操作系统。
希望有朝一日能让《她》的导演Spike Jonze来给我的操作系统拍广告片。
参考链接:
[1]https://x.com/hellokillian/status/1701405142007087401
完
作者:关注前沿科技
文章来源:量子位
推荐阅读
- 从roofline模型看CPU矩阵乘法优化
- ICCV 2023|小红书 4 篇入选论文亮点解读,「开集视频目标分割」获得 Oral
- LLaMa 量化部署
- DEYOv3来袭 | YOLOv8+DETR造就实时端到端目标检测,无需NMS(主打吸引不开源)
更多嵌入式AI干货请关注嵌入式AI专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。