全球首个“AI程序员”Deven能替代程序员吗?过了面试却不一定适合职场

制造Devin的公司,是一家叫Cognition的10人初创公司,才成立不到2个月。

一、引言

一家成立不到两个月但拥有十名天才工程师的初创公司Cognition,搞了一个引爆科技圈的大动作。

他们推出了一款名为Devin的人工智能(AI)助手,可以协助人类软件工程师完成诸多开发任务。Devin不同于现有其他AI助手(GitHub Copilot 等 AI 编程助手),它并非单纯辅助的角色,而是能够完全独立、端到端地完成整个开发项目,包括从编写代码、修复 Bug 到最终执行的完整编程生命周期。

这是第一个真正意义上完全自主的AI软件工程师,一亮相即掀起轩然大波,因为人们担心:人类程序员是不是真要失业了?

二、Deven能力及特点

测试表现超过同辈

在 SWE-bench 基准测试(评估大模型解决 GitHub 真实问题的能力)中发现,Devin 在人类未协助时达到了 13.86% 的正确率,超过了 Claude 2(4.80%)、Llama、GPT-4(1.74%,此前的测试结果是 0%)。更重要的是,Devin在测试中没有得到任何帮助,而其他所有模型都需要帮助,即人们要准确告知模型需要编辑哪些文件。

在这里插入图片描述

这一进展,标志着AI在自主理解和解决软件开发问题方面取得了显著进步。目前,Devin已经成功通过一家AI公司面试,并且在Upwork上完成了实际工作。资深程序员在试用过Devin之后认为,它已经不仅仅是一个编程助手,简直是一个可以独立工作的员工。它可以从零构建网站、自行部署应用、学习新技术等,人类只需扮演一个下指令和监督的角色。

运作几乎完全自主

Devin的厉害之处,还在于可以规划和执行异常复杂的工程任务,这类任务通常需要数千个决策才能完成。在这之中,无论进行到任何一步,它都可以回调所有相关的上下文信息,保证任务的逻辑性,也便于随时校正。

更让人震撼的是,Devin不仅能帮人们解决代码,还囊括了与之相关的整个工作流。

譬如,当工程师需要设计一个网页游戏时,Devin首先能生成网页,接着还能完成服务端的部署,最后直接发布上线,省去了中间大量人工操作。甚至在发现漏洞之后,Devin还会回溯报错出现的位置及对应的数据,然后分析原因并给出解决方案。

此外,作为一个AI全能助手,Devin还可以帮助人类训练和微调其他AI。对于一些常见的模型,你只需要提及模型的名称,Devin自己就知道要怎样去训练。

那人们需要做什么呢?按设想,最终的Devin会让人类只需要发号施令,其他什么也不用做。

它有哪些能力?

Devin 的主要特性有:

  • 能学习使用陌生的技术。仅仅是读完一篇博客,就可以用 ControlNet 生成带有隐藏信息的图片。

  • 端到端构建和部署应用。Devin 创建了一个模拟“生命游戏”的互动网站,它根据用户的需求逐步增加功能,然后将应用部署到 Netlify 上。

  • 自主查找并修复代码库中的错误。

  • 能训练并微调自己的 AI 模型,而这仅仅只需要一个 GitHub 研究库的链接。

  • 能处理开源仓库中的 Bug 和功能请求。

  • 能为开源项目做真正的贡献,修复 Bug、提交 PR。

Deven竟是由十人小公司开发?

Devin 背后的公司 Cognition AI ,该公司成立不到2个月,核心创始团队为3名华人由:Scott Wu(首席执行官)、Steven Hao(首席技术官)和 Walden Yan(首席产品官)组成,都是很早学编程的年轻新生代。Cognition的创始成员均曾在Scale AI 、Google 、DeepMind、Waymo等公司从事过AI前沿工作。

颇为吸睛的是,初创公司Cognition虽然只有十名员工,但他们手中却握着十块IOI(国际信息学奥林匹克竞赛)金牌。IOI 是国际信息学奥林匹克竞赛,基本是国内清北保送、天才少年的所在。

三、实际体验

Devin到底是一个漂亮的Demo,还是一个已经能替代程序员的智能体,使用体验怎么,拿到测试资格的网友第一时间分享了自己的体验。

在演示中,Devin几乎已经可以独立完成很多人类程序员需要大量时间才能完成的工作,效果一点不比普通程序员差。

但是,产品能力的边界在哪里,实际体验和演示时候有差距,还的看上手实测之后的效果。

一位斯坦福的小哥在Devin发布的第一时间就联系了团队,获得了第一手体验的资格。
在这里插入图片描述
他让Devin帮它做了几个难度不一的项目,录制了一个视频,在推上写下了自己的使用感受。

首先是让Devin做一个用API获取股票价格的软件,下一个任务是让Devin做一个可以让普通用户直接与大模型下棋的网站。

最终,小哥初步总结了用Devin开发的第一个网站的使用体验。

先说优点:

  • Devin产品化做得很好,他给人的使用体验是一个完整的产品而不是只是一个简单的对话框。

  • AI是系统最关键的部分,但支撑AI功能的产品化的结构是Devin的亮点。

  • Devin能够完成自动部署,API密钥保护,随时修改和添加需求等等非常好的各种功能。

  • 产品的完成度已经非常高了,远远超过了一般的演示Demo。

再说缺点:

  • Devin的反应还很慢,当然小哥也说,因为他用的是1M的Starlink来上网,所以反应慢很有可能是他自己的原因。

  • 其次就是还不能允许用户直接自己编辑代码,而且也没法协作完成。

  • 当然,最初那个下棋的应用,难住了Devin,最终没有完成部署。而那个数据可视化的任务,似乎也有些Bug。

网友看了这个实测之后还是感觉有点失望,毕竟这个任务一个初级程序员是能做到的,但是Devin的可视化项目的结果只做出了一个有Bug的网页。看样子Devin本质上还只是一个可以上网的大模型,现在要让他解决实际问题还有难度。
在这里插入图片描述

关于这里小哥具体的体验过程,参看:Devin第一手体验:开始编码就停不下来,但要替代程序员还很远

四、通过了面试,但不一定适合职场

首个AI程序员,已经实现了突破,目前的实际体验也许没有那么的优秀,但是再经过一段时间的发展,也许数十年后,上述问题都能得到解决,等到发展的相当成熟的时候,我们也不得不思考一个问题:它真的适合职场吗?

对于Deven是否适合职场,这是一个复杂且多角度的问题。从纯技术的角度来看,发展完善的Deven无疑展现出更强大的编程能力,能够快速、准确地完成编程任务。这使得它在某些特定的、高度技术化的职场环境中,可能表现出色。

然而,职场不仅仅是技术的竞技场,它更是一个涉及人际关系、团队协作、情感沟通等多方面因素的复杂系统。在这些方面,AI程序员如Deven目前还存在明显的局限性。它无法像人类一样进行深入的交流和沟通,无法理解和感受他人的情感和需求,因此在团队协作和人际关系处理上可能存在困难。

此外,职场中的很多决策并不仅仅基于技术因素,还涉及到战略、文化、价值观等多个方面的考量。这些都需要具备丰富经验和深厚洞察力的人类来做出判断。在这方面,AI程序员如Deven可能还无法完全替代人类。

因此,虽然Deven在技术上表现出色,但要说它完全适合职场可能还为时过早。毕竟,一个真正优秀的程序员不仅需要高超的技术能力,还需要具备良好的人际交往、团队协作和情感沟通能力。未来,随着AI技术的不断发展和完善,我们或许可以期待AI程序员在更多方面展现出其优势,但同时也需要认识到其局限性和挑战。在职场中,人类和AI的协作与互补可能将是一个更为现实和可行的方向。

五、结束语

此前面对 GPT 编程时,在《新程序员 007:大模型时代的开发者》中,我们提到,GPT 的编程能力我们需要有着很大的敬畏,但彼时,GPT 并不能独立解决完整的真实编程任务。

而现在,Cognition AI 这家此前从未听闻的公司,一群年轻人,创造了这样一款产品,让 AI 编程实现了一个巨大的飞跃。同济大学特聘教授朱少民表示,“看完 Devin 让我很是震撼,AI 编程比我们预想得要快,只会写代码的程序员下岗的可能性越来越大。”

自主编码智能体Devin已现AGI雏形!它能在几分钟内自主编写整个应用程序。这是真正无代码未来的开始。

因此,尽管Deven在技术上取得了令人瞩目的成就,但我们也不能盲目地认为它就是职场的完美选择。在未来的发展中,我们或许可以期待AI在编程领域取得更大的突破,但同时也需要关注它在职场中的适应性和局限性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2906198.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

HCIP的学习(6)

OSPF—开放式最短路径优先协议 动态路由的评判标准 1、占用资源 2、收敛速度 3、选路动态路由分类: IGP---内部网关协议DV型---距离矢量型---RIPLS型---链路状态型---OSPFEGP---外部网关协议OSPF---无类别的路由协议(携带真实掩码)组播224.0…

【微服务】Sentinel(流量控制)

文章目录 1.基本介绍1.Sentinel是什么2.Sentinel主要特性3.Sentinel核心功能1.流量控制2.熔断降级3.消息削峰填谷 4.Sentinel两个组成部分 2.Sentinel控制台显示1.需求分析2.下载3.运行1.进入cmd2.输入java -jar sentinel-dashboard-1.8.0.jar3.查看默认端口8080 4.访问1.账号和…

Java毕业设计-基于springboot开发的游戏分享网站平台-毕业论文+答辩PPT(附源代码+演示视频)

文章目录 前言一、毕设成果演示(源代码在文末)二、毕设摘要展示1、开发说明2、需求分析3、系统功能结构 三、系统实现展示1、系统功能模块2、后台登录2.1管理员功能模块2.2用户功能模块 四、毕设内容和源代码获取总结 Java毕业设计-基于springboot开发的…

element-ui switch 组件源码分享

今日简单分享 switch 组件源码,主要从以下四个方面来分享: 1、switch 组件的页面结构 2、switch 组件的属性 3、switch 组件的事件 4、switch 组件的方法 一、switch 组件的页面结构 二、switch 组件的属性 2.1 value / v-model 属性,绑…

L2-047 锦标赛

这题没做出来,查了一些博客,下面是我比较能接受的理解和书写方式。 读完题可以发现这是一个满二叉树,并且可以得到每场比赛失败者的信息(决赛是胜利者和失败者都可以得到) 对于一场比赛,它的胜利者要么是左…

报错:ImportError: cannot import name ‘imread‘ from ‘scipy.misc‘

报错内容: 问题代码通常是导入scipy库的版本出现了问题。 解决方法: 方法一: scipy版本还原到1.2.0 pip install scipy1.2.0 方法二: 使用from imageio import imread进行替换from scipy.misc import imread 使用imageio库同…

第二十四周代码(跟着罗勇军老师刷题)

2024/03/24 周一 合根植物 题目链接 【参考代码】 #include <iostream> using namespace std;const int N 1e61; int a[N];int find(int index) {if(a[index] index)return index;return a[index] find(a[index]); }int main() {// 请在此输入您的代码int m…

项目Weblogic切换Tomcat-包含数据源配置

目录 准备工作 修改Tomcat配置 Tomcat数据源加密 解密 加密 部署 问题解决 1.执行启停脚本时候&#xff0c;爆出&#xff1a;Cannot find ./catalina.sh The file is absent or does not have... 2.org.apache.catalina.core.StandardService.initInternal Failed to …

Tomcat项目创建 以及 在IDEA当中集成Tomcat

一: 有关Tomcat的WEB项目创建 TOMCAT项目的创建有两种方式, 第一种是利用骨架进行创建, 第二种是利用填补进行相应的创建, 不适用骨架进行创建 ,在这里主要聊第二种 (使用IDEA版本为2023) 1. 创建MAVEN项目, 非骨架形式 2.在相应的pom文件当中设置打包方式 为 war包的打包形…

推荐!00 后都在用的6个超实用微信小程序,又能少装N个app啦

在这个手机内存永远不够用的年代&#xff0c;每一次下载新app都像是在和手机进行一场心理博弈——不下载就out&#xff0c;下载了又怕手机喘不过气来。好在&#xff0c;微信小程序如同一股清流&#xff0c;轻巧地滑入我们的生活&#xff0c;解救了那些对“存储空间不足”弹窗深…

时序数据库IoTDB:功能详解与行业应用

一文读懂时序数据库 IoTDB。 01 为什么需要时序数据库 解释时序数据库前&#xff0c;先了解一下何谓时序数据。 时序数据&#xff0c;也称为时间序列数据&#xff0c;是指按时间顺序记录的同一统计指标的数据集合。这类数据的来源主要是能源、工程、交通等工业物联网强关联行业…

鸿蒙开发之ArkTs开发布局之线性布局(Row/Column)

组件按照布局的要求依次排列&#xff0c;构成应用的页面。在声明式UI中&#xff0c;所有的页面都是由自定义组件构成&#xff0c;开发者可以根据自己的需求&#xff0c;选择合适的布局进行页面开发。 布局指用特定的组件或者属性来管理用户页面所放置UI组件的大小和位置。在实际…

SI24R2E:智能电子学生卡2.4GHz考勤方案

今年年初教育部发布的《关于加强中小学生手机管理工作的通知》中提出&#xff0c;学生手机有限带入校园&#xff0c;原则上不得将个人手机带入校园&#xff0c;禁止带入课堂&#xff1b;应设立校内公共电话、建立班主任沟通热线、探索使用具备通话功能的电子学生证或提供其他家…

Autosar-Mcal配置详解(免费)-MCU

3.6.1创建、配置RAM 1)配置MCU通用配置项 MCU的通用配置项可参考以下配置&#xff1a; 各配置项的说明如下&#xff1a; Wake Up Factor Clear Isr: 是否在唤醒的中断服务函数中清除Wakeup Factor Wake Up Factors Clear Centralised: 是否在shutdown前集中集中清除Wakeu…

统信 UOS V20 一键安装 Oracle 12CR2(220118)单机版

Oracle 一键安装脚本&#xff0c;演示 统信 UOS V20 一键安装 Oracle 12CR2&#xff08;220118&#xff09;单机版过程&#xff08;全程无需人工干预&#xff09;&#xff1a;&#xff08;脚本包括 ORALCE PSU/OJVM 等补丁自动安装&#xff09; ⭐️ 脚本下载地址&#xff1a;…

C#开发者必备!快速掌握onnxruntime实现YOWOv2视频动作检测技术!

C#开发者必备&#xff01;快速掌握onnxruntime实现YOWOv2视频动作检测技术&#xff01; 目录 介绍 效果 模型信息 项目 代码 Form1.cs YOWOv2.cs 下载 介绍 YOWOv2: A Stronger yet Efficient Multi-level Detection Framework for Real-time Spatio-temporal Action…

代码随想录笔记|C++数据结构与算法学习笔记-栈和队列(〇)|stack、queue、单调队列和优先级队列(priority_queue)、大顶堆和小顶堆

文章目录 stack容器stack 基本概念常用接口构造函数赋值操作数据存取大小操作 queue容器queue常用接口构造函数&#xff1a;赋值操作数据存取大小操作 单调队列定义实现代码实现 基本应用一&#xff1a;滑动窗口思路与算法 优先级队列定义大顶堆&#xff08;最大堆&#xff09;…

webserver--基于小根堆实现定时器,关闭超时的非活跃连接

计算机在工作时&#xff0c;我们打开多个网页&#xff0c;但是不使用的时候&#xff0c;系统自动会进入休眠模式&#xff0c;这样会更加省电&#xff0c;节省资源。同样的&#xff0c; 服务器在工作时&#xff0c;建立好连接后&#xff0c;即使你不用&#xff0c;他也会一直为你…

第22篇:异步复位D触发器

Q&#xff1a;本篇我们在基本D触发器中添加一个复位控制信号来实现带异步复位功能的D触发器。 A&#xff1a;带复位控制信号&#xff08;RST&#xff09;的D触发器&#xff0c;当RST为0时&#xff0c;输出Q为0&#xff1b;当RST为1时&#xff0c;Q取决于D和CLK的输入。 带复位…

MYSQL数字函数实操宝典:场景化SQL语句一网打尽

​&#x1f308; 个人主页&#xff1a;danci_ &#x1f525; 系列专栏&#xff1a;《设计模式》《MYSQL应用》 &#x1f4aa;&#x1f3fb; 制定明确可量化的目标&#xff0c;坚持默默的做事。 MYSQL数字函数&#xff1a;不可不知的数据处理利器 文章目录 Part 1: 准备 &#x…