GitHub 的 Copilot AI 能否让开发人员重获乐趣?

GitHub 的 Copilot AI 能否让开发人员重获乐趣?

为了衡量 AI 辅助开发人员的生产力,GitHub 的研究人员最近进行了一项实验,比较使用其 Copilot 代码完成工具的小组与仅依靠人类能力的小组的编码速度。

GitHub Copilot 是一项 AI 结对编程服务,于今年早些时候公开推出,收费为每位用户每月 10 美元或每位用户每年 100 美元。 自推出以来,研究人员一直想知道这些人工智能工具是否真的能提高开发人员的工作效率。 问题是确定正确的指标来衡量绩效变化并不容易。

Copilot 用作代码编辑器的扩展,例如 Microsoft 的 VS Code。 它以多种编程语言生成代码建议,用户可以接受拒绝或编辑这些建议。 这些建议由 OpenAI 的 Codex 提供,该系统将自然语言翻译成代码,并基于 OpenAI 的 GPT-3 语言模型。

参见:什么是编码以及它的用途是什么? 新手指南

谷歌研究院和谷歌大脑团队在研究了 AI 代码建议对其 10,000 多名开发人员生产力的影响后,于 7 月得出结论,关于相对性能速度的争论仍然是一个“悬而未决的问题”。 尽管得出的结论是,传统的基于规则的语义引擎和大型语言模型(例如 Codex/Copilot)的组合“可以通过更好的代码完成来显着提高开发人员的生产力”。

但是你如何衡量生产力呢? 今年早些时候,其他研究人员使用了 24 名开发人员的小样本,发现 Copilot 不一定能提高任务完成时间或成功率。 然而,它发现 Copilot 确实为开发人员节省了在线搜索代码片段来解决特定问题的精力。 这是一个重要指标,表明当开发人员跳出编辑器来解决问题时,像 Copilot 这样的 AI 工具可以减少上下文切换的程度。

GitHub 还调查了 2,600 多名开发人员,提出了诸如“人们是否觉得 GitHub Copilot 使他们更有效率?”之类的问题。 它的研究人员还受益于对大规模遥测数据的独特访问,并于 6 月发表了这项研究。 除其他外,研究人员发现,60% 到 75% 的用户在使用 Copilot 时对工作更有成就感,在编码时感觉不那么沮丧,并且能够专注于更令人满意的工作。

“在我们的研究中,我们看到 GitHub Copilot 支持更快的完成时间,节省开发人员的精力,帮助他们专注于更令人满意的工作,并最终在他们所做的编码中找到更多乐趣,”GitHub 说。

GitHub 研究员 Eirini Kalliamvakou 博士解释了这种方法:“我们进行了多轮研究,包括定性(感知)和定量(观察到的)数据,以汇总全貌。我们想验证:(a) 用户的实际体验是否证实了 我们从遥测中推断出什么?(b)我们的定性反馈是否适用于我们庞大的用户群?”

Kalliamvakou 参与了最初的研究,现在已经在此基础上进行了一项涉及 95 名开发人员的实验,该实验的重点是使用 Copilot 和不使用 Copilot 时的编码速度问题。

这项研究发现,使用 Copilot 的小组(45 名开发人员)平均在 1 小时 11 分钟内完成了任务。 未使用 Copilot 的小组(50 名开发人员)平均在 2 小时 41 分钟内完成。 因此,拥有 Copilot 的小组比没有它的小组快 55%。

Kalliamvakou 还发现有 Copilot 的小组完成任务的比例更高——有 Copilot 的小组完成任务的比例为 78%,而没有 Copilot 的小组为 70%。

该研究在本质上是有限的,因为它只比较了开发人员在使用 JavaScript 编写 Web 服务器代码时的速度,而没有涉及其他语言(如 Python 或 Java)的其他任务。 此外,它没有评估代码的质量。

而且该实验没有考虑有助于生产力的因素,例如上下文切换。 然而,GitHub 的早期研究发现,73% 的开发人员报告说 Copilot 帮助他们保持在流程中。

在一封📮中,Kalliamvakou 向 ZDNET 解释了这个数字在上下文切换和开发人员生产力方面的意义。

“报告‘保持顺畅’肯定意味着更少的上下文切换,我们有额外的证据。77% 的受访者报告说,在使用 GitHub Copilot 时,他们搜索的时间更少,”她写道。

“该声明为开发人员衡量了已知的上下文切换,例如查找文档,或访问 Stack Overflow 等问答网站以查找答案或提出问题。有了 GitHub Copilot 将信息带入编辑器,开发人员无需切换出 像往常一样使用 IDE,”她解释道。

但是,仅使用上下文切换来衡量 AI 代码建议提高的生产力并不能显示全貌。 还有“好”和“坏”的上下文切换,这使得衡量上下文切换的影响变得困难。

Kalliamvakou 解释说,在一项典型的任务中,开发人员会在不同的活动、工具和信息源之间进行大量切换。

她指出 2014 年发表的一项研究发现,开发人员在切换前平均花费 1.6 分钟在一项活动上,或者平均每小时切换 47 次。

“这只是因为他们的工作性质和他们使用的多种工具,所以它被认为是‘好’的上下文切换。相比之下,由于延迟或中断,存在‘坏’的上下文切换,”她说。

“我们在早期的研究中发现,这会极大地损害生产力,以及开发人员自己的进步感。上下文切换很难衡量,因为我们没有很好的方法来自动区分“好”和“坏” “实例 – 或者当切换是完成任务的一部分而不是导致开发人员的流程和生产力中断时。但是,有一些方法可以通过我们在研究中使用的自我报告和观察来衡量上下文切换。”

至于 Copilot 使用其他语言的表现,Kalliamvakou 表示她有兴趣在未来进行实验。

“这当然是一个有趣的实验。这些受控实验非常耗时,因为我们试图让它们更大或更全面,但我想在未来探索对其他语言的测试,”她说。

Kalliamvakou 在一篇博文中发布了 GitHub 大规模调查的其他主要发现,详细说明了它寻找最合适的指标来衡量开发人员生产力的努力。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/66765.html 聚才发 母婴好物

(0)
上一篇 2023年12月31日 上午6:51
下一篇 2023年12月31日 上午7:02

相关推荐

  • 鄂尔泰的女儿是谁?婚姻生活是什么样的?

    鄂尔泰,清朝初年的一位显赫人物,他的名字在中国历史上留下了深深的烙印。然而,除了他的辉煌事迹外,他的五位女儿也同样在历史的长河中闪耀着独特的光芒。她们是鄂尔泰的骄傲,也是我们这个时代的璀璨明珠。 鄂尔泰的长女鄂尔佳氏,嫁给了康熙皇帝的第七子胤禛,也就是后来的雍正皇帝。她以其聪明才智和深思熟虑的政治智慧,赢得了雍正皇帝的深深敬爱。她在宫廷中的地位崇高,对清朝的…

    2024年2月13日
    33
  • 为什么你的服务和营销都做好了,产品依旧卖不好?

    卖 从某些角度可号量势此粒画以这样说。 人和人之间因为信任而产生链接。人品好,靠谱,才能获得别人的信任,别人也才愿意为你买单。 一个人品差的人,通过某些方式也能卖出产品,但大多待映是一锤子买卖,没有可持续性。 一个人品好的人,可能一开始不懂得如何卖产品,甚至嘴笨不会说话,也不会营销。但是基于信任,朋友们都愿意为他宣传,靠口碑一倍么银后传十,十传百,最后产品卖…

    2024年1月22日
    128
  • 2024全国早教机构排名前十(全国最有名的早教机构top10)

    早教,即早期教育,是指从儿童出生到接受小学教育前的教育活动,该活动根据孩子生理和心理发展的特点,进行有针对性的指导和培养,为孩子多元智能和健康人格的发展打下良好的基础。在中国早教群体主要是未上小学的婴幼儿,即0-6岁的人口。 我国历来都有重视教育的传统,“再苦不能苦教育、再穷不能穷孩子”的家庭观念深入人心,且目前4+2+1的家庭结构使得孩子逐渐成家庭的重心。…

    2023年8月8日
    225
  • 提高效率的最佳 Android 启动器

    智能手📱机的主屏幕是您移动技术体验的核心和灵魂——几乎是您在设备上执行的所有操作的启动台。 由于您使用 Android,与您的 iPhone 同事相比,您拥有独特的优势,因为您的主屏幕不必是其他人正在使用的陈旧网格。 如果您愿意,它当然可以,但您也可以选择完全控制该环境,并将其变成一个省时的指挥中心,以满足您的个人生产力需求。 我们也不只是在谈论在组合中加入…

    2024年1月6日
    151
  • 10部神级玄幻小说排行榜(神级玄幻全本小说推荐)

    玄幻小说近年来受到很多人的喜爱,不过小说看的多了,不知不觉就书荒了,书荒好难受啊有木有?下面给正在书荒的你推荐10部神级玄幻小说,每一本都非常的精彩,值得你熬夜都要看!   神级玄幻小说:斗罗大陆 作为唐家三少最具代表的一部作品,《斗罗大陆》实在是太火了。 内容简介:唐门外门弟子唐三,因偷学内门绝学为唐门所不容, 跳崖明志时却发现没有死,反而以另外一个身份来…

    2023年8月5日
    327
  • 2023年双十一天猫创意营销(天猫网络营销)

    2020 4900亿元。 2020年双十一销售额再创新高,其中天猫销售额突破4900亿元,京东销售额突破2700亿元。 根据星图数据公布的数据显示,2020年“双11”当天全网实现销售额为3328亿元, 11月1日-3日实现1921亿元,合计双十一期间实现销售额5249亿元,同比增长28%,其中“双11”期间(10月21日-10月31日,11月4日-11月1…

    2024年1月20日
    127
  • 分数的乘除法怎么算混合运算(六年级分数乘除法的计算方法讲解)

    学习分数乘分数,练习环节,学生画图表示3/4×1/2。 有学生画图: 从图中可以看出学生的思路:第一步涂色表示出这个长方形的3/4,这一步是正确的;第二步涂色表示3/4的1/2,这一步出现了错误,这两幅图在第二步涂色表示的都是这个长方形的1/2。 学习分数乘分数的计算方法,理解分数乘分数的算理,既是重点也是难点。教学中,虽然借助数形结合帮助学生理解算理,但仍…

    2023年8月11日
    209
  • 温庭筠是枪手?温庭筠做了什么?

    在中国古代文学的繁花似锦中,温庭筠以其独特的才情和风格,成为了一颗璀璨的明珠。然而,他的身份却并非单纯的文人墨客,更被后人戏称为“枪手”。那么,温庭筠为何会被冠以这样的称号?他又做了什么让人们如此称呼他呢? 温庭筠,唐朝著名诗人,他的诗才横溢,作品广泛流传。然而,他的一生并非一帆风顺。据史书记载,温庭筠曾多次参与科举考试,但都未能成功。这在当时的社会环境下,…

    2024年2月9日
    36
  • 如何使用新的 Bing(以及它与 ChatGPT 的不同之处)

    多年来,微软的 Bing 一直在努力争取在搜索引擎中站稳脚跟。 但该公司最近对 AI 的深入研究正在通过其 AI 驱动的 Bing Chat 功能为其注入新的活力。 通常称为 Bing ChatGPT,新的 Bing 实际上与其更受欢迎的竞争对手有很大不同。 它使用 GPT-4,并以会话格式作为 AI 驱动的搜索引擎执行更多操作。 另外:ChatGPT vs…

    2024年1月3日
    429
  • 奔驰c260l新车报价2024款落地价(奔驰c260l最新价格参数2024款图片)

    今天给大家说一下奔驰C级最新落地价参考和用车成本调查。 粉丝咨询配置2024款奔驰C260L运动版先说价格后说配置。 官方指导价35.12万元。目前优惠52000元,裸车价29.92万元。 需要缴纳购置税13164元,交强险950元,车船税360元,上牌费500元,商业险6150元。落地价不超过32.04万元,目前行情适中,可以考虑。 该车三年保值率为百分之…

    2023年8月10日
    196

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注