layout: post
title: "我提交的 PR 为何还没能合入?" subtitle: "为开源项目提交 PR 的正确姿势" description: "对于开发者来说,提交 PR(Pull Reques)是参与开源项目的主要方式。不管是修复一个故障,添加一个新功能,还是改进文档,我们都需要通过提交 PR 的方式将其合入到项目的主分支中。那么,我们提交的 PR 如何才能尽快地被项目接受呢?" author: "赵化冰" date: 2024-03-25 image: "https://images.pexels.com/photos/3861972/pexels-photo-3861972.jpeg?auto=compress&cs=tinysrgb&w=1260&h=750&dpr=2" published: true tags: categories:
- Tech
- Open Source
我提交的 PR 为何还没能合入?如何才能更快地合入我的 PR ? 相信这是很多参与开源项目的开发者常常遇到的疑问。
对于开发者来说,提交 PR(Pull Reques)是参与开源项目的主要方式。不管是修复一个故障,添加一个新功能,还是改进文档,我们都需要通过提交 PR 的方式将其合入到项目的主分支中。那么,我们提交的 PR 如何才能尽快地被项目接受呢?
要让 PR 顺利地通过评审,我们需要学会正确地提交 PR 。一个好的 PR 可以帮助项目维护者在 Review 时快速理解该 PR 的意图,以及时对 PR 进行反馈,PR 中的修改也能尽快合入到项目的主分支中。
然而,对于不熟悉开源项目贡献流程的开发者来说,要提交一个好的 PR 并不是一件容易的事情。在这篇文章中,我将分享一些我在参与开源项目的过程中总结的经验,希望能够帮助到大家。
对于一个刚开始参与某个开源项目的开发者来说,如果在前期没有进行任何交流的情况下直接提交 PR,该 RP 一般会很难通过。一方面这是因为你在提交 PR 时并不了解项目的代码规范,以及相关代码项目模块的一些设计原则等,导致 PR 可能不符合项目的要求。另一方面,在缺少前期交流的情况下,项目的维护者对你 PR 提交的背景并不了解,导致难以对 PR 进行评审。在大部分情况下,项目维护者也许并不会直接拒绝你的 PR,但该 PR 可能会被挂起,长期缺少关注和反馈。
加入开源项目贡献之前,开发者应该先学习了解该项目的相关知识,包括项目的设计理念,功能特性,代码风格,编译流程等。这些信息一般可以在项目官方网站的文档和代码仓库的 README 文件中找到。了解项目的相关知识可以帮助我们更好地理解项目的代码,从而在提交 PR 时更容易符合项目的要求。
在正式提交 PR 前,建议先通过提交 Issue 的方式先对 PR 的背景进行说明。Issue 一般分为两种,一种是 bug(故障),即项目现有代码中发现的错误,另一种是 feature (功能特性),即我们希望项目增加的新功能。对于 bug,我们需要说明 bug 的现象,复现步骤,以及期望的正确行为。对于 feature,我们需要说明 feature 的目的,设计思路,以及可能的实现方式。通过提交 Issue 的方式,可以让项目维护者提前了解你的 PR 提交的背景。我们可以在 Issue 中对各种方案进行讨论,得到项目维护者的反馈,在社区中就方案达成初步一致后再提交 PR。这样经过充分讨论后提交的 PR 会更容易被项目维护者接受。
在提交 PR 时,我们需要为 PR 添加一个清晰的描述。PR 的描述非常重要,这是项目维护者在处理 PR 时最先查看的内容。一个好的描述可以让评审者快速了解该 PR 的背景,帮助其理解 PR 中改动的代码,从而让提交者尽快从评审者处得到进反馈,加快 PR 合入项目代码的时间。而一个不好的描述可能会增加评审者理解 PR 的时间,甚至会使得 PR 较长时间无法得到关注。
对于一个开源项目来说,可能有多达几十个,甚至上百个 PR 在等待评审,而评审者的时间是有限的,在这种情况下,描述清晰的 PR 常常会优先得到处理。以我为例,我一般只能在工作日中抽出约一小时的时间来评审 Envoy Gateway 项目中的 PR。因为了 PR 评审,我需要处理工作邮件,客户问题,编写公司产品以及 Envoy Gateway 代码等其他事情。在这有限的这一小时内,我希望能够最大化产出,评审尽量多的 PR。因此我会优先处理描述清晰,容易理解的 PR,对于那些需要花费较长时间来进行理解的 PR,我一般会放到时间比较空闲的时候再来处理。
那什么是好的 PR 描述,什么是不好的呢?一个好的 PR 描述中会说明这个 PR 提交的目的,以及为了这个目的做了那些代码修改,并且会提供该 PR 相关的 Issue 的链接。如果该 PR 涉及到多个模块的修改,最好在 PR 描述中简明扼要地说明这些模块的修改。
先举一个不好的示范:
This PR fixes a bug in the HTTP Listeners.
可以看到,该描述过于简单,几乎没有为评审者提供任何可用的信息。这导致评审者需要从代码差异中去猜测这个 PR 的目的,增加了评审的难度。
在一个好的描述中,我们应该说明该 PR 处理的是什么 bug,以及如何修复的。
对于上面的示例,我们可以改为:
This PR fixes the bug xxx(issue 链接) in the HTTP Listeners.<br> The bug is caused by missing HTTP filters in the filter chain of the HCM (HttpConnectionManager) in the translated xDS when the MergeGateway option is enabled. <br> To fix it, the missing filters have been patched to the existing HCM when translating ir.HTTPRoute to the xDS.
修改之后的描述中,我们明确说明了该 PR 处理的是什么 bug,以及 bug 的原因和修复方法。这样的描述可以让评审者快速了解该 PR 的目的,更容易将代码改动和 PR 的目的联系起来,从而加快 PR 的评审过程。
为了帮助开发者对 PR 进行描述,开源项目一般都会提供一个 PR 描述模版,模版会列出需要填写的内容。我们在提交 PR 时应尽量使用项目提供的 PR 模版。
例如 Envoy Gateway 的 PR 模版如下:
**What type of PR is this?**
<!--
Your PR title should be descriptive, and generally start with type that contains a subsystem name with `()` if necessary
and summary followed by a colon. format `chore/docs/feat/fix/refactor/style/test: summary`.
Examples:
* "docs: fix grammar error"
* "feat(translator): add new feature"
* "fix: fix xx bug"
* "chore: change ci & build tools etc"
-->
**What this PR does / why we need it**:
**Which issue(s) this PR fixes**:
<!--
*Automatically closes linked issue when PR is merged.
Usage: `Fixes #<issue number>`, or `Fixes (paste link of issue)`.
-->
Fixes #
`
可以看到 Envoy Gateway 的 PR 描述模版中已经包含了一个 PR 描述中需要的所有内容,包括 PR 的类型,PR 的修改内容/目的,以及该 PR 关联的 Issue。只要我们在提交 PR 时按照该模版的要求进行填写,就可以为 PR 提供一个清晰的描述。
PR 的理想长度是多少?这个并没有一个固定的答案,但是总的来说,一个 PR 中包含的内容越多,最终合入主分支的时间也需要得越长。
我曾经看到过包含了一百多个文件的 PR。我们应该尽量避免提交此类 “巨型” PR。 首先,一个“巨型” PR 的阅读难度很大,因为评审者需要在大量的代码差异中进行跳转,猜测 PR 作者修改每段代码的意图,评估修改是否合理。其次,一个改动范围很大的 PR 中引入的问题也会增多,评审者在 Review 时可能提出的修改意见也会相应地增加。评审难度的增加和问题修改的交互会导致 PR 需要很长时间的评审,而长时间的评审会增加 PR 合入主分支的难度,因为大量的代码修改和这段时间内主分支的其他改动大大增加了合入代码冲突的可能性。
所以一般建议不要提交过大的 PR,而是将此类改动拆分为多个较小的 PR 分别进行提交。可以有两种拆分方式:
按照功能拆分:一个 PR 中只包含一个功能的修改。和我一样,很多开发者都对代码有“洁癖”,在开发过程中,我们可能会在实现 PR 的时候顺便对代码进行重构,或者顺带修复一个 bug。这是一个非常好的习惯,可以保证代码库的整洁,有利于代码的可读性以及项目的维护。但是,如果这些重构或者 bug 修复和当前 PR 的功能修改无关,建议将其拆分为另一个 PR。
在 PR 中引入和本 PR 无关的改动会让评审者在进行代码 Review 时感到迷惑:某一段代码改动到底为了实现 PR 中描述的功能,还是为了其他目的?这增加了代码阅读的难度。而保持 PR 的独立性则让评审者更容易将代码的修改和 PR 的目的联系起来,从而更快地 Review 代码。
当然,这条并不是绝对的,如果这些重构或者 bug 修复和当前 PR 的功能修改关联紧密,或者改动非常小(例如只是修改了一个拼写错误),建议还是放在一个 PR 中。
按照模块拆分:有时候,PR 中修复一个问题或者一个功能涉及到多个模块,则可以按照模块提交修复的PR。以 Envoy Gateway 举例,一个新的功能可能涉及到 API,Gateway API translator,xds translator,e2e test, user docs 等部分的修改。因此理论上最多可以拆分为 5 个 PR。
当然 PR 也不是拆分得越细越好,对于较小的改动,拆分得过细反而会让评审时不容易看到修改的全貌。大部分的情况下,拆分为 API 和 实现 两个 PR 就可以了。如果改动很大,则可以按模块拆分得更细一些。我的建议是 API 一定要拆分的,因为在 API 达成一致前去实现该功能很可能走错方向,导致实现代码在评审后被推翻返工,浪费了你的时间。
在开源社区的工作中,百分之九十以上的交流都是通过 github,slack,邮件等间接的沟通方式进行的。在这种情况下,荧幕后的另一方无法像面对面交流那样通过你的面部表情、说话的语气、肢体动作等得知我们的情感,因此我们留下的文字就变得特别的重要。在我们的文字表达中,建议尽量使用礼貌,积极的语气,尊重他人的劳动成果和意见,并感谢他人的帮助以及为此付出的时间。
对于国内的开发者来说,英语的表达有可能会有一些小问题。开源社区是一个国际社区,里面的人来自世界各地,开源社区大部分情况下是以英文作为主要工作语言的。作为非英语母语者,我们对于英语的语气可能不太敏感。一些我们自己觉得没有问题的英语表达可能会稍显生硬,甚至有时候会让人感觉不礼貌。对此,我总结了几个我自己在开源社区中交流的小技巧:
用积极的语气表达自己的意见。用负面/消极的说法会让人感觉被指责,从而感觉不快。改用正面/积极的语气表达自己的意见,可以让你的意见更容易被接受。
例如,可以将这句话:There's a memory leaking problem in the current implemtation.
改为:We can improve memory consumption by adding a cleanup function.
修改之后的句子中,我们没有直接指出问题,而是提出了一个改进的方案,这样可以让人感觉更加积极。
使用情态动词来表示不确定性。在表达自己的意见时,我们很多时候并不能确保自己的意见是绝对正确的。或者,即使我们认为自己的意见是正确的,我们也应该抱着商量的态度和项目中的其他人讨论,尊重他人的意见。
在表达自己的意见时,我们可以使用 might, could, may 等情态动词词,表示自己并不假设自己的意见是绝对正确的。
例如,我们可以将这句话:I don't think this is the best way to resolve the issue.
改为: This might not be the best way to resolve the issue.
在修改之后的句子中,我们使用了 might 这个情态动词,表示自己的意见并不是绝对正确的,语气也不会显得那么生硬。
使用疑问句来代替陈述句,尽量避免命令句。在表达自己的意见时,我们可以使用疑问句,以商量的态度来征求他人的意见,而不是直接命令对方。这样可以让人感觉更加友好。
例如,我们可以将这句话:We also need to expose the foo
field in the API since it's widely used in the client code.
改为:Should we expose the foo
field in the API? It's widely used in the client code.
对比这两个句子,是否可以感到修改前的句子语气相对强硬,让人约感不快? 而在修改后的句子中,我们可以感受到作者的商量的态度,而不是强势的表达自己的意见。
在提出改进意见前,先肯定他人为此付出的工作。这一点非常重要,因为当我们的工作被别人指出问题时, 大部分人都会有一种自我保护的心态,自然会有对此产生一种抵触情绪。如果在提出改进意见前,先肯定他人的工作,可以有效地缓解这种抵触情绪,让对方从心理上更容易就我们提出的问题进行讨论。
例如,我们可以将这句话:I have some suggestion. 改为: I think this is a good idea, just have a few suggestions on ...
将这句话:This is wrong. 改为:This is a good start, but I think we could improve it by ...
在修改之后的句子中,我们先肯定了对方的工作,然后提出了自己的改进意见。这样可以让对方更容易接受我们的意见。
上面只是一些非常简单的例子。其实我也常常遇到对自己的英语表达不确定的时候,这种时候,我一般会使用 ChatGPT 或者 Gemini 对自己的表达进行改进。一个简单的 Prompt “Please rewrite my sentence and make it polite” 就可以了。大家也可以试试。
这些开源社区的礼节并不是“繁文缛节”,而是为了让我们的交流更加顺畅和愉快。我自己的体会是,在开源社区里面,越是厉害的大牛,对于其他人越是礼貌。和他们合作,有一种如沐春风的感觉。
这里有一个很好的示例: https://github.com/kubernetes-sigs/gateway-api/pull/2283 。这是我向 Gateway API 项目提交的一个 PR,PR 本身很简单,只是为一个 API 增加了一个 Envoy Gateway 需要的字段,但是由于 Gateway API 对于这个字段的设计有一些争议,因此 Mantianer 对于这个 PR 进行了很长时间的讨论。在这个讨论中,Mantianer 对于我的 PR 提出了很多意见,但是他们的表达都非常礼貌,整个讨论过程非常愉快。最终,PR 也被合入了主分支。
下面是其中一个 Maintainer 对于我的 PR 的一个评论,可以看到他的表达中采用了上诉提到的一些 PR 礼仪:
Hey @zhaohuabing, thanks for working on this! If I'm understanding correctly, it looks like you're trying to take on a couple of separate issues:
Adding SectionName to PolicyTargetReference (Update TargetREf in Policy GEP #2147)
Adding Name to Route Rules (GEP: Add Name to HTTPRouteRule and HTTPRouteMatch #995)
I think we mostly have consensus on 1, but we're waiting for #2128 to merge before moving forward. On 2, I don't think we quite have enough consensus to move forward yet. Maybe once #2128 merges you can check in with @arkodg to see if he needs any help with the implementation of #2147.
It may also be helpful to take a look at our documentation for the GEP process. All API changes have to go through that process so we can't start directly with a PR to change the API itself without first having an approved GEP in an "implementable" state.
一般情况下,PR 作者和评审者之间会通过 PR 中的评论来进行交流。例如,如果评审者对于 PR 中的某个修改有疑问,或者对 PR 的某个修改有异议,则在 PR 中提出,PR 作者可以选择接受意见进行修改,或者解释自己的修改意图。
通过 PR 评论的这种公开交流方式的好处是可以让 PR 的讨论过程对所有人可见,可以让其他人也了解到 PR 的讨论过程,从而提高项目的透明度。
但是公开讨论其实并不适合所有场景,有时候,私下的点对地交流会更加高效。例如,如果一个问题比较复杂,可能需要多轮的讨论才能澄清问题。这种情况下,如果在 PR 的评论中和评审者就问题进行 “反复拉扯”,讨论很容易变得混乱,而且会让 PR 的讨论气氛变得不那么友好。
这时候我们可以选择私下联系评审者,进行更深入的讨论。我的判断标准是,如果一个问题需要超过 3 个评论才能解决,那么我会选择通过 Slack 私下联系对方,进行更深入的讨论。在就问题的解决方案达成一致后,我们再将讨论的结果总结到 PR 中,以便其他人了解到讨论的结果。
另外,有时候我们的 PR 会被挂起,长时间没有得到评审。这有可能是评审者自身的工作较忙,没有时间对 PR 进行评审,或者是没有注意到 PR。这时候我们也可以选择私下联系评审者,询问 PR 的评审进度。在私下联系时,我们可以礼貌地询问评审者是否有时间对 PR 进行评审,或者询问评审者对于 PR 中的某个修改有什么意见。一般情况下,评审者会很乐意回复你的私信,帮助你解决问题。
希望这篇文章中的这些小小的经验能够帮助到大家。同时欢迎感兴趣的朋友参与 Envoy Gateway 开源项目。对于初次参加项目的开发者,可以考虑先从文档和一些简单的 bug 修复开始,熟悉项目的代码风格和贡献流程。可以搜索 Envoy Gateway Github repo 中 带 “help wanted” tag 的issue,查找自己感兴趣的贡献点。除此之外,现在 Envoy Gateway 的中文官方网站正在建设中,者对于初次参与项目的同学来说是一个很好的入门机会。我们非常欢迎大家参与其中,为 Envoy Gateway 的中文文档贡献力量。
如果有任何问题,可以在项目的 Issue 中提问,我们会尽力为大家解答。对于 PR 提交者,我们也会尽力为 PR 提交者提供帮助,帮助 PR 尽快合入主分支。